基于ARM的嵌入式系統程序開發要點
結合ARM架構本身的一些特點,在這里討論幾個常見的要點。
1.ARM 還是 Thumb?
在討論 ARM 還是 Thumb 之前,先說明 ARM 內核型號和 ARM 結構體系之間的區別和聯系。
如圖-1所示,ARM 的結構體系主要從版本 4 開始,發展到了現在的版本 6,結構體系的變化,對程序員而言最直接的影響就是指令集的變化。結構體系的演變意味著指令集的不斷擴展,值得慶幸的是 ARM 結構體系的發展一直保持了向上兼容,不會造成老版本程序在新結構體系上的不兼容。

圖-1 ARM 結構體系和處理器家族的演變發展
在圖中的橫坐標上,顯示了每一個體系結構上都含有眾多的處理器型號,這是在同一體系結構下根據硬件配置和存儲器系統的不同而作的進一步細分。 需要注意的是通常我們用來區分 ARM 處理器家族的 ARM7、ARM9 或 ARM10,可能跨越不同的體系結構。
在ARM的體系結構版本4與5中, 還可以再細分出幾個小的擴展版本: V4T、V5TE和V5TEJ,其區別如圖-2中所示,這些后綴名也反映在各自擁有的處理器型號上面,可以進行直觀的分辨。V6 結構體系因為包含了以前版本的所有特性,所以不需要再進行分類。

圖-2 結構體系特征
上面介紹了整個 ARM 處理器家族的分布,主要是說明在一個特定的平臺上編寫程序的時候,一定要先弄清楚目標的特性和一些細微的差別,特別是需要具體優化特征的時候。
從 ARM 體系結構 V4T 以后,最大的變化是增加了一套 16 位的指令集——Thumb。到底在一個具體應用中要否采用 Thumb呢?首先我們來分析一下 ARM和 Thumb 各自的特點和優勢。先看下面一張性能分析圖:

圖-3 ARM 和 Thumb指令集的比較
圖中的縱坐標是測試向量 Dhrystone 在 20MHz 頻率下運行 1 秒鐘的結果, 其值越大表明性能越好;橫坐標是系統存儲器系統的數據總線寬度。結果表明:
(a) 當系統具有32 位的數據總線寬度時,ARM 比 Thumb有更好的性能表現。
(b) 當系統的數據總線寬度小于32 位時,Thumb比 ARM 的性能更好。
由此可見, 并不是32位的ARM指令集性能一定強于16位的Thumb指令集,要具體情況具體分析??疾靷€中的原因,其實不難發現,因為當在一個 16 位存儲器系統里面取1 條 32位指令的時候,需要耗費2 個存儲器訪問周期;比之 32位的系統,其速度正好大概下降一半左右。而 16 位指令在 32 位存儲器系統或16 位存儲器系統里的表現基本相同。正是存儲器造成的系統瓶頸導致了這個有趣的差別。
除了在窄帶寬系統里面的性能優勢外, Thumb 指令的另外一個好處是代碼尺寸。同樣一段 C 代碼,用 Thumb 指令編譯的結果,其長度大約只占 ARM 編譯結果的 65%左右,可以明顯地節省存儲器空間。在大多數情況下,緊湊的代碼和窄帶寬的存儲器系統,還會帶來功耗上的優勢。
當然,如果在 32 位的系統上面,并且對系統性能要求很高的情況下,ARM是一個更好的選擇。畢竟在這種情況下,只有 32 位的指令集才能完全發揮 32位處理器的優勢來。
因此,選擇 ARM 還是 Thumb,需要從存儲器開銷和性能要求兩方面加以權衡考慮。


評論