久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 嵌入式系統 > 設計應用 > ARM體系結構研究

ARM體系結構研究

作者: 時間:2016-11-28 來源:網絡 收藏
2.1構對多媒體信號處理的支持——NEON

本文引用地址:http://cqxgywz.com/article/201611/322741.htm

隨著電子消費品市場上,屏幕、觸屏越來越大,像素、幀數、分辨率越來越高,各種無線通信擴展雨后春筍般此起彼伏,處理器的處理能力越來越受到這些多媒體應用的考驗。在這樣的背景下,ARM芯片推出了自己的解決方案——NEON。

NEON技術是ARM公司2004年發布的媒體和信號處理技術,可以加速多種類型的多媒體應用,適用于手機和消費娛樂電子,可靈活地實現多種視頻編/解碼、三維圖像、語音處理、音頻解碼、圖像處理和基帶功能。該技術已經應用在了Cortex-A系列的ARM處理器中,同時獲得了ARM和第三方工具提供商的廣泛支持,適用于高端多媒體設備。

NEON技術使用64/128位單指令多數據流(SIMD)指令集,能同時執行高達16個操作,用于新一代媒體和信號處理應用加速,其編程接口簡單,性能十分優異,功耗非常小。在NEON技術下執行MP3音頻解碼器,CPU頻率可低于10MHZ;運行GSM AMR語音數字編解碼器,CPU頻率僅為13MHZ,和其它專業的DSP處理器相比較,NEON能獲得更低的功耗和更簡單的編程接口。NEON支持8位、16位、32位、64位整數及單精度浮點SIMD操作,以進行音頻/視頻、圖像和游戲處理,滿足現代電子消費品的需求。

NEON實際上是ARM的SIMD(Single Instruction Multiple Data)技術的延續,其實就是ARM處理器中的向量處理功能。而且它同其它處理單元共享CPU的資源,如:整數操作、循環控制、Caching等,顯著減小了處理器的面積和功耗,同時又簡化了編程環境,不用控制一些特定硬件加速器的并發訪問和數據規整性維護。這是NEON體系結構同硬件加速器相比最顯著的優點。

NEON的指令集對于編譯器來說是十分友好的。它包括了高效的Promotion/Demotion操作和結構(Structure)的加載與寫入而不用強行的向量對齊(Vector Alignment)。

在NEON擴展里,數據被組織在非常長的寄存器中,而這些寄存器可以以8、16、32、64位來提供和貯存數據,而具體用多少位來處理他們是通過在指令中顯示指定的。這與x86體系結構中的AX,AL,AH的關系類似。



圖2.4 NEON中的向量寄存器邏輯示意圖

上圖中的三個寄存器向量其實都是同一個128為的寄存器,程序開發人員可以將它當做4個32位的寄存器向量來使用,也可以當做8個16位向量或者16個8位向量來使用。下面具一個具體的例子加以說明。指令VADD.I16 D0,D1,D2


圖2.5 NEON中16位向量相加示意圖

上圖中為將D1向量加上D2向量之后將值存入D0向量的邏輯示意圖,在指令中VADD.I16表示該操作的每一個操作元為16位。

在編程中我們經常會遇到數據位數的轉換,有時你需要將一個long型的數據降級為int,有時你有需要將int型提升為long型。而在NEON體系中提供了對數據轉換的指令集支持。下面舉個例子說明。指令:VSHR.I16.I32 D0,Q1,#5


圖2.6 NEON中demotion示意圖

這個例子將一個4個32位元素的128位寄存器每個元素右移5位之后截取16位存至64位的D0中。指令中的I16.I32指定了這種數據降級(demotion)。

同時NEON還支持一種緩存友好的structure load/store功能,該功能能夠一次加載一個結構數組,從而可以更好的利用緩存,同時也可以使代碼的結構邏輯清晰。還是舉個例子來說明。指令VLD3.16 {D0,D1,D2},{R0}


圖2.6 NEON中對于結構體的指令集支持

圖中將內存中的一個結構數組分別裝入三個寄存器向量中,向量與向量見的同一個索引位構成了一個完成的結構(圖中表示的是屏幕的三像素)。

2.2構與Atom的比較

Atom處理器,是Intel從2008年才推出的一款面向上網本、入門級PC(Entry Level PC)、Tablet PC、智能手機以及其他一些手持設備的處理器,由此可見,Intel的Atom架構瞄準的市場是已經被ARM稱霸已久的移動計算領域,兩方的戰爭可見一斑。而至今為止經歷了四次重大的革新。

1)2008年3月——初次亮相,主要面向移動internet設備(Mobile Internet Devices),提供低功耗的電源方案。

2)2009年9月——Intel宣布了基于45nm技術的Intel Atom Processor CE4100,向一組為Interactive TV而設計的消費性電子產品多媒體處理器提供了了最新的System on Chip【1】芯片。、

3)2010年1月——Intel發布了它最新的額Intel Atom Processor,專門為上網本而設計,芯片上集成了一個內存控制器,一個圖形處理器,在減小了系統,降低了功耗的基礎上同時提高了性能。


上一頁 1 2 下一頁

關鍵詞: ARM體系結

評論


技術專區

關閉