久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

關 閉

新聞中心

EEPW首頁 > 工控自動化 > 設計應用 > 基于CC―NUMA的多處理器系統研究

基于CC―NUMA的多處理器系統研究

作者: 時間:2009-04-23 來源:網絡 收藏

對于系統,比較流行的有3種模式,對稱多處理(Symmetric Multiprocessing,SMP)模式、非均勻存儲訪問(Non Uniform Memory Access,)模式、大規模并行處理(Massively Parallel Processing,MPP)模式。SMP模式即將2個或2個以上的同樣的處理器連接到一個共享的主存上。在SMP系統中,所有的處理器可以同時訪問同一個物理存儲器,即運行同一個操作系統,因此也被稱為均勻性存儲訪問系統。這種結構比較簡單,但是由于其是共享存儲器,容易在訪存時產生系統瓶頸,可擴展性也比較差。MPP是分布式存儲器模式,可擴展性好,但是需要并行編程和并行編譯,在軟件系統構建上比較復雜,使用不便。架構將若干個單元通過專門的互聯設備聯結在一起組成分布式和共享內存空間。每一個處理器可以訪問自己的存儲器,也可以訪問其他處理器或者共享的存儲器,所有訪存有遠近、時延長短之分,稱為非均勻存儲訪問。在某個處理器訪問空間上比較遠的存儲器時,會有很大的時延,為了緩解這個問題,通過高速緩存一致性使得處理器訪問存儲器的幾率大大降低,在某種程度上提高了系統效率,這種架構稱為CC―即一致性緩存非均勻存儲訪問模式。這種架構繼承了SMP和MPP系統的一些優點,在處理器個數,內存大小、I/O連接能力和帶寬上有很大的伸縮性,又保持了SMP系統單一操作系統、簡單的應用程序編程模式和易于管理的優點。

本文引用地址:http://cqxgywz.com/article/202701.htm

1 CC―NUMA基本架構
CC―NUMA架構的系統最出名的莫過于SGI公司的ORIGIN系列,SGI公司很好的發展和擴展了CC―NUMA技術,其基本架構被廣泛應用。圖1是其ORIGIN2000的基本原理圖,每一個節點擁有2個處理器,2個二級緩存,主存,用于互聯的HUB芯片,1個I/O接口,1個互聯網絡的路由器接口,它的每個節點可以看作是一個SMP,通過互聯網絡可擴展至128個處理器的系統。Origin 2000的所有結點通過CrayLink高性能互聯網絡相互聯接,路由器是構成CrayLink的基本單位,它包含6個端口,內部采用交叉開關實現端口間的全互聯。每個路由器的2個端口用于聯接結點,其余4個端口實現路由器間的互聯,形成互聯網絡拓撲結構。該CrayLink的半分帶寬與結點個數成線性遞增關系,對任意2個結點,至少能提供兩條路徑,保證了結點間的高帶寬、低延遲聯接和互聯網絡的穩定性和容錯能力。

2 兩種比較新的架構
SGI公司的Origin系列系統是一種比較通用的架構,但是還是比較復雜。后來,分別由Corepaq公司的Alpha EV7框架的處理器Alpha 21364和AMD公司的Opteron處理器組成的CC―NUMA架構的多處理器系統簡單很多,這兩種處理器都是針對多處理系統領域推出的,其有著特有的專為多處理器系統應用設計的處理器結構。
2.1 Alpha 21364處理器
2000年,Compaq公司推出了Alpha處理器的第四代產品Alpha21364,這是一款RISC處理器,在當時非常先進,在業內首次在處理器內集成了內存控制器,特別是它還有先進的多處理互聯功能,在建造多處理器系統上很方便。
21364的簡化圖如圖2所示。21364是64位處理器,擁有1.5 MB的L2 CACHE,支持緩存一致性協議。內部集成了2個RDRAM內存控制器,在RDRAM中對于頁命中點對點的延遲是30 ns,加載應用的延遲是75 ns,對應高達12 GB/s的帶寬。最大的不同就是有一個路由器,有4個連接通道可與附近處理器相連,并與本地端口和I/O端口相連,每個連接通道提供6.2 GB/s的帶寬。
21364的處理器問互聯總線提供了CC―NUMA多處理器架構間的無粘合連接,如圖3所示。處理器間的二維拓撲互聯架構滿足了最遠的處理器間的最小系統延遲設計。這種架構可擴展至128個處理器互聯。

2.2 Opteron處理器
AMD公司在2001年推出了其第8代處理器K8架構的Opteron處理器。Opteron處理器基于X86系統架構并對其做了根本性改善,屬于64位處理器,并兼容32位X86處理器架構。Opteron處理器集成了內存控制器,降低了訪存延遲,加大了訪存帶寬。Hyper―Transport(超傳輸)互連控制器也被集成到Opteron處理器內部,在處理器和I/O子系統之間提供了拓展性極強的數據連接帶寬。在Opteron處理器內部的數據通道為雙向16位的通訊,可以達到1 600 MT/s(每秒百萬次傳送)的工作效率,可提供雙向為6.4 GB/s的帶寬。AMD Opteron處理器之間以及處理器同I/O子系統之間如何通過HyperTransport(超傳輸)技術進行互連。處理器之間的互連采用的是一致性協議(CoherentProtocol),相反I/O連接遵循的是非一致性協議(Non―coherent Protoco1)。集成了3個HyperTransport(超傳輸)互連控制器和1個內存控制器的處理器,需要盡可能高效地把指令和數據信息發送到相關接口。為實現這一需求,系統采用了交叉通道架構。


上一頁 1 2 下一頁

評論


相關推薦

技術專區

關閉