微處理器 多核已成為主流
不管是通用微處理器還是專用微處理器乃至異構微處理器,都已經進入多核時代,通過多核技術提高處理能力,同時降低電能消耗已成為微處理器的必然選擇。
本文引用地址:http://www.j9360.com/article/93249.htm隨著半導體細微化進程,提高芯片性能和減少電能消耗成為一對矛盾。之前的單核處理器主要通過提高指令的并行運算速度來提高器件性能,具體方法包括使用超標量、超級流水線和亂序執行等技術同時進行處理以及通過超長指令字的指令集結構來提高并行運算性能。這些復雜的計算處理耗用大量晶體管資源,使得微處理器在電能的消耗上一直無法降低,而多核結構的設計思路是通過減少并行處理,適當地降低每個核的工作強度來降低整個處理器的耗電。
一年來,多個廠商已經或計劃推出一批多核處理器。在通用多核處理器上,有IBM的PowerXCell8i、Sun公司的Rock處理器、富士通的SPARC64VII、英特爾i7、Tukwila和AMD的Shanghai四核處理器和我國的龍芯-3等。它們有4至9個核。此外,在專用多核處理器上,有美國思科公司推出的40核的數據包處理器。美國NVIDI公司市售的240個核的GTX200線程處理器,處理能力到達同時執行300個線程。英特爾公司去年4月公布了多核圖像處理器Larrabee。還有美國Tilera公司的擁有64個內核的嵌入式微處理器等。以上專用式多核處理器都有幾十個核到上百個核。
消費市場,情形類似,目前市場上銷售的個人電腦或服務器其處理器大多集成有2個內核,4核架構的也已經上市。近來,多核微處理器已開始進入通信和家用電器領域,可以說,多核微處理器將成為今后的潮流。
通用多核處理器:眾廠商各展其長
IBM的PowerXCell8i處理器是新一代的Cell多核處理器。值得一提的是,目前世界上運算速度最快的超級計算機Roadrunner就采用了這款處理器。
PowerXCell8i采用了CellBroadbandEngine(Cell寬帶引擎)結構,包括1個Power處理器PPE和8個優化的增強雙精度(eDP)SIMD引擎,即協處理器SPE,PPE核旨在運行操作系統和協同計算,8個SPE核及其SIMD執行單元可提高固定點算法的性能。每個IBMPowerXCell8i處理器的二級緩存為512KB,每個eDPSPE的本地存儲器容量為256KB。IBM的PowerXCell8i多核處理器的雙精度性能是上一代Cell寬帶引擎處理器的5倍。它的多核架構和超高速通信功能大幅度地提高了實時響應速度。結合先進的多處理技術,該處理器特別適合于高性能工作負載。PowerXCell8i處理器采用了非對稱多核結構,非常適合于并行處理和流處理應用程序。與無法高效處理流處理應用程序的基于緩存的對稱多核結構不同,PowerXCell8i處理器是專為提供較高的性能和快速響應而設計的。
由于PowerXCell8i提供了一種經濟型的超級計算能力,因此可用于高性能服務器和大型計算機之中。當前世界上運算速度最快的計算機的運算速度是每秒可進行1105萬億(petaflop)次的浮點運算,其異構集群結構中就大量采用了這款處理器。
Sun公司16核的Rock處理器擁有尖兵線程(ScoutThread)和事務型內存。前者是用于收集數據而先執行的線程。Rock處理器采用的是一種指令型的并行處理,是由軟件來實現的。它可節約收集數據的時間。處理器在進行計算時會遇到一些遲延時問較長的運算,例如緩存的Misshit(沒有命中,脫靶)和除法運算。這時尖兵線程就可以先進行數據收集等處理過程。當完成了這些延時較長的計算時,尖兵線程就可將結果反映給寄存器,隨后繼續進行下一個處理。事務型內存將一連串的存取操作作為“事務”進行管理,避免了資源競爭并且易于進行并行處理。其設計理念是采用了鎖相控制模式,阻止軟件的多線程同時訪問共享數據區(即一個線程正在使用某數據時,其他線程不得更改該數據),從而使一個單線程將僅找到唯一的數據堆棧,保障了多線程處理的一致性,因而利于進行高速連續處理。由于上述原因,這款Sun處理器加強了亂序執行能力,提高了單線程的功能。
評論