a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 嵌入式系統 > 業界動態 > 國內最快HPC背后懸疑獲解

國內最快HPC背后懸疑獲解

作者: 時間:2008-08-11 來源:賽迪網-中國計算機報 收藏


5000A多網合一體系結構圖

本文引用地址:http://www.j9360.com/article/86761.htm

  繼4000A成功“服役”之后,新一代機型再次落戶上海超算中心。這一代相比前代機型的性能提高了一個數量級,其系統峰值運算速度達到230TFLOPS,是目前國內速度最快的商用系統。它的技術創新如何體現,曙光又如何看待未來的技術發展,日前,曙光副總裁聶華與記者交流了曙光背后的故事。

  曙光怎樣設計5000A

  曙光的技術參數已在發布時曝光,可具體技術細節卻鮮有透露。聶華介紹說,曙光5000A的結構非常簡練,是用互聯網絡將很多計算單元耦合在一起的,為了增加耦合效率,設計廠商曾構建了管理網絡、存儲網絡、以太網絡等各種網絡。這一次,曙光5000A極大簡化了整體網絡結構,實現了多網合一。其體系結構也不同于傳統集群或架構巨量平行處理架構(MPP),曙光提出超并行體系處理架構(HPP),除結合集群結構易擴展、易編程的優勢外,還在高密度、高性能和耦合方面有了突出進展。

  硬件架構之上是軟件結構,軟件才是用戶運用的窗口。從基礎部件層、系統軟件層等底層開始,曙光5000A搭建了一個9層的軟件架構,從域服務、資源調度、安全等層次進行有機組合。在應用層,曙光5000A擁有豐富的科學計算、商業計算以及信息化應用軟件,為用戶提供了實用基礎。

  除了架構創新之外,曙光5000A的另一項引人關注的技術創新是高密度刀片服務器,這是曙光5000A最核心的計算單元。該刀片總體架構為7U架構,里面有10片計算刀片。值得強調的是,每片刀片集成了4路SMP的4核處理器,這就構成了7U空間共計160核的超高密度設計,為常見1U服務器密度2.86倍。在刀片當中,它還整合了網絡模塊、管理模塊、IOE擴展模塊和冗余電源模塊,尤其是內置DDR Infiniband HCA和交換模塊,這是曙光創新的設計。這樣,相鄰結點MPI延遲為1.6us左右,而普通DDR交換機為3us以上,這一延遲直接影響著提升并行效率。同時,在內置之后,系統減少了50%的高速IB線纜的數量,大量IB連線對現階段構建大規模集成網構成了威脅,銅纜容易形成不穩定連接。因此,盡可能減少高速IB連線的數量,對于提高IB穩定性來說意義很大。進一步設想,整個系統還提供10個PCI-E 8X IO擴展插槽,雖然這些插槽目前處于閑置狀態,但如果都插上加速卡,就可以針對特別應用構建專用系統,這將帶來廣闊的應用擴展空間。

  胖節點則為計算子系統解決更具挑戰性的問題提供了保障。曙光配置了大約1/10規模的胖節點,與4路SMP結構運算節點配合。在4路計算刀片中,每個核可以進行64GB直接內存尋址,這意味著具有挑戰性的一些工程計算程序可以更好地運行,胖節點則使每個核訪問128GB內存成為可能。胖節點采用了改進的8路SMP處理結構,8個處理器之間實現交叉互聯,實現了每個刀片32個核的SMP擴展。曙光不只實現了設計峰值的高性能,也非常注重這款機型的高可用性。“針對集群系統曾流行一個觀點,當發展到1萬個處理器核心時,系統的不可靠程度將增加,但曙光可以負責任地講,曙光5000A可以穩定工作。”聶華說。

  曙光為何鐘情AMD

  在今年公布的 TOP500榜單當中,基于英特爾處理器的系統占了絕大部分的市場份額。為什么在英特爾有著明顯優勢的市場,曙光在開發新機型時卻選擇了聯手AMD?盡管曙光5000A采用的是AMD的巴塞羅那4核處理器,但聶華毫不否認,英特爾的處理器非常出色。“英特爾4核處理器的主頻就要比巴塞羅那表現得要好,這在TOP500的峰值測試中是非常占有優勢的。”聶華說,“但最終讓曙光決定采用巴塞羅那的原因是由產品本身的設計決定的。”

  聶華說,曙光5000A當時的定位就是高效能計算機,而并非單純的高性能計算機。盡管當前的2路計算刀片已經非常成熟,但曙光還是決定研發高密度的4路計算刀片,這在保證提高生產力的同時,也能降低了系統規模,提高系統穩定性。對于這項設計來說,曙光認為AMD提供的巴塞羅那架構是理想選擇。集成內存控制器的“直連架構”為目前AMD所獨有,處理器直接訪問內存能夠降低延遲,而且能擴大內存帶寬。在高性能計算領域,從CPU核心到內存之間的數據交換往往受制于帶寬限制,這一現象導致的“內存墻”限制了系統整體性能的提升。“當然也有市場因素。但技術層面原因是最關鍵的。”聶華說,“英特爾的下一代架構也將采用直連技術,到那時就沒有任何差別了,這也是未來趨勢。”

  曙光如何看混合架構

  在IBM突破千萬億次計算的“走鵑”發布后,混合架構成為業界爭論的焦點。究竟哪些系統適合采用混合架構,它與軟件調優哪個才是HPC的發展趨勢?聶華表示,混合架構與軟件調優是相互關聯,但又完全不同的兩個方向,硬件加速針對特別應用,軟件調優則使用相應工具,整體可以獲得更好的并行性能,它們都可能為系統性能帶來幾倍甚至幾十倍的提升。

  從曙光5000A本身的情況來看,系統中完全預留了協處理器的插槽位置,完全可以使用龍芯、FPGA甚至商用化硬件作為加速器。但這次曙光5000A并沒有采用加速器,這是與其用戶的應用環境密切相關的。上海超算中心的特點是超大規模的通用計算平臺,面向的用戶眾多,只要是高性能計算的,都可以在這個平臺上進行。而國外的高性能計算機則多是單個用戶專注于某項特定應用,如IBM的“走鵑”就是為美國洛斯阿拉莫斯國家實驗室特別定制的。在這種情況下,對于上海超算中心來說,根本不能全部插上加速卡,只能面向部分特定用戶構建少量加速結點。聶華表示,正因為上海超算中心是通用計算平臺,所以曙光5000A要選用通用CPU和通用架構,這樣對用戶來說才實現了價值最大化。

  如果某個用戶對計算能力的要求足夠高,或者可以面向具有同樣特定應用的一類用戶群提供服務,專用的加速器技術也將會在曙光5000A或后續機型上推廣應用。
 



評論


相關推薦

技術專區

關閉