高性能計算的金字塔式進化
剛剛更新的HPC TOP500榜單再次點燃了人們的激情。對專業人士來說,這份來自國際超級計算大會的權威成果預示著高性能計算的新風向。即便是普通讀者,這份榜單也絕非無關緊要,計算能力躍升意味著我們能更快地找到石油、更準確地預測天氣和自然災害、更清楚地了解生命的奧秘……
本文引用地址:http://www.j9360.com/article/85514.htm從科研向商用普及
相較以往,此次公布的榜單似乎動靜更大些。這半年來,計算能力再上了一個數量級,考量依據首次引入能效數據、四核快速成為絕對主流,集群、Infiniband等技術主題詞的優勢也進一步擴大,英特爾更是以其IA架構(至強與安騰)占據75%的份額理所當然地拔得頭籌。眾多表象背后,我們試圖聚焦于平臺及生態系統層面,榜單背后還有哪些值得我們去關注?
高性能市場是典型的金字塔結構,最下端的基石部分是龐大的工作組級,系統一般為6~64個節點,中間部分就是所謂的行業大單,一般有256~512個節點,甚至更大。頂部技術最尖端,也最吸引眼球,它一定是大規模并行架構方面的創新者和推動者,但份額極小。
英特爾服務器產品經理顧凡表示,高性能計算市場的熱點集中在兩端,一個是頂端的技術突破,擁有更大的計算能力去滿足尖端領域的性能需求;另一個是底端的應用普及,它的關鍵在于提供商要能把突破性技術以更低的成本向下灌輸。金字塔的中間部分是最為成熟的,標準化的集群架構非常普及且標準化,未來只是應用刀片解決方案之類的提高能效的問題。
從對上榜系統用戶的統計上看,HPC從科研走向商用化的趨勢非常明顯,關注點也由過去的追求性能到解決問題的高生產力。以中國為例,我國內地上榜的12套系統中有6套用于石油行業的勘探作業。另6套高性能計算系統分別為電信、氣象、地理和物流等行業用戶采用。相比全球發展來看,中國目前仍有多個行業尚未開啟其高性能進程,如金融行業,華爾街在其風險模型的預測方面應用高性能計算,在做投資產品組合時快速響應,降低風險,搶占先機;再比如生命科學領域,高性能計算也在高速成長。這些都是中國亟待開墾的高性能計算沃土。
軟硬件的協同力量
此次TOP500上榜系統的總體計算能力獲得了空前提升,本次榜單中排名最后的系統性能在上一次榜單公布中還可以名列第200名。這樣的性能提升與采用多核處理器密不可分。
在系統采用的處理器中,剛發布7個月的英特爾至強5400是最耀眼的明星,它同時也推動了四核成為HPC的絕對主流。至強5400被161臺系統采用,占總數的32.20%,同時,在首次引入的能效考量體系中,也以最高為265Mflop/s/W的表現位居x86架構系統的首位。這樣的表現主要歸功于45nm制造工藝給其絕對性能和能效帶來的提升。顧凡表示,待Nehalem微架構推出,內存帶寬等方面的改善將使基于該架構處理器的系統獲得更大的性能提升,能效也將進一步提高。
有了先進的處理器,性能卻未必一定會提升很高,因為軟件上還存在著巨大的調優空間。英特爾在HPC生態系統中,就從事著這樣的軟件支持工作。其實,軟件與硬件可謂英特爾的左右手,它在軟件方面有大量調試工具,針對高性能計算有專門的軟件包,如編譯器、數學函數庫等工具,這些是幫用戶把高性能計算應用好的核心。英特爾所做的工作就是針對用戶的應用軟件做優化,解決并行瓶頸,以更好地應用線程并行,這樣才能把整個集群的能力激發出來,甚至會提高數倍的整體性能。
記者了解到,英特爾設在美國的高性能計算中心由軟件與解決方案事業部管理,其職責是幫助HPC解決方案供應商、甚至最終用戶做分析與調優,他們最早接觸英特爾的高性能產品,有足夠的技術實力在新一代架構上進行調優。
蓄勢千萬億數量級
IBM基于CELL和皓龍處理器的Roadrunner此次位列榜首,并將計算數量級突破了千萬億次(1 Petaflops)。同樣是沖擊最高端,英特爾的產品規劃與技術準備的情況如何?混合架構是否是沖擊千萬億次計算的必經之路?
英特爾高性能計算方案架構師張曉軍與記者進行了交流。他認為,在最高端領域,英特爾正穩步走在正確軌道上。“英特爾在高性能計算產品線上的布局非常完整,既有服務于集群架構的至強,也有服務于大內存容量需求的安騰,未來高端的還有Many Core(眾核)架構去服務HPC的金字塔尖部分。”他列舉了兩個重要事件佐證觀點,一是4月28日,Cray宣布聯合英特爾共同開發下一代高性能計算機;二是NASA(美國航空航天管理局)與英特爾、SGI宣布將共同為NASA在2009年前開發出峰值性能為千萬億次的計算系統,2012年將這一數字提高到萬萬億次,服務于NASA航空航天的研究包括氣象預測的研究。“這些重量級的合作伙伴為什么會選擇與英特爾長期合作?這表明他們看到并認可英特爾在HPC領域未來長遠的發展藍圖。” 張曉軍表示。
在技術層面,英特爾2006年就開始做單芯片的萬億次研究,它將成為千萬億次計算的基石組件。張曉軍介紹說,英特爾已為此開展了100多個研究項目,去探索在未來的超大規模并行計算中,除了處理器之外,在服務器平臺、內存架構、高帶寬I/O、軟件編程等各個方面遇到的難題,都以研究項目覆蓋解決。“英特爾堅信,高性能計算一定會走向多核化,我們更傾向于未來更輕量的小核實現并行化,這個核的指令集、計算、管道都不用那么復雜,這也會帶來能量節省。”
談及混合架構,張曉軍認為,加速器盡管對性能提升的影響較大,但卻只適用于應用的特定部分,對其他部分意義并不大。而對于大多數用戶的實際應用來說,他們首先要考慮軟件調優帶來的大幅度性能提升,這才具有更為普遍的意義。張曉軍表示,輕量小核才是未來的必經之路。“當然,只靠多核也不能走向千萬億次,還需要有能力做平臺研發和軟件方面的嘗試和突破,這正是英特爾的核心價值所在。”
評論