數據中心加速器芯片年增50%,Achoronix聯手BittWare推出FPGA加速卡
數據中心加速器的芯片市場預測
本文引用地址:http://www.j9360.com/article/201911/406845.htm數據中心市場的加速芯片主要包括CPU、GPU、FPGA和ASIC等。據Semico Research于2019年5月的預測,從2018年到2023年的5年間,數據中心加速器市場預計將從28.4億美元增長211.9億美元,年均增長率為49.47%。其中,FPGA預計將是年均增長率最高的細分市場(如下圖),該增長將由企業級工作負載加速應用驅動。
數據加速可以分成計算、網絡和存儲三大類。有一部分是GPU可以做的,但是另外很大一部分更適合于用FPGA來做加速。
業界普遍認為的性能對比顯示,相比于傳統CPU,FPGA提升的性能是10~100倍,倍數變化主要來自不同的應用。不僅如此,在提高性能的同時,FPGA的功耗也會大幅降低。
從市場上來看,這幾年FPGA加速卡的應用越來越多。從下圖右可以看出,FPGA加速卡和服務器是新的技術,目前正處于上升期。
業界的Tier 1客戶,諸如亞馬遜和微軟的數據中心在二三年前就已經把FPGA加速方案用到他們的數據中心。只不過因為他們是Tier 1,工程師資源和軟件都有雄厚的實力,所以可以把芯片直接做進服務器主板里,即嵌入到他們的硬件系統中。但是對于很多Tier 2和Tier 3的OEM(生產商),或一些小型的數據中心及純做軟件的客戶,并不具備這樣的工程資源,所以可以通過采購基于標準的PCIe接口的FPGA加速卡,快速地部署到自己的業務和應用中。
數據中心部署FPGA加速方案有很多好處。①效率方面,FPGA相對于GPU和CPU有更高的能效比。②FPGA可以根據客戶的特殊需求重新配置。③FPGA加速卡可以快速部署,使客戶的實驗室應用快速地推向市場,而無需把更多的精力和資源放在底層的開發上。④對于hyperscaler(超大規模廠商),也可以做大規模的部署。
采用Speedster7t獨立FPGA芯片的VectorPath加速卡
2019年10月,基于FPGA的數據加速器件和高性能嵌入式FPGA(eFPGA)半導體知識產權(IP)的領導性企業Achronix半導體公司,與Molex旗下的一家領先企業級FPGA加速器產品供應商BittWare聯合宣布:推出面向高性能計算和數據加速應用的FPGA加速卡。
新推出的VectorPath S7t-VG6加速卡搭載了Achronix采用7nm工藝打造的Speedster7tAC7t1500獨立FPGA芯片,它在同類PCIe FPGA加速卡中,提供了目前業界最高性能的接口。這些高性能接口包括1x400GbE和2x100GbE接口,以及總帶寬為4Tbps的8組GDDR6的板上存儲器,使該加速卡成為高帶寬數據加速應用的理想選擇。
為此,Achronix市場營銷副總裁Steve Mensor和Molex副總裁Sam Bichara向電子產品世界記者介紹了其特色。
圖 從左至右:Achronix市場營銷副總裁Steve Mensor,Molex副總裁Sam Bichara
VectorPath加速卡是基于Achronix新一代的7t的高性能,針對高帶寬優化的一個FPGA。優勢有兩點:①二維的高速片上網絡,②針對人工智能、機器學習優化的MLR單元(如下圖)。
因此,數據中心開發人員可以不用關注硬件,只要采用現成可用的硬件,加上自己的軟件、算法就可實現應用,這樣就可以大大加速部署和開發。
Achronix的合作伙伴BittWare非常有實力:有約30年的FPGA加速卡的設計和生產制造經驗,于2018年被Molex收購,成為更大規模公司——Molex的子公司,可以充分利用Molex更廣闊的技術支持和銷售團隊服務客戶。
VetcorPath加速卡所具有的功能
VectorPath加速卡系專為高性能和高帶寬數據應用而設計,具有以下硬件功能:400GbE QSFP-DD和100GbE QSFP56接口;8組GDDR6存儲器可提供4 Tbps的總帶寬;1組帶有錯誤檢查和糾正(ECC)功能的、運行頻率為2666MHz的DDR4存儲器;Speedster7t FPGA芯片集成了帶寬為20 Tbps的二維片上網絡(NoC);692K的6輸入查找表(LUT);40K Int8 MAC提供高于80 TOps的算力;OCuLink – 用于連接擴展卡的4通道PCIe Gen 4連接器。
VectorPath加速卡包括一整套Achronix的ACE開發工具,以及BittWare的基板管理控制器和開發工具包,其中包括API、PCIe驅動程序、診斷自測和應用示例設計,以提供快速的、開箱即用的體驗。
TeraBox FPGA服務器
TeraBox是基于FPGA的服務器(如下圖)。在過去BittWare注意到,客戶在買獨立的FPGA芯片,或者是基于FPGA板卡的加速卡時,獨立的板卡放在服務器中進行設計,但是對于很多Tier 2、Tier 3甚至更小的客戶,沒有時間、精力以及工程資源去把FPGA卡給集成到服務器中,因此有一部分客戶需要更高的集成,這樣客戶只需簡單的配置就可以應用起來。
TeraBox主要有兩大類客戶,一類是有特殊需求的客戶,他需要把上層軟件快速部署到業務中,或客戶需要快速地去展示他們的軟件。另一類是對于一些IT經理,他的技術水準不是那么深,因此無需關注底層,還可以降低風險,同時可以簡單部署,縮短整個業務的上線時間。
采購TeraBox的另一優勢是:傳統的FPGA加速卡,一般只提供一年的質保和技術服務,但是服務器一般是3年。
與競品的差異化
除了Achronix之外,另外兩大FPGA廠商此前已推出了加速卡;2019年下半年,兩大FPGA廠商忙于發布各自的“統一軟件開發平臺”,Achronix有類似的軟件平臺產品嗎?
實際上,競品的芯片不僅有FPGA、處理器(Arm SoC),還有另外的處理器(例如AI引擎)等。例如AI引擎,X公司的AI引擎底層是Synopsys公司的矢量處理器,但是這種矢量處理器跟Arm CPU是不同架構的處理器,再加上外部的高速接口,客戶要面對3種不同的硬件底層。
“統一軟件平臺”從表面上看是用同一個軟件的思維去開發,但是作為開發者,處理數據時要考慮哪部分放在FPGA里,哪部分放在CPU里,哪部分放在AI引擎/矢量處理器;另外要考慮互相之間的數據怎樣去流動,而不是只是簡單的有一個工具讓你去用。因此,怎樣讓設計者很好地利用你的架構,對于軟件工程師是非常有挑戰的。
對于Achronix而言,走的是另外一個方向:對傳統的FPGA做了很多優化,諸如二維的高速網絡;另外,為了提高算力,雖然名字叫機器學習處理器(MLP),但它不是處理器,它實際上最底層是一種乘累加陣列(MAC,如下圖),是硬件。所以所有底層的思維還是硬件的思維。
圖 MLP架構:專為計算密集的人工智能/機器學習(AI/ML)應用而優化的Speedster7t
當然Achronix也有開發工具,但是整個底層架構是硬件架構,沒有不同類型的單元。Achronix的開發思路是讓原有的FPGA工程師很容易地去用Achronix的平臺,而且Achronix的平臺性能有大幅的提升,甚至軟件工程師通過Achronix的工具也可以很容易去用這個硬件平臺。
總之,Achronix的思路是延續傳統模式,在傳統模式上做進一步的優化。即硬件軟件化——有很容易用起來的硬件,好像用軟件一樣。例如Speedster7t的二維片上網絡(如下圖),讓整個的硬件的設計,更像軟件的思維去做。
另外,關于競品的加速卡,例如I公司,采用的存儲是HBM2,而Achronix采用的是GDDR6,特點是速度快,同時價格便宜(相對于目前業界通用的HBM2,價格會便宜很多),而且HBM2實現起來也比較復雜,需要封裝到FPGA上,制造也比較困難。
上市時間和售價
VectorPath現在就可以接受訂單,預計在2020年第2季度發貨到客戶。在客戶拿到這個加速卡之前,客戶現在就可以開始做開發。加速卡的價格是7500美元。
總結
對于數據中心、邊緣計算等需要計算加速的領域,整個硬件加速市場正在快速增長,CPU已經趕不上性能的需求,FPGA是一種高效選擇。
除了極少數超大數據中心有能力和用量可支撐自己建立FPGA團隊,包括硬件團隊去開發加速卡以外,絕大部分的Tier 2或Tier 3需要去外部采購加速卡,包括相應的底層軟件。因此,FPGA廠商紛紛祭出FPGA加速卡。Achronix和BittWare聯手推出了采用Speedster7t獨立FPGA芯片的VectorPath加速卡,可以快速部署,簡單易用。相比競品,VectorPath還具有超高性能的特點。
評論