收購Nervana后 Intel在AI芯片上進展如何?
8月9日,Intel對Nervana的收購以4.08億美元告終。作為對比,英特爾財報顯示,其今年第三季度的凈利潤為34億美元。以如此之高的價格收購一個僅有48人的團隊,Intel有自己的考量。
本文引用地址:http://www.j9360.com/article/201612/341370.htm當年為了追逐IoT的步伐,Intel錯失了移動芯片市場,現如今其競爭對手NVIDIA已造出Tesla P100,Intel在AI芯片領域還遲遲沒有動靜。此次收購Nervana可謂是Intel彎道超車的明智之舉,將Nervana的軟件架構部署至Intel的硬件上,此次合作對Nervana和Intel來說無疑是雙贏的。
收購當日,Nervana聯合創始人Naveen Rao便表示:“融資對我們來說相對比較容易,但是被英特爾收購,就意味著我們能夠接觸到曾經對于我們來說觸不可及的技術。” 此處的“技術”所指,是硬件層面。
Nervana的業務著眼于基于云的深度學習服務,其主要深度學習框架Neon在主流的深度學習網絡例如AlexNet、VGG、GoogLeNet上均性能優異;具備強大的易用性及可擴展性,支持CNN、RNN、LSTM、GRU、BatchNorm等模型。Neon在卷積計算時采用了Winograd算法,在數據載入層面也做了很多優化。Nervana表示,Neon的計算速率是Caffe的兩倍。

GPU近年來被用作深度學習處理器,實為無奈之舉。如今,有了Intel的加持,Nervana正計劃推出其針對深度學習算法的定制芯片Nervana Engine。目前的神經網絡訓練處在依賴海量數據的階段,我們希望用更多的數據為系統帶來更高的準確性,這使得訓練效率至關重要。單純地通過增加處理器的數量來擴展其性能或許可以解一時之需,但當處理器數量達到一定程度,I/O能力又成為瓶頸。
對此,英特爾中國研究院院長宋繼強表示:“Nervana技術可以更高效地定義內存的訪問帶寬和計算密度,讓它很好地匹配當前數據量增大的需求。同時可以讓多個節點并行去支持這種大模型的訓練,所以我們可以看到近乎一種線性的性能的擴展。”
相比GPU,Nervana Engine在訓練方面可以提升10倍性能。與Tesla P100類似,該芯片也利用16-bit半精度浮點計算單元和大容量高帶寬內存(HBM,計劃為32GB,是競品P100的兩倍),摒棄了大量深度學習不需要的通用計算單元。

在硬件基礎上,Nervana于今年11月份推出了Intel Nervana Graph平臺。該框架由三部分組成:用于創建計算圖的API、用于處理常見深度學習工作流的前端API(目前支持TensorFlow和Neon)、以及用于在 CPU/GPU/Nervana Engine上編譯執行計算圖的轉換器API。
AI發展的良性閉環
Intel方面,在收購Nervana后,Intel正式提出AI發展的良性閉環概念。Intel提供從嵌入式端到云端、從底層到應用層的完整實現方案。

首先,在硬件層面,Intel處理器能為各種AI硬件提供支持。對于前端設備,Intel推出Movidius硬件平臺,以滿足前端設備功耗、預算、尺寸等限制。同時,在面向硬件優化的過程中,Intel提出相應的庫。具體包括:針對數學運算的庫、針對數據分析的庫、針對通訊加速的庫、以及針對Python語言的庫等等。在框架層面,Intel支持所有的開源框架,這意味著開發者不需要改變使用習慣,就能使用Intel的各項架構支持。更上層的,Intel提供深度學習SDK、Nervana等平臺。
在軟件層面,宋繼強表示:“目前的深度神經網絡還有很多技術點有待突破,神經網只是實現人工智能的一個工具,但未必是最后的工具。”對于AI算法,Intel目前正致力于如何使系統實現更少的數據及人力依賴;如何讓模型更稀疏;如何壓縮模型使之更易存儲;如何對模型剪裁使其運算量最少;如何使計算精度下降,甚至降至一位。
對于Intel的主營業務,處理器制造來說,用戶有了更多元化的選擇。
評論