收購Nervana后 Intel在AI芯片上進展如何？

作者：時間：2016-12-08 來源：數盟社區

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

　　8月9日，Intel對Nervana的收購以4.08億美元告終。作為對比，英特爾財報顯示，其今年第三季度的凈利潤為34億美元。以如此之高的價格收購一個僅有48人的團隊，Intel有自己的考量。

本文引用地址：http://www.j9360.com/article/201612/341370.htm

　　當年為了追逐IoT的步伐，Intel錯失了移動芯片市場，現如今其競爭對手NVIDIA已造出Tesla P100，Intel在AI芯片領域還遲遲沒有動靜。此次收購Nervana可謂是Intel彎道超車的明智之舉，將Nervana的軟件架構部署至Intel的硬件上，此次合作對Nervana和Intel來說無疑是雙贏的。

　　收購當日，Nervana聯合創始人Naveen Rao便表示：“融資對我們來說相對比較容易，但是被英特爾收購，就意味著我們能夠接觸到曾經對于我們來說觸不可及的技術。” 此處的“技術”所指，是硬件層面。

　　Nervana的業務著眼于基于云的深度學習服務，其主要深度學習框架Neon在主流的深度學習網絡例如AlexNet、VGG、GoogLeNet上均性能優異;具備強大的易用性及可擴展性，支持CNN、RNN、LSTM、GRU、BatchNorm等模型。Neon在卷積計算時采用了Winograd算法，在數據載入層面也做了很多優化。Nervana表示，Neon的計算速率是Caffe的兩倍。

　　GPU近年來被用作深度學習處理器，實為無奈之舉。如今，有了Intel的加持，Nervana正計劃推出其針對深度學習算法的定制芯片Nervana Engine。目前的神經網絡訓練處在依賴海量數據的階段，我們希望用更多的數據為系統帶來更高的準確性，這使得訓練效率至關重要。單純地通過增加處理器的數量來擴展其性能或許可以解一時之需，但當處理器數量達到一定程度，I/O能力又成為瓶頸。

　　對此，英特爾中國研究院院長宋繼強表示：“Nervana技術可以更高效地定義內存的訪問帶寬和計算密度，讓它很好地匹配當前數據量增大的需求。同時可以讓多個節點并行去支持這種大模型的訓練，所以我們可以看到近乎一種線性的性能的擴展。”

　　相比GPU，Nervana Engine在訓練方面可以提升10倍性能。與Tesla P100類似，該芯片也利用16-bit半精度浮點計算單元和大容量高帶寬內存(HBM，計劃為32GB，是競品P100的兩倍)，摒棄了大量深度學習不需要的通用計算單元。

　　在硬件基礎上，Nervana于今年11月份推出了Intel Nervana Graph平臺。該框架由三部分組成：用于創建計算圖的API、用于處理常見深度學習工作流的前端API(目前支持TensorFlow和Neon)、以及用于在 CPU/GPU/Nervana Engine上編譯執行計算圖的轉換器API。

　　AI發展的良性閉環

　　Intel方面，在收購Nervana后，Intel正式提出AI發展的良性閉環概念。Intel提供從嵌入式端到云端、從底層到應用層的完整實現方案。

　　首先，在硬件層面，Intel處理器能為各種AI硬件提供支持。對于前端設備，Intel推出Movidius硬件平臺，以滿足前端設備功耗、預算、尺寸等限制。同時，在面向硬件優化的過程中，Intel提出相應的庫。具體包括：針對數學運算的庫、針對數據分析的庫、針對通訊加速的庫、以及針對Python語言的庫等等。在框架層面，Intel支持所有的開源框架，這意味著開發者不需要改變使用習慣，就能使用Intel的各項架構支持。更上層的，Intel提供深度學習SDK、Nervana等平臺。

　　在軟件層面，宋繼強表示：“目前的深度神經網絡還有很多技術點有待突破，神經網只是實現人工智能的一個工具，但未必是最后的工具。”對于AI算法，Intel目前正致力于如何使系統實現更少的數據及人力依賴;如何讓模型更稀疏;如何壓縮模型使之更易存儲;如何對模型剪裁使其運算量最少;如何使計算精度下降，甚至降至一位。

　　對于Intel的主營業務，處理器制造來說，用戶有了更多元化的選擇。