異構計算帶來AI視覺新突破
作者 王瑩 王金旺 《電子產品世界》編輯
本文引用地址:http://www.j9360.com/article/201706/361120.htm摘要:近年來,隨著圖像處理及識別等關鍵研究領域的突破,使人工智能在視覺應用上獲得了前所未有的進步,成為AI大規模應用推廣的第一個場景。為此,筆者采訪了華夏芯(北京)通用處理器技術有限公司首席執行官李科奕先生,并就相關內容進行了解答。
視覺成為AI首推應用場景
在所有機器處理的感知系統中,機器視覺系統包含的信息量最大,也是計算機應用中最復雜和最具挑戰的研究領域之一。近年來,隨著圖像處理及識別等關鍵研究領域的突破,包括卷積神經網絡(Convolutional Neural Network,CNN)技術的成熟,以及大規模集成電路技術發展所帶來的處理性能的大幅度提升,使人工智能(Artificial Intelligence,AI)在視覺應用上獲得了前所未有的進步,成為AI大規模應用推廣的第一個場景。例如,特定環境下的人臉識別、車輛識別、場景識別等技術,不管從識別準確度還是識別速度都已取得了驚人的成就,離理想的商業應用已經不遠了,如廣州的高鐵安檢已經開始使用人臉識別與身份證信息對照對乘客進行身份確認。
由于視覺在人類的生產、生活中扮演著重要的角色,AI視覺的應用一直是AI研發最活躍的領域之一,隨著相關技術的突破,未來的AI視覺技術將會在安防監控、汽車輔助/自動駕駛、無人機/機器人視覺領域得到廣泛應用。
AI視覺面臨的挑戰
AI視覺當下面臨著眾多挑戰,從技術角度來看包括視頻圖像識別與處理算法、大數據分析、更先進的傳感器、通訊網絡與覆蓋、存儲及軟硬件平臺等。同時,針對大規模公眾性AI視覺應用,還需要解決包括信息安全、個人隱私、運營與服務品質等一系列問題。假如上述問題陸續得到解決,可以預期在未來數年中,AI視覺產品與應用將無所不在。
另外,華夏芯首席執行官李科奕還特別指出,芯片設計架構上的創新和集成電路制造工藝的快速進步為AI視覺的推廣奠定了堅實的硬件基礎。
AI視覺的訓練與推理
在有關AI視覺處理芯片的選擇上,華夏芯認為是由應用場景來決定。
而從目標和任務角度來看,AI在視頻應用領域的工作可以劃分為訓練與推理兩大類。
高性能CPU/GPU集群或其它高性能計算平臺處理訓練
通常情況下,訓練工作適合在運維平臺(云端)來做,目前業界一般采用英偉達的GPU與賽靈思的FPGA來實現計算加速,也有采用基于Intel的CPU集群來實現的。主要原因在于在典型的訓練場景中,功耗、計算復雜度、實時性響應等指標雖然也很重要,但都不是要考量的第一要素。最重要的是必須確保算法在各種情況下都能獲得滿意的性能效果,包括動態范圍好,收斂性好,適應性好等。為此而耗費較多的計算資源、功耗和時間對AI的參數進行迭代與訓練,都是非常值得的。
所以,對于基于大數據的AI學習與訓練來說,李科奕表示,很多廠家采用GPU、FPGA、配置矢量處理單元的CPU計算集群、甚至于針對特定應用更為優化設計的神經網絡加速器等,這些都不失為良好的學習和訓練平臺。盡管如此,每種平臺都有局限性,存在改進和優化的空間。
異構計算完成推理
對于前端嵌入式視頻圖像AI推理芯片主要從以下幾個方面考慮。第一,從算法角度講,AI推理的結構特性極不規則,例如,不等長的、不同維度的、稀疏的矢量計算、矩陣計算等,傳統架構的CPU、DSP、GPU處理效率不高;第二,前端場景變化多端,圖像質量屬性不一,如果要取得AI推理的良好性能,不能僅僅依靠AI算法自身,還需要輔助以更多手段與方法;第三,嵌入式的前端應用對于成本、性能、功耗、編程、生態、標準化的要求更高,而且同時存在著控制與加速計算的需求。這些巨大的挑戰正是為什么目前市場上前端AI視頻芯片方案還非常少、即使已有芯片方案也還存在相當局限性的原因。
解決AI視頻前端推理的最好的芯片設計理念是新一代的異構計算架構。異構計算可以很好地支撐龐大而繁雜的前端智能的廣泛應用,并實現視頻應用相關的人工智能產業的標準化與規范化發展,創建健康的應用生態系統。而現有市場出現的前端智能推理芯片還不能很好地適應不規則的人工智能算法的架構特性,同時滿足高性能、低功耗、易編程優化等需求。因此,基于新一代異構計算架構的CPU+DSP+硬件加速器的SoC芯片平臺有可能成為AI視頻的主流方案之一。因為這一方案很好地利用了DSP并行計算能力突出的特點:在大部分視頻應用場景中,新一代DSP的計算能力不亞于GPU與FPGA,但功耗更低、實時性更強,與單純的神經網絡加速器相比則靈活性更強。
華夏芯獨特的異構計算架構理念
按照傳統理念進行分類的處理器產品在未來的芯片應用領域的空間會越來越小,取而代之的是多種計算單元融合的異構計算設計理念。針對這一發展趨勢,華夏芯在業界提出了“三合一”體系架構,推出滿足異構計算應用的新一代處理器IP,包括指令集、工具鏈以及在單一內核中實現同時滿足CPU、DSP與GPU的應用需求與計算特征的微架構。這樣的異構計算SoC設計既降低了用戶二次開發與應用實現的門檻,又顯著提升了產品的性能、功耗等核心指標,大幅度降低了用戶在研發投入方面的成本與規模。
針對AI領域的特殊需求,華夏芯研發了完全自主知識產權的處理器IP核,包括獨特、先進的微架構,并推出了可變長矢量(矩陣)處理單元,從而很好地滿足了AI算法處理中常出現的多維度、可變長、高并發的計算特征的普遍需求。我們的技術較傳統的并行計算架構來說,不僅僅在時延、性能、功耗等關鍵指標上顯著提升,更重要的是用戶的編程門檻大幅度下降。
目前,華夏芯正和本地AI視覺算法廠商、系統廠商密切合作,即將推出一款基于異構計算融合概念的AI視覺專用SoC。這款產品既有通用、又有專用處理單元,主要用于對AI視覺性能要求很高的安防監控、汽車輔助駕駛、機器視覺等應用領域,它的定義和開發是完全基于合作伙伴及應用廠商的定制化需求,李科奕自信地表示,我們相信這款SoC及配套開發工具將成為理想的國產AI視覺開發平臺。
另外,李科奕稱,下一步,華夏芯將積極參與推動相關產業聯盟的發展,共建國產AI處理器推廣應用平臺,與業界同仁一道,加速推動我國AI相關產業的發展。
參考文獻:
[1]李韜,網絡處理器芯片的國產化之路[J].電子產品世界,2015(1):25-25.
[2]鄭小龍,國產嵌入式微處理器的探索與開拓[J].電子產品世界,2015(8):20-21.
[3]王瑩,“CPU+”異構計算時代,華夏芯通過HSA搶占高地[J].電子產品世界, 2016 (9):15-17.
[4]陳俊穎,周順風,閔華清.基于CAPI FPGA的醫學超聲成像算法異構加速[J].電子產品世界,2016(10):41-44.
本文來源于《電子產品世界》2017年第7期第28頁,歡迎您寫論文時引用,并注明出處。
評論