AI 端側的芯片革命
2025 年,中國開了一個好年。
本文引用地址:http://www.j9360.com/article/202502/467276.htm文化市場,哪吒 2 爆火,票房已經突破了百億,闖入全球電影 TOP 榜,向世界展示了中國市場「恐怖的」消費能力。AI 市場,DeepSeek 的橫空出世,更低的算力達到 Chat GPT 的效果,直接刷屏全球熱搜榜。
如果說 Chat GPT 的出現,讓生成式 AI 走向了云,那么 DeepSeek 則是讓生成式 AI 走向了端。
端側 AI 芯片的「黃金拐點」
科技行業一直在探索 AI 硬件產品。
從今年「消費電子屆春晚」CES 上來看非常明確。今年 CES 上的各大公司推出的產品都與 AI 強相關,無論是通用的 PC,還是手機終端,再到機器人、眼鏡、耳機、手表等等,幾乎每種產品只要存在人機交互的硬件終端,都有廠商嘗試將其與 AI 大模型結合。
但這些探索似乎都不太成功。大模型推出了成百上千種,硬件產品更是成千上萬種,但效果不甚了了。究其原因,還是本地 SoC 提供的算力和大模型需要的算力無法匹配。
ChatGPT 時代,大模型的蒸餾是很大的問題。如果采用云端調用算力完成 AI 推理,就存在三個問題:第一,成本。云端的任何操作都是有成本的,可能不多,幾分人民幣,但總之是要花錢的。
有手機廠商透露,調用一次云端大模型的平均成本在 1.2 分到 1.5 分人民幣,假設每個品牌都有上億的用戶量,每人每天調用 10 次,這其中的算力成本非常驚人。但是如果按次數或月租向用戶進行收費,在功能同質化的情況下,用戶的使用意愿也會很難保證。
第二,速度。既然是云端完成,那么必然需要進行網絡傳輸,這就導致 AI 在終端的響應速度慢。如果是自動駕駛中的汽車,對于當前環境需要在 10 毫秒內決策,靠著云端未免過于危險。在自動駕駛、工業質檢等場景,端側推理延遲能夠降至毫秒級,較云端方案提升 5 倍。
第三,隱私。這是最重要的部分,涉及到醫療和金融等內容,對于用戶來說,端側模型才是最優解。
所有人內心都有一個答案:端側 AI 才是 AI 硬件落地的關鍵。
小尺寸模型落地端側已經開始了。
自華為宣布「小藝智能體」接入 DeepSeek-R1 算起,在一周多的時間里,包括星紀魅族、榮耀、OPPO、努比亞、vivo 在內的 6 家手機廠商宣布接入 DeepSeek。
需要解釋的是,滿血版 DeepSeek-R1 模型參數達到 671B,僅模型文件就需要 404GB 存儲空間,任何一種移動設備都無法滿足這樣的硬件配置需要。但 DeepSeek 蒸餾版本(1.5B、7B)適合手機等端側使用。
為了讓這些小尺寸模型在端側流暢運行并充分發揮其智能優勢,就需要性能強勁的端側 AI 芯片來提供算力支持。
市場對于能適配小尺寸模型運行的端側 AI 芯片需求開始水漲船高。
賽道主力玩家
端側的應用市場非常大,前文我們提到,只要存在人機交互的硬件終端,都有廠商嘗試將其與 AI 大模型結合。我們可以在這里具體看一下:
AI PC 領域,2027 年 AI PC 在中國 PC 市場占比能夠達到 85%;AI 手機領域,2026 年,AI 手機的出貨量預計將突破 4.7 億部,滲透率增至 38%;在 AI 可穿戴設備領域,市場規模預計將從 2024 年的 419 億美元增長至 2028 年的 1207 億美元,CAGR 達到 30.3%。
2023 年中國端側 AI 市場規模為 1,939 億元,從 2018 至 2023 年,其年均復合增長率為 116.3%。
DeepSeek 首先帶動是 AI 端側的 SoC 芯片需求。
SOC 芯片是各類型硬件設備的主控單元,承載著運算控制等核心功能,是硬件的「大腦」。隨著 AI 在邊緣側的應用越來越廣泛,SOC 將更加變成集成人工智能和邊緣計算能力的系統級芯片,成為 AI SOC,算力達到幾十甚至數百 TOPS。
在這次端側 AI 熱潮中,瑞芯微頻頻漲停。
目前,瑞芯微能夠提供從 0.2TOPs 到 6TOPs 的不同算力水平的 AIoT 芯片,其中 RK3588、RK3576 帶有 6TOPs NPU 處理單元,能夠支持端側主流的 0.5B~3B 參數級別的模型部署。可通過大語言模型實現翻譯、總結、問答等功能,并可實現多模態搜索、識別,有效解決不同 AIoT 場景的痛點,提升產品使用體驗。
其中,公司 SOC 芯片拳頭產品 RK3588M 是國內少數能媲美國外一線產品的智能座艙 SoC 芯片。
據瑞芯微透露,該產品性能優異,一芯帶多屏、端側 AI 等能力突出,已落地應用于眾多頭部車廠,量產車型 10 余款,超 20 款定點車型項目在同步開發中。此外,新產品 RK3576M 也正在進行客戶導入。
這還僅是瑞芯微端側 AI 產品應用的一個方面。
事實上,當前已有多個領域的客戶基于瑞芯微主控芯片研發在端側支持 AI 大模型的新硬件,例如教育平板、AI 玩具、桌面機器人、算力終端、會議主機等產品。
全志科技也是一家備受關注的 SoC 企業。去年公司全年實現屬于上市公司股東的凈利潤為 1.53 億元–1.9 億元,同比增長 566.29%~727.42%。業績暴增的原因,則是以掃地機器人、智能投影等業務線為代表的產品出貨量顯著提升,致使營業收入同比增長約 35%。
在記者問詢全志科技產品是否能適配 DeepSeek,是否針對 DeepSeek 進行布局時,全志科技表示:「公司產品可以為端側多種形態的智能終端產品提供算力支持。」
樂鑫科技 SoC 長期應用于泛 IoT 領域。從應用端看,樂鑫科技在智能家居、智能照明和消費電子等核心應用市場合計達到了 30% 以上的增長。
樂鑫科技 ESP32-S3 和 ESP32-P4 產品線都有添加邊緣 AI 的功能,主要體現為設備端語音喚醒與控制,以及圖像處理的功能。這兩個系列的芯片在硬件設計上增加了 AI 加速指令;而在軟件層面,也提供圖像識別和語音喚醒、控制等方案。
樂鑫科技副總經理王玨表示:「公司帶端側 AI 功能的 AIoT 芯片 ESP32-S3 目前增長非常迅速,也是當前主推的旗艦產品。」字節跳動的 AI 玩具「顯眼包」中用的也是樂鑫的芯片 ESP32。
晶晨股份已有超 15 款商用芯片搭載其自研的端側 AI 算力單元,2024 年攜帶自研端側 AI 算力單元的芯片出貨量超過 800 萬顆。
2024 年年度實現營業收入 59.21 億元左右;歸母凈利潤約 8.2 億元左右,同比增長 64.65% 左右。該公司表示,其 6nm 芯片 S905X5 系列可利用端側 AI 能力,實現本地同聲翻譯、同聲字幕等功能,商用半年以來取得多個國際 Top 級運營商的訂單,預計 6nm 芯片有望在 2025 年達成千萬顆以上的銷量。
端側的 AI 音頻處理器應用場景多是在智能物聯網領域。比如,在智能音響中,端側 AI 音頻處理器能夠支持語音喚醒、語音識別、語音合成等功能,實現用戶與音箱的自然語言交互。在智能家居系統中,它可用于聲音控制家電設備,如通過語音指令調節燈光、空調、電視等。
恒玄科技的端側 SoC 已經成功搭載在多家主流品牌產品里,包括百度、字節跳動、谷歌、哈曼、安克創新、漫步者、韶音等。今年,字節跳動推出的首款搭載豆包大模型的智能耳機 Ola Friend,搭載的就是恒玄科技 2700 芯片。恒玄科技的最新芯片 BES2800 還被應用于三星 2024 年最新發布的 Galaxy Buds3 Pro 耳機中。多款耳機的應用,能夠看出恒玄科技在智能終端 SoC 芯片領域處于領先地位。
對于端側 AI 對于芯片要求的變化,恒玄科技認為:「云端大模型的興起除了對 AI 手機、PC 帶動外,可穿戴也是會受益于端側 AI 的發展,它對芯片會提出新的需求,比如可穿戴的環境感知能力要變得更強,所以主控芯片的算力需要相應提升,同時可穿戴產品長續航是剛需,所以芯片在算力提升的基礎上還要保持較低的功耗水平。」
值得一提的還有 AI 眼鏡芯片。行業普遍認為眼鏡是目前最火的 AI、大模型的落地載體,今年行業將會完成 0 到 1 的突破。
之前在 2017 年,Meta 就開始自研 AI 眼鏡,最開始是和三星合作,但是三年都沒出什么結果,然后告吹了。之后 Meta 放棄了自研芯片,Ray-Ban 眼鏡使用了高通的 AR1 Gen 1 芯片。
可以說,在 ARVR 芯片這個領域,高通還是處于絕對的控制地位。在市面上,AI 眼鏡能用上的芯片,除了高通芯片,那就是紫光展銳的 TW517。
紫光展銳TW517 采用 12nm 工藝,GPU 型號為 IMG8300,運行頻率 800MHz。主要客戶是閃極 AI 拍拍鏡、影目科技。
同時,恒玄科技此前透露,該公司芯片已在魅族等智能眼鏡產品中應用發布,同時有一些客戶項目正在導入階段。
結語
哪吒 2 突破百億票房,向世界展示了中國市場「恐怖的」消費能力。這意味著:單憑中國市場的規模和消費能力就抵得上全球其他發達國家的總和。
這背后傳遞的信號非常積極。
如果只看電影市場,可能還不太理解。但如果放到科技和制造業中來看就會明白其中的巨大價值。
接下來不管歐美再怎么對我們進行貿易和科技壁壘,都不可能阻止我們產業升級。對于科技和制造的最大障礙,并不是「卡脖子」,而是前期沒有足夠大的消費市場買單,就無法形成相關產業鏈的建立。
舉個例子,某企業研發一款芯片,從設計到量產累計成本要 2 個億,如果只賣出十萬片那每個芯片的成本等于是 2000 塊,這個價格太高了,企業肯定無法盈利。只能陷入長期虧損,最終倒閉出局。但是如果能夠賣出 1 億片,那每片成本只需要 2 塊錢。這個成本的大幅度攤薄就會讓企業有利潤繼續投入研發。
因為市場體量足夠大,有足夠多的買家幫助消化成本,公司就能賺錢、行業就能發展,這就是中國市場的魔力。
國信證券研報觀點稱,2024 年電子行情由「周期復蘇」向「成長創新」切換,2025 年行業有望邁入估值擴張大年。應用端 AI 革新人機交互,以語音交互為核心的 AI 端側應用正處在大規模商業化的臨界點,創新催化頻繁。
相比 AI 云側,國內半導體企業將在 AI 端側創新中實現更高的市場參與度,同時國產半導體自給率仍偏低,兩者共振奠定了行業成長的確定性和空間。
評論