a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > Arm打破邊緣AI“次元壁”:Armv9邊緣AI計算平臺重塑物聯網未來格局

Arm打破邊緣AI“次元壁”:Armv9邊緣AI計算平臺重塑物聯網未來格局

作者: 時間:2025-03-05 來源:全球半導體觀察 收藏

2025年2月27日,全球領先的 IP 計算平臺公司舉辦媒體溝通會,并正式推出全球首個v9邊緣人工智能(AI)計算平臺,以全新Cortex-A320 CPU與Ethos-U85 NPU為核心,為(IoT)領域帶來顛覆性突破。該平臺專為場景優化,支持運行超10億參數的大語言模型(LLM),比去年的基于 Cortex-M85 搭配 Ethos-U85 的平臺提升了八倍的 ML 計算性能,帶來了顯著的 AI 計算能力突破,標志著邊緣計算正式邁入“高智能、超安全、強能效”的新紀元。

本文引用地址:http://www.j9360.com/article/202503/467614.htm

劃時代產品組合:性能與能效的高階平衡

作為v9架構在邊緣計算領域的首秀,本次發布的平臺由兩大核心組件構成。

Cortex-A320 CPU:全球最小型、最高能效的-A處理器,專為設備打造。其集成SVE2(可伸縮向量擴展)指令集,標量計算性能較前代Cortex-A35提升30%,ML推理能力相較于前代提升了10倍;支持BF16、INT8等AI專用數據類型,矩陣乘法指令顯著加速神經網絡處理。

Ethos-U85 NPU:與上一代產品相比,Ethos-U85 性能提升四倍,能效提高 20%,同時,其 MAC 單元可從 128 個擴展到 2048 個(在 1GHz 時,算力實現 4 TOPs),能夠為諸如工廠自動化和商用或智能家居攝像頭等需要更高性能的應用提供有力的支持。此外,Ethos-U85 支持 Transformer 架構和卷積神經網絡 (CNN) 以實現 AI 推理。

二者協同可運行超10億參數的端側模型,滿足工業自動化、智能攝像頭、自動駕駛等場景對實時性與隱私性的嚴苛需求。Arm高級副總裁兼事業部總經理Paul Williamson表示:“AI 的革新已不再局限于云端。隨著世界的互聯和智能化水平的日益提升,從智慧城市到工業自動化,在邊緣側處理 AI 工作負載不僅帶來顯著的優勢,其必要性更是不可或缺。專為物聯網打造的 邊緣 AI 計算平臺的推出,標志著這一發展趨勢邁入了重要的里程碑。”

如今,智慧城市和工業智能制造對邊緣計算的實時性、低延遲以及可靠性提出了極高要求。那么,Arm此次發布的計算平臺針對這些需求有哪些設計?Arm物聯網事業部業務拓展副總裁馬?。–hloe Ma)對此表示,在實時性方面,全新的計算平臺提供了有力支持。因邊緣AI芯片處理能力不足,與監控相關的視頻常需返回云端處理,導致實時性大打折扣。除了與全新Cortex-A320 CPU搭配之外,Ethos-U85 NPU還能與最高性能的Cortex-X925搭配,這樣的靈活組合大幅提升了邊緣算力。在視頻、多模態等大量數據處理場景下,AI處理能在邊緣進行,大大提高了應用實時性。

在可靠性方面,Arm的CPU經過了大量量產驗證。馬健指出,過去30年,Arm合作伙伴基于Arm架構的芯片出貨量超3000億,2021年近300億顆基于Arm架構的年度芯片出貨量中,近200億顆被部署到物聯網和嵌入式應用中。這得益于其設計過程中完善的驗證機制,為產品質量和可靠性提供了保障。

架構:安全、效率與靈活性的三重革新

此次Armv9架構的引入,為邊緣設備帶來安全性、性能、能效三大維度的革新。

·極致安全性

內存標記擴展(MTE):實時檢測并顯著減少內存安全漏洞,對提升系統安全性有重要作用。
指針驗證(PAC)與分支目標識別(BTI):確保代碼執行路徑安全,抵御控制流攻擊。
Secure EL2虛擬化:實現虛擬機間硬件級隔離,滿足多租戶邊緣場景的安全需求。

·性能飛躍

增強的 Neon 和可伸縮向量擴展(SVE2)技術:提供更高效的 ML 計算能力。
新增矩陣乘法指令:優化AI和ML計算性能,加速神經網絡推理和訓練任務。

·能效突破

通過窄取和解碼數據路徑、密集存儲的 L1 緩存、縮減端口的整數寄存器文件等等微架構優化,Cortex-A320能效較Cortex-A520提升了50% 以上。得益于Armv9 架構所實現的顯著 ML 性能提升,在 2GHz 頻率下運行,以 8 位 MAC/周期測得,四核 Cortex-A320 可以執行高達 256 GOPS。因此,無需外部加速器,Cortex-A320 便可直接在 CPU 上運行高級 ML 和 AI 用例。

KleidiAI與生態協同:開發效率提升70%

針對邊緣AI開發痛點,Arm此次還將Kleidi擴展到物聯網領域。Kleidi已集成到Llama.cpp、ExecuTorch等主流框架,加速了 Meta Llama 3 和 Phi-3 等關鍵模型的性能。例如,在 Llama.cpp 上運行微軟的 Tiny Stories 數據集時,KleidiAI 為新的 Cortex-A320 帶來了高達 70% 的性能提升。Kleidi讓開發者擺脫硬件適配桎梏,專注于創新本身。此外,新的邊緣 AI 計算平臺具備支持多種操作系統的能力,無論是如 FreeRTOS 和 Zephyr 的實時操作系統 (RTOS),還是如 Linux 和 Android 的功能豐富的操作系統,都能提供高效支持,讓超2000萬開發者無縫遷移現有工具鏈。

此外,Armv9 獲得了全球產業鏈領軍企業的高度認可。例如,亞馬遜云科技表示,Arm為其客戶實現在Armv9技術上運行AWS IoT Greengrass的輕量級設備運行時環境—— Nucleus Lite,讓邊緣設備以最低的內存需求高效運行;西門子認為,基于 Armv9 架構的全新邊緣 AI 計算平臺有助于其將高度安全、高性能和高能效的 AI 創新產品組合擴展到所有客戶,涵蓋一系列工業、智能基礎設施和移動應用;瑞薩電子稱,Cortex-A320不僅在 AI/ML 高性能和安全性方面表現出色,還顯著優化了功耗和面積效率。這一突破有助于瑞薩電子加快創新步伐,進一步提升效率和可擴展性。

總體而言,隨著生成式AI向邊緣滲透,物聯網領域正在迎來前所未有的機遇與生機。Arm 所發布的全新平臺不僅僅是一次漸進式的升級,更是為未來邊緣計算和 AI 處理提出了新的范式。




評論


相關推薦

推薦視頻

更多>>

技術專區

關閉