英特爾宣布公司40年來最大的架構變革
英特爾在2023年的“AI Everywhere”活動上推出了對其處理架構的徹底更新,體現在其移動Core Ultra處理器和將于2024年發布的桌面Core Ultra處理器中。這些架構將傳統高性能CPU核心與專用核心(用于低功耗任務、圖形加速和AI加速)結合在一起。在同一活動上宣布的最新的第五代Xeon CPU側重于服務器性能,并添加了用于云AI加速的協處理器核心。
本文引用地址:http://www.j9360.com/article/202312/454187.htm根據英特爾的公司愿景,AI處理的未來既在云端又在邊緣。該公司預測,到2028年,80%的個人電腦將成為“AI個人電腦”,配備有AI協處理器。
英特爾轉向神經處理單元英特爾的AI協處理器被稱為神經處理單元(NPU),是其最新的重大創新。當與其他專用CPU核心結合時,英特爾認為新處理器將提高整體性能,同時降低電力消耗并降低總體擁有成本(TCO)。
這些設備的多樣化架構結合了在基于芯片組的系統中組裝的多個專用核心。芯片組通過減少每個處理器的硅實際面積并優化每個芯片組的用途的硅晶圓,實現了更高的產量。與大多數AI加速器一樣,英特爾的NPU在很大程度上依賴于乘累加(MAC)單元。MAC通過減少在存儲器和寄存器之間移動數據的需要來加速復雜的乘法運算。
英特爾于2023年底發布了Xeon和移動處理器,計劃在2024年推出使用英特爾4的桌面PC處理器。英特爾4工藝技術是一種7納米幾何工藝,英特爾聲稱相比英特爾7工藝(10納米),它將使時鐘速度提高20%,功耗相同。Core Ultra和第五代Xeon是英特爾的第一款7納米處理器,也是自2019年以來的第一款具有更小工藝幾何的Core CPU。
從眾多相同的核心到定向的專用核心傳統的云AI處理使用圖形處理單元(GPU)和張量處理單元(TPU)進行大規模的并行處理和矩陣數學優化。因此,英特爾的主流CPU長期以來一直包含GPU。在英特爾先前的架構中,主CPU核心負責處理所有計算負載,而不考慮計算負載的大小。這將導致低負載任務使用比必要更多的電力,并從高負載進程中獲取CPU周期。它還將專業的數學密集型處理留給了主CPU核心,而這些核心并未針對專用操作進行優化。
英特爾的Xeon服務器處理器及其Core移動和桌面CPU過去一直依賴于速度和優化的軟件作為解決方法。新系統,具有多個專用核心,是與“一刀切”哲學的激進背離,不再只增加相同核心的數量。
通過Gaudi3全面解決云AI除了新的NPU協處理器之外,英特爾還宣布了Gaudi2深度學習AI加速器的繼任者。Gaudi3 AI加速器面向云計算、大規模深度學習和生成式AI系統。英特爾聲稱,與Gaudi2相比,Gaudi3在BF16性能上提供了4倍的增長。
BF16(腦浮點)數字格式用于提高AI計算中的浮點數性能。它是IEEE 754 float32格式的16位變體。BF16保留了標準float32的8個指數位,但只保留了8個尾數有效數字位,而不是float32中的24位。AI更多地受益于使用16位數學帶來的速度增加,而不是因尾數精度減少而損失的性能。Gaudi3還將加倍網絡性能,并提供Gaudi2的1.5倍帶寬。
涉足云AI、邊緣AI和大型系統處理通過Xeon服務器CPU、工作站/筆記本CPU和Gaudi3加速器,英特爾已經擴展其AI,幾乎涵蓋了所有關鍵的AI領域。Gaudi3將在大規模AI系統中找到用武之地。第五代Xeon將用于服務器農場,將數據處理和傳統服務器活動與加速的AI功能相結合。而Core Ultra移動和桌面CPU將為個人用戶帶來AI。
評論