NVIDIA公布2026-2028年兩大GPU架構:搭配1TB HBM4e內存
快科技3月19日消息,NVIDIA Blackwell架構雖然在加速卡、游戲卡上都遭遇諸多波折,但這并不影響NVIDIA對于未來的宏偉規劃,不但公布了下一代Rubin架構的具體產品規劃,還首次宣布了再下一代架構“Feynman”。
本文引用地址:http://www.j9360.com/article/202503/468454.htmFeynman就是理查德·費曼,美籍猶太裔人,20世紀最偉大的物理學家之一,諾貝爾物理學獎獲得者,在量子電動力學、量子計算、納米技術等領域都有開創性的成就,還撰寫了《費曼物理學講義》、提出了“費曼學習法”,1986年挑戰者號航天飛機爆炸失事的根本原因也是他查明的。
NVIDIA這次一共宣布了三款產品,首先是“Blackwell Ultra NVL72”,今年下半年發布,每個節點配備兩顆升級版的Blackwell GPU、一顆Grace CPU,搭配多達288GB HBM3e高帶寬內存,Dense FP4性能高達15PFlops(每秒1.5億億次)。
整臺服務器一共72個節點,也就是144顆GPU、72顆CPU、20TB HBM3e、40TB DDR5內存,比上代增加50%,CX8互連帶寬14.4TB/s,增加100%。
整機的Dense FP4推理性高達1.1EFlops(每秒110億億次),FP8訓練性能高達0.36EFlps(36億億次),還有新的注意力指令。
2026年下半年,我們將迎來全新的Rubin架構,首發服務器產品為“Vera Rubin NVL144”,每個節點兩顆Rubin GPU搭配一顆全新的Vera CPU。
其中,Rubin GPU搭配288GB容量的下一代HBM4內存,FP4浮點性能躍升到50PFlops(每秒5億億次)。
Vera CPU則包含88個自研Arm架構核心,首次支持多線程而達到176線程,彼此之間通過1.8TB/s帶寬的NVLink-C2C總線連接在一起。
整臺服務器一共144個節點,也就是288顆GPU、144顆CPU、41.5TB HBM4內存(帶寬13TB/s),還有75TB的系統內存,NVLink6帶寬達260TB/s,CX9總線帶寬達28.8TB/s。
FP4推理性能來到3.6EFlops(每秒360億億次),FP8訓練性能則是1.2EFlops(每秒120億億次)。
2027年下半年,我們將看到升級版的“Rubin Ultra NVL576”,每個節點包含四顆Rubin GPU、一顆Vera GPU,并升級1TB HBM4e內存,FP4浮點性能高達100PFlops(10億億次)。
整機一共多達576個節點,也就是擁有2304顆Rubin GPU、576顆Vera CPU、576TB HBM5e(帶寬4.6PB/s),還有365TB系統內存。
NVLink互連總線升級到第七代NVLink7,帶寬驚人的1.5PB/s,另外CX9總線帶寬115.2TB/s。
FP4推理性能高達15EFlops(每秒1500億億次),FP8訓練性能5EFlops(每秒500億億次)。
至于新的Feynman架構,將在2028年首次登場,搭配下一代HBM內存(HBM5?),但具體細節暫未披露。
評論