a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 智能計算 > 設計應用 > 吞吐量30倍提升!NVIDIA秀Blackwell性能:打破MLPerf記錄居第一

吞吐量30倍提升!NVIDIA秀Blackwell性能:打破MLPerf記錄居第一

作者: 時間:2025-04-03 來源:快科技 收藏

4月3日消息,NVIDIA在官網表示,在最新的MLPerf V5.0基準測試中,NVIDIA的平臺取得了令人矚目的成績。

本文引用地址:http://www.j9360.com/article/202504/468990.htm

MLPerf是一個衡量人工智能硬件、軟件和服務性能的標準化基礎測試平臺,它由圖靈獎得主大衛·帕特森聯合谷歌、斯坦福、哈佛大學等頂尖企業和學術機構成立,是權威性最大、影響力最廣的國際AI性能基準測試。

最新更新的MLPerf 添加了Llama 3.1 405B,這是最大和最難以運行的開放權重模型之一。

NVIDIA表示,雖然許多公司在其硬件上運行MLPerf基準測試以衡量性能,但只有NVIDIA及其合作伙伴提交并發布了Llama 3.1 405B基準測試的結果。

具體來看,GB200 NVL72系統通過連接72個NVIDIA ,作為一個單一的超大運行,在Llama 3.1 405B基準測試中,與H200 NVL8相比,實現了高達30倍的吞吐量提升。

據介紹,在生產環境中,推理部署通常受到兩個關鍵指標的延遲限制:首次響應時間(TTFT)和每個輸出令牌的時間(TPOT)。

新的Llama 2 70B Interactive基準測試將TPOT縮短了5倍,TTFT降低了4.4倍,模擬了更快的用戶體驗。

在這一測試中,NVIDIA使用8個 的DGX B200系統,性能比使用8個H200 GPU的系統高出三倍,為這一更具挑戰性的Llama 2 70B基準測試設定了新的高標準。

吞吐量30倍提升!NVIDIA秀Blackwell性能:打破MLPerf記錄居第一




評論


相關推薦

技術專區

關閉