6月13日,GTIC 2023全球汽車芯片創新峰會將在上海國際低碳智慧出行展覽會同期舉辦,首批演講嘉賓已揭曉,歡迎報名。


黃仁勛臺北激情演講2小時:連甩7項重磅發布,想讓全球企業都用上生成式AI。作者 | ZeR0
編輯 | 漠影
芯東西5月29日消息,繼上周遠超預期的財報業績預測引得股價和市值史詩級暴漲后,今日,英偉達(NVIDIA)創始人兼CEO黃仁勛穿著標志性的皮衣,意氣風發地出現在臺北電腦展COMPUTEX 2023上,在主題演講期間先是現場給自家顯卡帶貨,然后一連公布涉及加速計算和人工智能(AI)的多項進展。
面向生成式AI歷史性浪潮,英偉達的一系列發布包括:推出大內存生成式AI超級計算機DGX GH200,可加速生成式AI設計的Grace Hopper超級芯片GH200已全面投產,推出全新加速以太網平臺Spectrum-X,為游戲提供定制化AI模型代工服務,與全球最大的營銷服務機構WPP合作打造生成式AI內容引擎,多家世界頂級電子制造商采用英偉達生成式AI工具與Omniverse平臺構建先進的數字工廠。
英偉達還發布了MGX服務器規范,為系統制造商提供快速高效構建100多種服務器配置的模塊化參考架構。黃仁勛說,有超過1600家生成式AI公司采用了英偉達技術。
目前,英偉達最新市值為9632億美元,離“萬億市值俱樂部會員”只差臨門一腳。一旦突破萬億大關,英偉達將成為美股市值第五大公司、第七家市值越過1萬億美元的美國上市公司,以及第一家由華人創立的萬億美元市值公司。
01.生成式AI超算堪比“巨型GPU”:E級算力,谷歌云、Meta、微軟首批試用
首先來看下英偉達今日推出的采用英偉達最新GPU和CPU的系統巔峰之作——新型大內存AI超級計算機DGX GH200。
這臺超算預計今年年底問世,旨在為生成式AI語言應用、推薦系統、數據分析工作負載開發大型下一代模型。黃仁勛認為,生成式AI、大型語言模型和推薦系統是現代經濟的數字引擎。據他介紹,DGX GH200 AI超級計算機集成了英偉達最先進的加速計算和網絡技術。
DGX GH200是首款將Grace Hopper超級芯片與英偉達NVLink Switch系統搭配的超級計算機,通過采用新互連方式,將256個Grace Hopper超級芯片連接在一起,使它們能像單個巨型GPU一樣協同運行,從而提供了1EFLOPS的性能和144TB的共享內存,比2020年推出的上一代DGX A100 320GB系統的內存多出近500倍。
谷歌云、Meta、微軟等是首批獲得DGX GH200訪問權限、用于生成式AI工作負載的公司。英偉達也打算將DGX GH200設計藍圖提供給云服務商及其他超大規模計算廠商,以便他們可以進一步為其基礎設施定制DGX GH200。
此外,英偉達正在打造自己的基于DGX GH200的大型AI超級計算機NVIDIA Helios,以支持其研究和開發團隊的工作。它采用4個DGX GH200系統,每個都將與英偉達Quantum-2 InfiniBand網絡連接,帶寬高達400Gb/s,以提高訓練大型AI模型的數據吞吐量。Helios將包括1024顆Grace Hopper超級芯片,將于今年年底上線。DGX GH200超級計算機包含英偉達軟件,可為AI和數據分析工作負載提供全套解決方案。英偉達Base Command軟件提供AI工作流管理、企業級集群管理、加速計算、存儲和網絡基礎設施的庫,以及為運行AI工作負載而優化的系統軟件。英偉達AI平臺的軟件層AI Enterprise提供了100多個框架、預訓練模型和開發工具,以簡化AI生產的開發和部署。
02.生成式AI的引擎:GH200 Grace Hopper超級芯片全面投產
英偉達宣布,GH200 Grace Hopper超級芯片已全面投產,將為運行復雜的AI和高性能計算工作負載提供動力。
基于GH200的系統加入了全球系統制造商基于英偉達最新Grace、Hopper、Ada Lovelace架構的400多個系統配置。GH200 Grace Hopper超級芯片采用NVIDIA NVLink-C2C互連技術,將基于Arm的英偉達Grace CPU和Hopper GPU架構組合在同一封裝中,提供了高達900GB/s的總帶寬——比傳統加速系統中的標準PCIe Gen5通道帶寬高7倍,互連功耗降低到原來的1/5,能夠滿足苛刻的生成式AI和高性能計算(HPC)應用。
位于歐美的幾家全球超大規模計算企業和超算中心客戶將可使用GH200驅動的系統。采用GH200的系統預計將于今年晚些時候上市。
03.推出新型加速以太網平臺正打造數億美元生成式AI超算
黃仁勛還宣布推出NVIDIA Spectrum-X,這是一個旨在提高基于以太網的AI云的性能和效率的網絡平臺。
它基于網絡創新,將英偉達Spectrum-4以太網交換機與英偉達BlueField-3 DPU緊密耦合,實現了相比傳統以太網結構1.7倍的整體AI性能和能效提升,并通過性能隔離增強了多租戶功能,在多租戶環境中保持一致、可預測的性能。
Spectrum-X具有高度通用性,可用于各種AI應用。它使用完全基于標準的以太網,并可與基于以太網的堆棧互操作。該網絡平臺由英偉達加速軟件和軟件開發工具包(SDK)進行增強,支持開發者構建軟件定義的云原生AI應用程序。端到端功能的交付減少了大規模基于Transformer的生成式AI模型的運行時間。該平臺支持256個200Gb/s端口,通過單個交換機連接,或在兩層leaf-spine拓撲中提供16000個端口,以支持AI云的增長和擴展,同時保持高水平的性能并最大限度地減少網絡延遲。
全球領先的云計算提供商正在采用Spectrum-X平臺擴展生成式AI服務。Spectrum-X、Spectrum-4交換機、BlueField-3 DPU等現已在戴爾、聯想、超微等系統制造商處提供。
作為Spectrum-X參考設計的藍圖和測試平臺,英偉達正在其以色列數據中心構建一臺超大規模生成式AI超級計算機Israel-1。這臺AI超算價值數億美元,將采用戴爾PowerEdge XE9680服務器、英偉達HGX H100超級計算平臺、內置BlueField-3 DPU和Spectrum-4交換機的Spectrum-X平臺。
04.發布MGX服務器規范提供模塊化參考架構
為了滿足各種規模的數據中心的需求,黃仁勛發布了NVIDIA MGX服務器規范,為系統制造商提供了模塊化參考架構。系統制造商可使用它快速且經濟高效地構建100多種服務器配置,以適應廣泛的AI、HPC及NVIDIA Omniverse應用。
MGX支持英偉達全系列GPU、CPU、DPU和網絡適配器,以及各種x86及Arm處理器。其模塊化設計使系統制造商能夠更有效地滿足每個客戶的獨特預算、電力輸送、熱設計和機械要求。
永擎(ASRock Rack)、華碩(ASUS)、技嘉(GIGABYTE)、和碩(Pegatron)、QCT、超微(Supermicro)等將采用MGX構建下一代加速計算機,可將開發成本削減多達3/4,并將開發時間縮短2/3至僅需6個月。有了MGX,制造商可以從為其服務器機箱加速計算優化的基本系統架構開始,然后選擇GPU、DPU和CPU。AI訓練和5G等多項任務可以在一臺機器上處理,升級到下一代硬件也很方便。MGX還能輕松集成到云和企業數據中心中。不同于英偉達HGX,MGX提供了與英偉達產品靈活的多代兼容性,以確保系統構建者可以重用現有設計并輕松采用下一代產品。同樣MGX也提供英偉達完整軟件堆棧的支持。QCT和超微將率先進入市場,MGX的設計將于8月面世。超微今日公布的ARS-221GL-NR系統將采用Grace CPU,而QCT的S74G-2U系統將采用Grace Hopper。黃仁勛還宣布,英偉達與日本電信巨頭軟銀合作,在日本建立一個分布式數據中心網絡。它將在一個共同的云平臺上提供5G服務和生成式AI應用。
數據中心將在模塊化MGX系統中使用Grace Hopper、BlueField-3 DPU以及Spectrum以太網交換機,以提供5G協議所需的高精度定時。該平臺將通過提高頻譜效率來降低成本,同時降低能耗。這些系統有助于探索自動駕駛、AI工廠、AR/VR、計算機視覺和數字孿生等領域的應用。未來的用途可能包括3D視頻會議和全息通信。
05.ACE代工服務:用生成式AI激活游戲角色生命,支持云端及PC低成本部署
生成式AI將改變玩家與游戲角色間的互動方式,并極大提高游戲的沉浸感。對此,黃仁勛宣布推出面向游戲的NVIDIA Avatar云引擎(ACE)。
這是一項定制AI模型代工服務,中間件、工具和游戲開發者可以使用它來構建和部署定制的語音、對話和動畫AI模型。它能賦予非玩家角色(NPC)更智能且不斷進化的對話技能,使其能夠以栩栩如生的個性來回答玩家的問題。基于英偉達Omniverse,ACE for Games為語音、對話和角色動畫提供了優化的AI基礎模型,包括:英偉達NeMo,使用專有數據,構建、定制和部署語言模型;英偉達Riva,用于自動語音識別和文本轉語音,以實現實時語音對話;英偉達Omniverse Audio2Face,用于即時創建游戲角色的表情動畫,以匹配任何語音軌道。開發人員可以集成整個NVIDIA ACE for Games解決方案,也可以只使用他們需要的組件。英偉達與專注于為虛擬游戲世界開發先進對話AI的英偉達Inception初創公司Convai合作,展示了如何快速用英偉達ACE for Games來構建游戲NPU。在一款名為Kairos的演示中,玩家與拉面店的供應商Jin互動。基于生成式AI,Jin雖是個NPC,卻能擬真地回答自然語言問題,且回答內容與敘述的背景故事一致。它是在虛幻引擎5中使用最新光線追蹤功能和英偉達DLSS渲染的。
支持英偉達ACE for Games的神經網絡針對不同的功能進行了優化,有不同的大小、性能和質量折中。ACE for Games代工服務將幫助開發者為其游戲重新調整模型,然后通過英偉達DGX Cloud、GeForce RTX PC或本地部署進行實時推理。這些模型針對延遲進行了優化,有助于優化游戲的沉浸式交互體驗。多家游戲開發商和初創公司已采用英偉達的生成式AI技術。黃仁勛還介紹了英偉達和微軟如何在生成式AI時代合作推動Windows PC的創新。新的和增強的工具、框架和驅動程序使PC開發者更容易開發和部署AI。例如,用于優化和部署GPU加速AI模型和新圖形驅動程序的微軟Olive工具鏈將提高帶有英偉達GPU的Windows PC上的DirectML性能。此次合作將增強和擴展搭載RTX GPU的1億臺PC的安裝基礎,可提升400多個AI加速的Windows應用程序和游戲的性能。
06.英偉達與WPP合作為數字廣告打造生成式AI內容引擎
生成式AI也正為價值7000億美元的數字廣告行業帶來了新機遇。基于NVIDIA AI和Omniverse的突破性引擎將來自領先軟件制造商的創意3D和AI工具連接在一起,以大規模革新品牌內容和體驗。全球最大的營銷服務機構英國WPP集團正與英偉達合作,在Omniverse Cloud上構建首個生成式AI內容引擎,使創意團隊能夠更快、更高效、更大規模地制作高質量的商業內容,同時與客戶的品牌保持完全一致。
新引擎連接了3D設計、制造和創意供應鏈工具的生態系統,包括來自Adobe和Getty Images的工具。在演講中,黃仁勛展示了創意團隊如何將他們的3D設計工具連接起來,在Omniverse中構建客戶產品的數字孿生。生成式AI的內容經過負責任的數據來源訓練,并與英偉達Picasso一起構建,將使其能快速生成虛擬集。然后WPP客戶可使用完整的場景生成大量廣告、視頻和3D體驗,供全球市場和用戶在任何網絡設備上體驗。WPP首席執行官馬克·里德(Mark Read)說,生成式AI正以驚人的速度改變營銷世界,WPP與英偉達合作所提供的獨特競爭優勢是當今市場上其他客戶無法獲得的,這項新技術將改變品牌為商業用途創建內容的方式,并鞏固WPP在為世界頂級品牌創造性應用AI方面的行業領導者地位。
07.電子制造商采用生成式AI實現數字化的智能工廠
全球電子制造商正在使用一種全新的綜合參考工作流程推進其工業數字化工作,在廣泛合作伙伴網絡的支持下,該工作流程結合了英偉達用于生成式AI、3D協作、仿真和自主機器的技術,可幫助制造商規劃、構建、運營和優化其工廠。這些技術包括:英偉達Omniverse,它連接了頂級計算機輔助設計應用以及生成式AI的API和前沿框架;用于模擬和測試機器人的英偉達Isaac Sim應用程序;英偉達Metropolis視覺AI框架,用于自動光學檢測。“世界上最大的工業生產物理產品。先用數字化構建它們可節省大量成本。”他談道,英偉達使電子制造商能輕松構建和運營虛擬工廠,將其制造和檢驗工作流程數字化,并大大提高質量和安全,減少代價高昂的最后一刻意外和延誤。黃仁勛現場展示了一個完全數字化的智能工廠的演示。
富士康工業互聯網、宜鼎國際、和碩、廣達和緯創正在使用新的參考工作流程,以優化他們的工作單元和裝配線運營,同時降低生產成本,具體用例包括電路板質保檢測點自動化、光學檢測自動化、建設虛擬工廠、模擬協作機器人、構建及運營數字孿生等。英偉達正在與幾家領先的制造工具和服務提供商合作,構建一個全棧、單一的架構,每個架構都適用于每個工作流程級別。在系統層面,英偉達IGX Orin提供了一個一體化的邊緣AI平臺,將工業級硬件與企業級軟件和支持相結合。IGX滿足邊緣計算獨特的耐用性和低功耗要求,同時提供開發和運行AI應用程序所需的高性能。其制造商合作伙伴們正在開發IGX驅動的系統,以服務于工業和醫療市場。在平臺層面,Omniverse連接了世界領先的3D、模擬和生成式AI提供商。團隊可在他們最喜歡的應用程序之間構建互操作性,比如來自Adobe、Autodesk和Siemens的應用程序。
08.結語:生成式AI正催生大量加速計算需求
生成式AI等變革性技術正滲透到消費者的生活方式中,并在醫療、金融、商業服務等許多行業催生新的商機,隨著越來越多企業加入AI競爭,數據中心性能正邁向下一個階段。訓練AI大模型是一項資源和時間密集型任務,需要強大、綠色、可擴展的基礎設施,以滿足不斷增長的加速計算能力、減少碳排放、控制成本等多方面的需求。
英偉達今日發布的一系列硬件基礎設施及軟件工具,目的性非常明確地圍繞企業開發和部署生成式AI應用的核心痛點,通過先進互連技術和共享內存設計突破大規模AI的算力瓶頸,提供更快的計算性能、更高的能效以及加速開發流程的工具。這將幫助企業及研究機構節省大量時間和成本,將生成式AI用于解決科研挑戰、優化工作流程和增強商業競爭力。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。