華為推出全新架構昇騰 AI 計算集群,支持超萬億參數大模型訓練
IT之家 9 月 20 日消息,在今日舉行的華為全聯接大會 2023 期間,華為常務董事、ICT 基礎設施業務管理委員會主任、企業 BG 總裁汪濤正式發布全新架構的昇騰 AI 計算集群 ——Atlas 900 SuperCluster,可支持超萬億參數的大模型訓練。
本文引用地址:http://www.j9360.com/article/202309/450775.htm據介紹,新集群采用了全新的華為星河 AI 智算交換機 CloudEngine XH16800,借助其高密的 800GE 端口能力,兩層交換網絡即可實現 2250 節點(等效于 18000 張卡)超大規模無收斂集群組網。
新集群同時使用了創新的超節點架構,大大提升了大模型訓練能力。此外,發揮華為在計算、網絡、存儲、能源等領域的綜合優勢,從器件級、節點級、集群級和業務級全面提升系統可靠性,將大模型訓練穩定性從天級提升到月級。
此外,華為發布了更開放、更易用的 CANN 7.0 異構計算架構,不僅全面兼容業界的 AI 框架、加速庫和主流大模型,還深度開放底層能力,讓 AI 框架和加速庫可以更直接地調用和管理計算資源,使能開發者自定義高性能算子,讓大模型具備差異化的競爭力。
華為還升級了 Ascend C 編程語言,以更高效的編程方式,簡化算子實現邏輯,大幅縮短融合算子的開發周期,為 AI 模型與應用的快速開發賦能。
面向全球企業和開發者,華為云官網今日正式上線昇騰 AI 云服務“百模千態”專區,專區收錄了業界主流開源大模型,并全面基于昇騰 AI 云服務進行適配和優化;提供應用開發的工具鏈,開發工具已經全部實現了云化,免去繁瑣的配置流程,實現一鍵接入,即開即用。
▲ 昇騰 AI 云服務百模千態專區
IT之家查詢獲悉,截至今年 7 月,昇騰 AI 集群已支撐全國 25 個城市的人工智能計算中心建設,其中 7 個城市公共算力平臺入選首批國家“新一代人工智能公共算力開放創新平臺”。
同時,昇騰 AI 已發展 30 多家硬件伙伴、1200 多家 ISV,聯合推出了 2500 多個行業 AI 解決方案,規模服務于運營商、互聯網、金融等行業。
評論