燧原科技不斷突破 努力打造AI生態
2021年7月7日,中國上海——燧原科技發布第二代人工智能訓練產品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”訓練加速卡和“云燧T21”訓練OAM模組,全面升級的“馭算TopsRider”軟件平臺以及全新的“云燧集群”,成為國內首家發布第二代人工智能訓練產品組合的公司。
本文引用地址:http://www.j9360.com/article/202107/426844.htm經過全新升級迭代后,邃思2.0的計算能力、存儲和帶寬、互聯能力較第一代訓練產品有巨大提升,對超大規模的模型支持能力獲得顯著增強。而同步升級的馭算TopsRider軟件平臺,成為燧原科技構建原始創新軟件生態的基石。完全自研的軟硬件架構,助力燧原科技在知識產權和產品升級迭代上可以自主掌控方向和節奏。
燧原科技CEO趙立東說:“這是一個AI算力爆炸的時代,過去五年,每3.5個月,AI算力加倍,換算成一年就是10倍,在AI算力加速領域技術鏈最高端的云端訓練,目前的基本狀態是生態被壟斷,生態的壟斷導致了產品的壟斷,燧原與各位攜手踏上的征程就是要打破這種壟斷,構建一個沒有依賴的自主的生態。”
燧原科技第二代通用人工智能訓練芯片“邃思2.0”
燧原科技第二代通用人工智能訓練加速卡“云燧T20”
燧原科技第二代通用人工智能訓練模組“云燧T21”
架構升級實現算力飛躍:邃思2.0進行了大規模的架構升級,新一代全自研的GCU-CARA全域計算架構,針對人工智能計算的特性進行深度優化,夯實了支持通用異構計算的基礎;支持全面的計算精度,涵蓋從FP32、TF32、FP16、BF16到INT8,并成為中國首款支持單精度張量TF32數據精度的人工智能芯片。單精度FP32峰值算力達到40 TFLOPS,單精度張量TF32峰值算力達到160 TFLOPS,均為國內第一。
HBM2E存儲帶來海量吞吐:邃思2.0共搭載了4顆HBM2E片上存儲芯片,高配支持64 GB內存,帶寬達1.8 TB/s,是中國第一個支持世界最先進存儲HBM2E和單芯片64 GB內存的產品。
高速互聯支撐算力擴展:GCU-LARE全域互聯技術是燧原專為人工智能訓練集群研發的互聯技術,提供雙向300 GB/s互聯帶寬,支持數千張云燧CloudBlazer加速卡互聯,實現優異的線性加速比。
全新軟件駕馭澎湃算力:馭算TopsRider是燧原科技自主知識產權的計算及編程平臺,通過軟硬件協同架構設計,充分發揮邃思2.0的性能;基于算子泛化技術及圖優化策略,支持主流深度學習框架下的各類模型訓練;利用Horovod分布式訓練框架與GCU-LARE互聯技術相互配合,為超大規模集群的高效運行提供解決方案。開放升級的編程模型和可擴展的算子接口,為客戶模型的優化提供了自定義的開發能力。
世界領先的計算集群:CloudBlazer Matrix擁有 8192張CloudBlazer訓練卡,一共可以達到1.3E Flops,也就是13000T的單精度智能集群算力。同時,燧原科技響應中國的綠色數字化,CloudBlazer Matrix液冷的PUE可以降到1.15以下,大力提升整個集群的能效比。CloudBlazer Matrix擁有每張單精度算力160T的訓練卡,以及80%的集群線性度。
燧原科技CEO趙立東(左)與 燧原科技COO張亞林(右)共同發布“云燧T20”訓練加速卡和“邃思2.0”芯片
發布會上燧原科技CEO趙立東表示:“燧原科技推出燧原異構計算生態——“燎原”計劃,這既是一個品牌,也是一個計劃。“計劃有三大特征,第一,一定要原始創新,原始創新是自己從頭打造基礎。第二,一定要標準化,燧原科技與合作機構正在積極參與標準化的制定,以及搭建測試平臺。第三,開放的姿態共建生態,以人工智能為起點,構建通用異構計算生態,構建標準化的技術體系,然后共建完整的生態,服務數字中國。
“路雖遠行則將至,事雖難不做不成”。相信燧原科技必將繼續努力,不忘初心,砥礪前行。
關于燧原科技
燧原科技專注人工智能領域云端算力平臺,開發自主知識產權的高算力、高能效比、可編程的通用人工智能訓練和推理產品,其創新性架構、互聯方案和分布式計算及編程平臺,可廣泛應用于云數據中心、超算中心、互聯網、金融及政務等多個人工智能場景,為人工智能產業發展提供普惠的算力基礎設施和解決方案。
燧原科技攜手業內國際標準組織,秉承開源開放的宗旨,與產業伙伴一起促進人工智能產業發展。
評論