a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

EEPW首頁 > 測試測量 > 設計應用 > 是德科技推出AI數據中心構建器以驗證和優化網絡架構和主機設計

是德科技推出AI數據中心構建器以驗證和優化網絡架構和主機設計

作者: 時間:2025-04-06 來源:EEPW 收藏


本文引用地址:http://www.j9360.com/article/202504/469064.htm

●   通過模擬真實工作負載驗證AI基礎設施的性能

●   通過評估新算法、組件或協議提高AI訓練的性能

●   在不投資昂貴的大規模部署的情況下,調整和優化AI工作負載和系統基礎設施的參數

1743913429127056.png

Keysight AI (KAI)是一款先進的軟件套件,通過模擬真實工作負載來評估新算法、組件和協議對AI訓練性能的影響

近日推出Keysight AI (KAI),這是一款先進的軟件套件,通過模擬真實工作負載來評估新算法、組件和協議對AI訓練性能的影響。KAI的工作負載模擬功能將大型語言模型(LLM)和其他人工智能(AI)模型訓練工作負載集成到AI基礎設施組件的設計和驗證中——包括網絡、主機和加速器。該解決方案實現了硬件設計、協議、架構和AI訓練算法之間的更緊密協同,提升系統性能。

AI服務提供商使用各種并行處理策略(也稱為數據或模型并行)來加速AI模型訓練。將模型并行與AI集群拓撲和配置對齊可以提高訓練性能。在AI集群設計階段,關鍵問題最好通過實驗來回答。許多問題集中在圖形處理單元(GPU)之間的數據傳輸效率上。關鍵考慮因素包括:

●   AI主機或機架內GPU互連的scale up設計

●   Scale out網絡設計,包括每個GPU的帶寬和拓撲

●   網絡負載均衡和擁塞控制的配置

●   訓練框架參數的調整

KAI數據中心構建器的工作負載模擬解決方案再現了真實AI訓練任務的網絡通信模式,加速實驗,降低達到熟練程度所需的學習曲線,并更深入洞察性能下降的原因,這些是通過真實AI訓練任務實驗難以獲得的。客戶可以訪問包括GPT和Llama在內的LLM工作負載庫,以及數據并行(DP)、全分片數據并行(FSDP)和三維(3D)并行等流行的模型分區方案。

使用KAI數據中心構建器中的工作負載模擬應用程序,AI服務提供商可以:

●   實驗并行參數,包括并行數據大小及其在可用AI基礎設施上的分布(調度)

●   了解并行內和并行間通信對整體任務完成時間(JCT)的影響

●   識別低性能的集合通信操作并深入識別瓶頸

●   分析網絡利用率、尾部延遲和擁塞,了解它們對JCT的影響

KAI數據中心構建器的新工作負載模擬功能使AI服務提供商、GPU云提供商和基礎設施供應商能夠將真實的AI工作負載引入其實驗室環境,以驗證AI集群和新組件的不斷演變的設計。他們還可以通過實驗微調模型并行方案、參數和算法,以優化基礎設施并提高AI工作負載性能。

網絡測試與安全解決方案副總裁兼總經理Ram Periakaruppan表示:“隨著AI基礎設施規模和復雜性的增長,對全棧驗證和優化的需求變得至關重要。為了避免昂貴的延誤和返工,必須將驗證轉移到設計和制造周期的早期階段。KAI數據中心構建器的工作負載模擬為AI組件和系統設計提供了非常高的真實性,優化工作負載以實現最佳性能。”

KAI數據中心構建器是是德科技人工智能(KAI)架構的基礎,這是一系列端到端解決方案,旨在通過使用真實AI工作負載模擬驗證AI集群組件,幫助客戶在數據中心擴展人工智能(AI)處理能力。

是德科技在2025年4月1日至3日于舊金山Moscone中心舉行的OFC 2025會議上展示KAI數據中心構建器及其工作負載模擬功能,展位號1301。



評論


相關推薦

技術專區

關閉