Nvidia 對組合封裝光學器件的認可意味著時機成熟

作者：時間：2025-03-28 來源：IEEE

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

期待已久的新興計算機網絡組件可能終于迎來了它的時刻。在上周于圣何塞舉行的 Nvidia GTC 大會上，該公司宣布將生產一款光網絡交換機，旨在大幅降低 AI 數據中心的功耗。該系統稱為組合封裝光學器件 （CPO）交換機，每秒可以將數十 TB 從一個機架中的計算機路由到另一個機架中的計算機。與此同時，初創公司 Micas Networks 宣布，它正在使用基于 Broadcom 技術的 CPO 交換機進行批量生產。

本文引用地址：http://www.j9360.com/article/202503/468786.htm

在當今的數據中心中，計算機機架中的網絡交換機由專用芯片組成，這些芯片與插入系統的光收發器電氣連接。（機架內的連接是電氣的，但一些初創公司希望改變這一點。可插拔收發器結合了激光器、光電路、數字信號處理器和其他電子設備。它們與交換機建立電氣鏈路，并在交換機側的電子位和沿光纖飛過數據中心的光子之間轉換數據。

共封裝光學器件通過將光/電數據轉換盡可能靠近開關芯片來提高帶寬和降低功耗。這簡化了設置，并通過減少所需的獨立組件數量和電子信號必須傳輸的距離來節省功耗。先進的封裝技術允許芯片制造商用多個硅光收發器小芯片包圍網絡芯片。光纖直接連接到封裝上。因此，除激光器外，所有組件都集成到一個封裝中，激光器由于使用非硅材料和技術制造，因此保持外部。（即便如此，CPO 在 Nvidia 硬件中的每 8 個數據鏈路中只需要一個激光器。

“具有 400000 個 GPU 的 AI 超級計算機實際上是一臺 24 兆瓦的激光器?！薄?nbsp;Ian Buck，Nvidia 公司

盡管這項技術看起來很有吸引力，但它的經濟性使其無法部署?！拔覀円恢痹诘却?CPO，”加州大學圣巴巴拉分校（University of California Santa Barbara）的共封裝光學專家兼 IEEE 研究員 Clint Schow 說，他已經研究這項技術 20 年了。談到 Nvidia 對技術的認可，他說該公司“不會這樣做，除非 [GPU 密集型數據中心] 無力花費電力。所涉及的工程是如此復雜，Schow 認為除非“用老辦法做事”是不值得的。

事實上，Nvidia 指出，即將到來的 AI 數據中心的功耗是一個動機。Nvidia 超大規模和高性能計算副總裁 Ian Buck 表示，在 AI 數據中心，可插拔光學器件消耗的“占 GPU 總計算能力的 10%，令人震驚”。在一個擁有 400,000 GPU 的工廠中，這將轉化為 40 兆瓦，其中一半以上僅用于為可插拔光學收發器中的激光器供電?！耙慌_擁有 400000 個 GPU 的 AI 超級計算機實際上是一臺 24 兆瓦的激光器，”他說。

光調制器

Broadcom 的方案與 Nvidia 的方案之間的一個根本區別是光調制器技術，該技術將電子位編碼到光束上。在硅光子學中，有兩種主要類型的調制器——Broadcom 使用的 Mach-Zender 調制器，它是可插拔光學器件的基礎，以及 Nvidia 選擇的微環諧振器。在前者中，通過波導傳播的光被分成兩個平行的臂。然后，每個臂都可以通過施加的電場進行調制，從而改變通過的光的相位。然后，臂重新連接形成單個波導。根據這兩個信號現在是同相還是異相，它們將相互抵消或合并。因此，電子位可以編碼到光上。

微環調制器要緊湊得多。環形波導不是沿兩條平行路徑分割光線，而是懸掛在光線主路徑的一側。如果光的波長可以在環中形成駐波，它將被虹吸掉，從主波導中過濾掉該波長。與磁環共振的確切波長取決于結構的折射率，該折射率可以通過電子方式控制。

然而，微環的緊湊性是有代價的。微環調制器對溫度敏感，因此每個調制器都需要一個內置的加熱電路，必須仔細控制并消耗功率。另一方面，馬赫-Zender 器件要大得多，導致更多的光線損失和一些設計問題，Schow 說。

期待已久的新興計算機網絡組件可能終于迎來了它的時刻。在上周于圣何塞舉行的 Nvidia GTC 大會上，該公司宣布將生產一款光網絡交換機，旨在大幅降低 AI 數據中心的功耗。該系統稱為共封裝光學器件（CPO）交換機，每秒可以將數十 TB 從一個機架中的計算機路由到另一個機架中的計算機。與此同時，初創公司 Micas Networks 宣布，它正在使用基于 Broadcom 技術的 CPO 交換機進行批量生產。

共封裝光學器件通過將光/電數據轉換盡可能靠近開關芯片來提高帶寬和降低功耗。這簡化了設置，并通過減少所需的獨立組件數量和電子信號必須傳輸的距離來節省功耗。先進的封裝技術允許芯片制造商用多個硅光收發器小芯片包圍網絡芯片。光纖直接連接到封裝上。因此，除激光器外，所有組件都集成到一個封裝中，激光器由于使用非硅材料和技術制造，因此保持外部。（即便如此，CPO 在 Nvidia 硬件中的每 8 個數據鏈路中只需要一個激光器。

“具有 400000 個 GPU 的 AI 超級計算機實際上是一臺 24 兆瓦的激光器。”— Ian Buck，Nvidia 公司

事實上，Nvidia 指出，即將到來的 AI 數據中心的功耗是一個動機。Nvidia 超大規模和高性能計算副總裁 Ian Buck 表示，在 AI 數據中心，可插拔光學器件消耗的“占 GPU 總計算能力的 10%，令人震驚”。在一個擁有 400,000 GPU 的工廠中，這將轉化為 40 兆瓦，其中一半以上僅用于為可插拔光學收發器中的激光器供電?！耙慌_擁有 400000 個 GPU 的 AI 超級計算機實際上是一臺 24 兆瓦的激光器，”他說。

光調制器

Schow 說，Nvidia 成功地將基于微環的硅光子引擎商業化是“一項了不起的工程壯舉”。

Nvidia CPO 交換機

據 Nvidia 稱，在新的 AI 數據中心采用 CPO 交換機將使激光器數量增加四分之一，將傳輸數據的功率效率提高 3.5 倍，將信號從一臺計算機準時傳輸到另一臺計算機的可靠性提高 63 倍，使網絡對中斷的彈性提高 10 倍，并允許客戶將部署新數據中心硬件的速度提高 30%。

Nvidia 首席執行官黃仁勛表示：“通過將硅光子學直接集成到交換機中，Nvidia 打破了超大規模和企業網絡的舊限制，并為擁有數百萬個 GPU 的 AI 工廠打開了大門。

該公司計劃推出兩類交換機，即 Spectrum-X 和 Quantum-X。該公司表示，Quantum-X 將于今年晚些時候推出，它基于 Infiniband 網絡技術，這是一種更面向高性能計算的網絡方案。它從 144 個端口中的每個端口提供 800 Gb/s，其兩個 CPO 芯片是液冷而不是風冷，越來越多的新 AI 數據中心也是如此。網絡 ASIC 包括 Nvidia 的 SHARP FP8 技術，該技術允許 CPU 和 GPU 將某些任務卸載到網絡芯片。

Spectrum-X 是一種基于以太網的交換機，可以從總共 128 或 512 個端口提供每秒約 100 TB 的總帶寬，從 512 或 2048 個端口提供 400 Tb/s 的總帶寬。硬件制造商預計將于 2026 年準備好 Spectrum-X 交換機。

Nvidia 多年來一直致力于基礎光子學技術。但是，需要與 11 個合作伙伴（包括 TSMC、Corning 和 Foxconn）合作，才能實現商業化狀態。

Nvidia 光互連產品總監 Ashkan Seyedi 強調，這些合作伙伴帶來的技術必須經過協同優化以滿足 AI 數據中心需求，而不是簡單地從這些合作伙伴的現有技術組裝而成，這一點非常重要。

“CPO 實現的創新和節能與您的包裝方案、包裝合作伙伴和包裝流程密切相關，”Seyedi 說。“新穎性不僅在于直接的光學元件，還在于它們如何以高產量、可測試的方式進行封裝，您可以以合理的成本進行管理?！?/p>

測試尤為重要，因為該系統是許多昂貴組件的集成。例如，Quantum-X 系統中的兩個 CPO 中每個 CPO 都有 18 個硅光子學小芯片。每個激光器都必須連接到 2 個激光器和 16 根光纖。Seyedi 說，該團隊必須開發幾個新的測試程序才能正確無誤并追蹤錯誤悄然出現的位置。

Micas Networks 交換機

An advanced switch system labeled Micas.

Micas Networks 已經投入生產，其交換機基于 Broadcom 的 CPO 技術。云母網絡

Broadcom 光學系統部門產品營銷高級經理 Robert Hannah 解釋說，Broadcom 為其 Bailly CPO 開關選擇了更成熟的 Mach-Zender 調制器，部分原因是它是一種更加標準化的技術，可能使其更容易與現有的可插拔收發器基礎設施集成。

Mica 的系統使用單個 CPO 組件，該組件由 Broadcom 的 Tomahawk 5 以太網交換芯片組成，周圍環繞著八個 6.4 Tb/s 硅光子學光引擎。風冷硬件現已全面投產，領先于 Nvidia 的 CPO 開關。

Hannah 稱 Nvidia 的參與是對 Micas 和 Broadcom 時機的認可?！皫啄昵埃覀儧Q定滑到冰球要去的地方，”Micas 的首席運營官 Mitch Galbraith 說。他說，隨著數據中心運營商爭先恐后地為其基礎設施供電，CPO 的時代似乎已經到來。

與配備標準可插拔收發器的系統相比，新交換機有望節省 40% 的功耗。然而，Mica 企業戰略副總裁 Charlie Hou 表示，CPO 更高的可靠性同樣重要。他說，“鏈路抖動”是可插拔光鏈路瞬態故障的術語，是導致本已非常長的 AI 訓練運行延長的罪魁禍首之一。CPO 預計鏈路抖動會更少，因為信號路徑中的組件較少，以及其他原因。

未來的 CPO

Schow 建議，數據中心希望從 CPO 中獲得的大型節能產品大多是一次性的好處。在那之后，“我認為這將成為新常態。然而，對電子設備其他功能的改進將使 CPO 制造商至少在一段時間內繼續提高帶寬。

Schow 懷疑單個硅調制器（在 Nvidia 的光子引擎中以 200 Gb/s 的速度運行）是否能夠超過 400 Gb/s。然而，其他材料，如鈮酸鋰和磷化銦，應該能夠超過這個數字。訣竅是以經濟實惠的方式將它們與硅組件集成，總部位于圣巴巴拉的 OpenLight 和其他小組正在研究這一點。

與此同時，可插拔光學器件并沒有停滯不前。本周，Broadcom 推出了一種新的數字信號處理器，該處理器可能會導致 1.6 Tb/s 收發器的功耗降低 20% 以上，部分原因是采用了更先進的硅工藝。

Avicena、Ayar Labs 和 Lightmatter 等初創公司正在努力將光學互連一直引入 GPU 本身。前兩者開發了小芯片，旨在與 GPU 或其他處理器放在相同的封裝中。Lightmatter 更進一步，使硅光子學引擎成為未來芯片 3D 堆疊的封裝基板。

a一级爱做片免费观看欧美,久久国产一区二区,日本一二三区免费,久草视频手机在线观看

新聞中心

Nvidia 對組合封裝光學器件的認可意味著時機成熟

評論

相關推薦

技術專區