升級電源和機架架構,滿足AI服務器的需求
前言
本文引用地址:http://www.j9360.com/article/202502/467262.htm人工智能(AI)的迅猛發展推動了數據中心處理能力的顯著增長。如圖1所示,英飛凌預測單臺GPU的功耗將呈指數級上升,預計到2030年將達到約2000 W [1],而AI服務器機架的峰值功耗將突破驚人的300 kW。這一趨勢促使數據中心機架的AC和DC配電系統進行架構升級,重在減少從電網到核心設備的電力轉換和配送過程中的功率損耗。
圖1 基于x86和Arm?架構的服務器CPU與GPU和TPU的電力需求對比
圖2(右)展示了開放計算項目(OCP)機架供電架構的示例。每個電源架由三相輸入供電,可容納多臺PSU;每臺PSU由單相輸入供電。機架將直流電壓(例如,50 V)輸出到母線,母線則連接到IT和電池架。
AI的發展趨勢要求對PSU功率進行革新,如圖2(左)所示。接下來,我們將通過各代PSU的拓撲結構和器件技術建議示例,來逐步介紹這些PSU的演變。
圖2 AI服務器PSU的功率演變(上);服務器機架架構示例(下)
AI服務器機架PSU的趨勢和功率演進
第一代AI PSU:在相同的架構下提升功率,~5.5-8 kW、50 Vout、277 Vac、單相
當前的AI服務器PSU大多遵循ORv3-HPR標準[9]。相較于先前的ORv3 3 kW標準[9],該標準的大部分要求(包括輸入和輸出電壓以及效率)保持不變,但增加了與AI服務器需求相關的更新,例如,更高的功率和峰值功率要求(稍后詳述)。此外,由于與BBU架的通信方式有所調整,輸出電壓的調節范圍變得更窄。
盡管每個電源架都通過三相輸入(400-480 Vac L-L)供電(見圖2),但每臺PSU的輸入仍為單相(230-277 Vac)。圖3展示了符合ORv3-HPR標準的第一代PSU的部署示例:PFC級可以采用兩個交錯的圖騰柱拓撲結構,其中,650 V CoolSiCTM MOSFET用于快臂開關,600 V CoolMOSTM SJ MOSFET用于慢臂開關。DC-DC級可以選用650 V CoolGaNTM晶體管的全橋LLC,次級全橋整流器和ORing則使用80 V OptiMOSTM Power MOSFET。此外,示例還展示了一個中間級,也稱“延長保持時間”或“小型升壓”,其作用是減小大容量電容器的尺寸。該中間級由一個升壓轉換器組成,在線路周期掉電事件期間,通過儲能電容器放電,以調節LLC輸入電壓。在正常運行期間,升壓轉換器保持空閑狀態,并通過低阻抗的600 V CoolMOSTM SJ MOSFET旁路。
圖3 第一代AI PSU的拓撲結構及器件技術示例
第二代AI PSU:增加線路電壓,以實現更高的功率,~8-12 kW、50 Vout、277–347 Vac、單相
如上所述,隨著機架功率增加到300 kW以上,電源架的功率密度變得至關重要。因此,下一代PSU的設計方向是,在單相架構中實現8 kW至12 kW的輸出功率。隨著每個機架的功率增加,數據中心中的機架數量在某些情況下,可能會受配電電流額定值和損耗的約束。因此,為了降低交流配電的電流和損耗,部分數據中心可能會將機架的交流配電電壓從400/480 V提高到600 Vac L–L(三相),同時將PSU的輸入電壓從230/277 Vac提高到 347 Vac(單相)。
雖然這一變化有利于數據中心的運行效率和資源利用,但會影響PSU的額定電壓和設計。在347 Vac的輸入電壓下,PFC的輸出電壓必須設定在575 Vdc左右,這意味著傳統的650 V器件的額定電壓已無法滿足要求。圖4展示了一個示例:第一代 PSU使用的兩電平圖騰柱PFC被替換為400 V CoolSiCTM MOSFET 的三電平飛電容圖騰柱PFC(3-L FCTP PFC)級。多電平功率轉換概念使得在使用較低額定電壓的開關器件的同時,支持更高的輸入電壓。憑借多電平拓撲結構的頻率倍增效應,3-L FCTP PFC能夠帶來更高的效率和功率密度。最重要的是,CoolSiCTM技術針對400 V的較低擊穿電壓進行了優化,與650 V 和 750 V CoolSiCTM參考器件相比,其FoM更為優異(見圖5(左))。此外,圖5(右)顯示了導通電阻在整個溫度范圍內的曲線,其中,400 V CoolSiCTM MOSFET的RDS(on) 100°C僅比RDS(on) 25°C高11%。RDS(on)與Tj之間的這一平緩關系有助于CoolSiCTM MOSFET實現更高的RDS(on) typ,從而降低成本并提升開關性能。
圖4 第二代AI PSU的拓撲結構和器件技術示例
圖5 400 V CoolSiCTM與650 V和750 V CoolSiCTM對比,具有更優的開關 FoM和穩定的RDS(on)與結溫的關系:品質因數(上),RDS(on)與Tj(下)
對于DC-DC級來說,三相LLC拓撲結構是一種理想選擇,其中,750 V CoolSiCTM MOSFET用于初級側開關,80 V OptiMOSTM 5 Power MOSFET用于次級全橋整流器和ORing。由于增加了第三個半橋開關臂,該解決方案能夠提供更高的功率,有效降低輸出電流的紋波,并通過三個開關半橋之間的固有耦合實現自動電流分配。
第三代AI PSU:三相架構與400 V配電,最高功率約為22 kW,400 Vout,480-600 Vac,三相
為了進一步提高機架功率,第三代AI PSU將采用更具顛覆性的機架架構,具體如下:
● PSU輸入:從單相轉為三相,以提高功率密度,并降低成本
● 電源架PSU輸出電壓:從50 V提升到400 V,以降低母線電流、損耗和成本
圖6展示了一個三相輸入、400 V輸出的PSU部署示例,以及推薦的器件和技術。PFC級采用Vienna整流器,這是一種常用于三相PFC應用的拓撲結構。其主要優勢在于采用分離式總線電壓設計,因此可以使用650 V器件:通過使用雙倍數量的背靠背650 V CoolSiCTM MOSFET和 1200 V CoolSiCTM二極管實現。PFC輸出配置為分離式電容器,每個電容器電壓為430 V,并為全橋LLC轉換器供電,該轉換器在初級和次級側均使用650 V CoolGaNTM晶體管。兩個LLC級在初級側串聯,次級側并聯,以向400 V母線供電。
此外,也可以將兩個背靠背的650 V CoolSiCTM MOSFET替換為650 V CoolGaNTM 雙向開關(BDS),后者是真正的常關型單片雙向開關。這意味著一個CoolGaNTM BDS即可取代4個分立式電源開關,以實現相同的RDS(on),這是因為它在RDS(on)/mm2方面具備更高的芯片尺寸利用率。
圖6 第三代AI PSU的拓撲結構和器件技術示例
WBG為 AI PSU帶來的優勢
CoolGaNTM助力實現高峰值功率瞬變
寬禁帶(WBG)半導體(例如,CoolGaNTM[2])能夠在更高的開關頻率下,實現最佳效率,使轉換器在不影響轉換效率的前提下,實現更高的功率密度,因此,成為AI PSU的理想選擇。
除了AI PSU的額定功率顯著增加外,GPU在運行時還會拉動更高的峰值功率,并產生高負載瞬變(見圖7)。因此,DC-DC級的輸出必須具有足夠的動態響應能力,同時需確保電壓的過沖和下沖保持在規定的范圍內。通過提升開關頻率,并增加控制環路帶寬,可以提高DC-DC級的輸出動態響應能力。
圖7 AI GPU所需的AI PSU峰值功率
400V CoolSiCTM MOSFET可在3-L飛電容圖騰柱PFC中實現最高效率
使用 CoolSiCTM MOSFET 400 V的三電平級飛跨電容圖騰柱PFC(3-L FCTP PFC)不僅能夠實現更高的交流輸入電壓(見第2.2節),且相較CoolSiCTM 650 V和750 V參考器件,其品質因數(FoM)更佳,因此還能提供顯著的功率密度和效率優勢。經過優化的電感器設計(包括尺寸、材料和繞組)和3L拓撲結構中的RDS(on)選擇,結合更低的開關損耗,能夠實現平緩的效率曲線:峰值效率超過99.3%,滿載效率超過99.15%(見圖8)。
圖8 效率對比:3-L FCTP PFC與2-L TP PFC
結論
為了滿足數據中心對AI應用的需求,新一輪技術角逐已經啟動,推動了機架和PSU的電力需求大幅增長。其中,AI PSU的功率需求已經從3-5.5 kW,提升到8-12 kW(單相)和高達22 kW(三相)。這種需求給數據中心運營商帶來了新的挑戰,即如何優化數據中心的空間和電力的效率和利用率。應對這些挑戰需要采用新的機架架構和AC-DC配電配置,使得基于CoolSiCTM和CoolGaNTM的設計處于PSU設計的前沿,致力于實現最佳效率和功率密度。
此外,新的寬禁帶器件在新型拓撲結構中也展現了極佳的性價比,例如,在三電平飛跨電容圖騰柱PFC中采用400 V CoolSiCTM MOSFET,或在三相Vienna PFC中使用650 V CoolGaNTM BDS(詳見前文)。
總而言之,英飛凌的功率器件技術組合(硅、碳化硅和氮化鎵)和經過優化的柵極驅動IC產品組合,通過混合應用,為當前和下一代平臺及趨勢的發展提供了支持。這些組合充分利用了三種技術的優勢,使PSU設計實現了最佳靈活性,并在效率、功率密度和系統成本之間達成平衡。此外,英飛凌還率先推出了全球首項300毫米氮化鎵功率半導體等先進技術,進一步推動了文章[10]中所述的未來設計發展。
參考文獻
[1] Infineon Technologies AG: We power AI, Online Media Briefing
[2] Infineon Technologies AG: Wide Bandgap Semiconductors (SiC/GaN)
[3] Infineon Technologies AG: GaN transistors (GaN HEMTs)
[4] Infineon Technologies AG: Silicon Carbide MOSFET Discretes
[5] Infineon Technologies AG: Server and data center 3 kW 50 V PSU – Engineering report
[6] Infineon Technologies AG: 3300 W CCM bidirectional totem pole with 650 V CoolSiC? and XMC?– Infineon Technologies application note
[7] Infineon Technologies AG: CoolSiC? totem-pole PFC design guide and power loss modeling– Infineon Technologies application note
[8] Infineon Technologies AG: CoolGaN? totem-pole PFC design guide and power loss modeling – Infineon Technologies application note
[9] Open Compute Project Foundation: ORv3-HPR standard
[10] Infineon Technologies AG: Infineon pioneers world's first 300 mm power gallium nitride (GaN) technology – an industry game-changer
[11] Infineon Technologies AG: Powering AI PSU solutions
評論