Skip to main content
文章

高效能運算電源常見問題

這些常見問題涵蓋了高效能運算以及一些當前可用的創新解決方案相關的電源系統設計問題。

Data center image

作者:Anish Jacob,HPC 首席現場應用工程師

高效能晶片有哪些特徵?

當代 GPU 有數百億顆電晶體。更好的處理器效能是以指數級增長的電源需求為代價的,因此人工智慧(AI)和機器學習(ML)等應用的高效能處理器需要不斷增加功率。同時,由於先進的處理器節點實現了電流的增長,核心電壓正在下降。

在高達 2000A 的峰值電流越來越普遍之際,一些 xPU 公司正在評估多軌方案,將內核主電源軌分成五個或五個以上小電流電源輸入。

此外,機器學習工作負載的高動態性還將導致晶片出現持續數微秒的高 di/dt 瞬態。這些瞬態會在高性能處理器模組或加速卡的 PDN 上產生應力。

高效能運算的電流峰值需求水准是多少?

現時的趨勢是處理器的功耗每兩年翻一番。2000A 的峰值電流現在已經很普遍。

限制高效能運算效能進一步提高的因素有哪些?

在大多數情况下,供電現已成了運算效能的限制因素。如果提供適當的電源,處理器效能還能更高。供電不僅涉及配電,而且還涉及供電網路(PDN)的效率、規模、成本和散熱效能。PCB 空間有限,因此高功率密度組件是優化 PDN 的最佳選擇。

PDN 不僅會受到功率水准的進一步挑戰,而且還會受到可能產生電壓尖峰的高動態工作負載的挑戰; 這些可能會干擾或損壞精密的處理器。數量龐大的其它 PCB 組件也需要佔用空間,通過電源佈線來限制這種情況就變得非常複雜。PDN 還會受 I2R 損耗的影響,這不僅會降低效率,而且如果管理不當還會產生散熱問題。

為什麼 AI 或高效能運算的電流難以管理?

人工智慧/高效能運算電流難以管理有兩個原因:首先,隨著負載和電流的新增,更大的電流可能很快會導致整個供電網絡中無法支撐的 I2R 損耗。

其次,由於消耗的峰值和空閒電流之間絕對差的新增,應對瞬態的難度更大。此外,還有更高的 di/dt。

而且還需要大量的外部插座電容器來將負載電流保持在紋波包絡內。

48V 為什麼是“新 12V”? 有哪些挑戰?

挑戰有兩個。首先,為了提高資料中心的整體效率,他們正在從 12VDC 電源軌遷移至 48VDC 電源軌。因此,印刷電路板輸入和最終轉換級之間的電流下降為 1/4,相應的歐姆損耗(I2R)下降為 1/16。

與此同時,CPU 內核電壓下降到了遠低於 1V 的水准。因此,電源電壓和負載點電壓之間的差距正在擴大,這是這是第二個值得關注的問題,穩壓器效率會隨電壓差的新增而降低。

為什麼傳統的供電方式不能勝任?

在典型的處理器封裝中,所有電流均被中間內核消耗掉了。也就是說,即使穩壓器部署在封裝邊緣附近,大電流到達內核仍然必須經過相當長一段距離。 該電流路徑被稱為“最後一英寸”距離,受 PCB 電阻損耗以及寄生電感及電容的影響。

在傳統的多相穩壓器方案中,電流越大,相位就越多。 由於大多數多相穩壓器為分立式器件,因此電感器和開關必須單獨佈局,而且在大多數情况下,還必須單獨散熱。因此,相位越多,穩壓器就越大,會新增處理器附近佈局挑戰。

此外,任何使用常規多相電源解決方案都必須調整尺寸,才能適應不同的峰值電流。 相比之下,Vicor 設計只需針對穩態條件進行尺寸調整,因為 Vicor VTM 模組可針對瞬態提供 2 倍的額定功率。

如何緩解 AI/HPC 的供電挑戰?

Vicor 分比式電源架構(FPA)是針對當前激增的高效能運算需求提供更高效電源的基礎。 FPA 將電源轉換器的任務分為穩壓和變壓的專用功能。將這兩種功能分開,可對其進行單獨優化,以實現高效率和高密度。與正弦振幅轉換器(SAC)拓撲相結合的FPA支撐了幾個創新的電源架構,解决當前的高效能處理器的電源需求。

Vicor 利用 FPA,可通過專有架構、橫向供電(LPD)和垂直供電(VPD)最大限度降低“最後一英寸”電阻。在 LPD 中,兩個電流倍增器(Vicor VTM™ 模組)位於處理器的上下側或左右側。

垂直供電是在低內核電壓下以最低 PDN 電阻提供大電流的終極管道。 在這種情況下,電流倍增器直接安裝在處理器正下方。 其在這兩種情况下,都能顯著降低最後一英寸損耗。

此外,在極高電流的情况下,還可結合這兩種方法來優化 PCB 的使用。

對於 VPD,最終電流倍增器級和旁路電容器可以相互堆疊,形成一個集成型電源模組(geared current multiplier),可取代旁路電容器組合,直接安裝在處理器下麵。

為什麼封裝技術對 AI/HPC 供電解決方案很重要?

雖然用於實施高效能穩壓器的拓撲和架構很重要,但封裝技術也很重要。Vicor 的 SM ChiP ™ (Converter housed in Package)封裝將無源、磁性、FET 和控制等所有組件都集成在一個統一的器件中。

此外,該封裝經過精心設計,能够以最低的熱阻抗,實現最高效的電流選取,從而可增强散熱性。 許多 SM-ChiP 還包括通過器件重要表面實現的接地金屬遮罩。這不僅有助於散熱,而且還可將高頻率寄生電流旁路,以防止將其傳播到器件外。

如何在 48V 中間母線電源系統中使用原有 12V 單元?

隨著系統功率不斷提高,各資料中心正紛紛部署 48V 供電網路(PDN);基於 48V 的架構在保持安全超低電壓(SELV)水准的同時,可最大限度提高供電網路的效率。

因此,開放式電腦項目(OCP)正在通過其開放式機架標準 V2.2 為向 48V 過渡提供支援,這不僅可滿足分佈式 48V 服務器背板架構的需求,而且還可為 AI 開放式加速器模組(OAM)提供 48V 標準工作電壓。

這些新標準要求 48V 至 12V 與 12V 至 48V 相容,以便為處理器的原有 12V 背板及 12V 多相位 VR 提供支援。然而,常規 1/8 及 1/4 開放式框架磚型轉換器非常笨重,無法滿足先進系統的功率密度需求。此外,常規轉換器拓撲的低效率會降低 48V 的配電增益。

Vicor 推出的全新高密度、高效率模組解決方案可用於將 48V 至 12V 系統與 12V 至 48V 系統橋接起來。這些固定比率的穩壓轉換器以其固有的效率優勢實現了 48V PDN 部署,同時減輕了重新設計 12V 傳統系統的負擔。這些轉換器不僅設定了新的功率轉換效能標準,而且還帶來了面向各種應用需求的選項。

資料中心的電源使用效率(PUE)對高效能運算供電網路有何影響?

資料中心的 PUE 反映了進入資料中心的電力有多少用於非運算工作、有多少用於電腦 PDN。

Vicor 如何設計高效的 AI/HPC 供電網路?

雖然每個設計都各不相同,但 Vicor 會通過有條不紊的七個步驟來優化有特定用途的 PDN:

  1. 瞭解整個應用。 應用的主要功能是什麼,哪些與電源相關的功能可以實現進一步提升?
  2. 看看客戶過去和現在的解決方案,弄清楚我們可以改進的地方。
  3. 檢索需求(CART 檔案)並推薦相應的 PRM™ 和 VTM。
  4. 基於現有評估板準備的原理圖和佈局。
  5. 經過現場及工廠應用的徹底稽核後,客戶製作了一些測試板。
  6. 然後將這些測試板放在工作臺上,運行多種類型的測試(針對瞬態、相位/增益裕度等進行環路調諧)。
  7. 一旦客戶滿意,我們就會保存上一步的所有設定,然後將資訊發給工廠進行批量生產。

為什麼邊緣運算特別具有挑戰性?

邊緣運算的成功取決於適當硬體的可用性;系統能够經濟地提供必要的處理速度和能力,同時還能經受在常規資料中心之外遇到的不太穩定、不可預測性更大的環境考驗。

邊緣運算硬體必須包含緊湊、節能的解決方案,可廣泛部署在空間有限的惡劣環境中,讓運算更接近感測器以及其它資料來源。這些硬體包括供電網路以及大型的常規低壓電源解決方案。這些都無法支持邊緣不斷增長的功率密度和小型化,是邊緣運算創新的主要瓶頸。

Vicor 技術如何助力實現邊緣運算供電?

Vicor 技術可用於設計高度可擴充的緊湊邊緣運算資源,其可在惡劣外部環境中蓬勃發展。

這些資源不僅可解决較短電力走線上信號完整性的技術瓶頸問題,同時還可提供極為緊湊的高效率電源轉換以及低功耗散熱與工程設計。除了不受限於設備、靈活和可擴充之外,該系統還具有高效能,與傳統系統相比,至少可降低 40% 的能耗。

Vicor 高功率密度、高效率的電源模組有助於實現散熱良好而且節能的緊湊固態 EMDC 設計。

Anish Jacob 是 Vicor 公司的首席現場應用工程師,主要專注於資料中心和人工智慧市場。 他畢業於俄亥俄州立大學和南加州大學並獲學位證書,自 2015 年 4 月以來一直是 Vicor 團隊的重要成員,具有扎實的專業技術,可為客戶提供尖端解決方案和支持。

Anish Jacob

Anish Jacob,HPC 首席應用工程師

資源

Contact Form

聯絡 Vicor

感謝您與我們聯絡。

您將在一個工作日內收到答覆。