Investing.com -- 根據TrendForce最近的研究,NVIDIA GB200機架式解決方案需要進一步優化和調整其供應鏈。GB200機架複雜的設計規格,包括高速互連接口和超出市場標準的熱設計功耗(TDP)要求,是導致這一需求的主要原因。因此,TrendForce預測,量產和出貨高峰可能會在2025年第二季度至第三季度之間發生。
NVIDIA的GB機架系列,包括GB200和GB300型號,具有複雜的技術和較高的生產成本。這使其成為大型雲服務提供商(CSP)和其他潛在用戶(如二級數據中心、國家主權雲提供商以及從事高性能計算(HPC)和人工智能(AI)應用的學術研究機構)的首選解決方案。預計GB200 NVL72型號將在2025年最受歡迎,可能佔總部署量的80%,因為NVIDIA正在加大市場推廣力度。
NVIDIA專有的NVLink技術是該公司提升AI和HPC服務器系統計算性能戰略的核心。這項技術允許GPU芯片之間進行高速連接。GB200使用第五代NVLink,提供的總帶寬顯著超過當前行業標準PCIe 5.0。
2024年主導市場的HGX AI服務器的TDP通常在每機架60 kW到80 kW之間。然而,GB200 NVL72的TDP達到每機架140 kW,使功率需求翻倍。這導致製造商加快採用液冷解決方案,因為傳統的空氣冷卻方法無法處理如此高的熱負載。
GB200的先進設計要求引發了對組件供應和系統出貨可能延遲的擔憂。TrendForce表示,Blackwell GPU芯片的生產大體按計劃進行,預計2024年第四季度只有有限的出貨。從2025年第一季度開始,產量預計將逐漸增加。然而,由於AI服務器系統組件的供應鏈仍在持續調整,2024年底的出貨量預計將低於行業預期。因此,TrendForce預測GB200全機架系統的出貨高峰期將延遲到2025年第二季度至第三季度之間。
GB200 NVL72的140 kW TDP使液冷成為必要,因為它超出了傳統空冷解決方案的能力。液冷組件的採用正在加速,行業領先企業正大力投資液冷技術的研發。
值得注意的是,冷卻液分配單元(CDU)供應商正努力通過增加機架尺寸和開發更高效的冷板設計來提高冷卻效率。目前的側置CDU可以散熱60 kW到80 kW,但未來的設計預計將使這一冷卻能力翻倍甚至增加三倍。液對液行間CDU系統的開發使冷卻性能超過1.3 mW,隨著計算能力需求的持續增長,預計還會有進一步的改進。
此文章由人工智能協助翻譯。更多資訊,請參閱我們的使用條款。