智通財經APP獲悉,國盛證券發佈研究報告稱,英偉達(NVDA.US)正式推出H200,算力再提速。本週英偉達正式推出HGX H200,發佈時間早於此前預期的2024年,該機構認爲,算力硬件競爭激烈,英偉達未來或將繼續加速新品發佈節奏,此舉有望再加速AI進程。
國盛證券主要觀點如下:
OpenAI意外改組,AGI進程不變。據OpenAI官網報道,Sam Altman 將辭去 CEO 職位並離開董事會,該公司CTO米拉·穆拉蒂 (Mira Murati) 將擔任臨時首席執行官。市場擔心Sam Altman的離職將影響OpenAI的研發進程,但該機構認爲,AGI的全球進程已然開啓,並不會因爲OpenAI的人員變動而改變,同時,OpenAI作爲行業領跑者也在“摸着石頭過河”,人員和組織調整亦屬正常,短期內或利好Anthropic、X.ai等競爭對手以及Google、亞馬遜、特斯拉、Meta等玩家。
AI硬件的長期戰略焦點:打破“通信牆”。微觀H200 SXM的性能參數,其首次採用HBM3e工藝,141GB的顯存帶寬達到4.8TB/s,與H100 SXM相比,顯存擴大76%的同時帶寬提升了43%。早在2008年,AMD就率先意識到了通信牆問題並提出了HBM(High-Bandwidth Memory)概念,以充分發揮遊戲顯卡的潛力。而當今的AI訓練推理亟需超大內存來承載千億參數量、TB級別大小的大模型,內存性能也順理成章成爲AI算力的瓶頸所在。對比來看,根據英偉達數據,內存升級帶來了同比例甚至更高的性能升級,也證明了打破通信牆是提升顯卡性能的有效方法。
AI硬件的強力輔助——算力調優。英偉達表示未來的軟件更新預計將爲H200帶來額外的性能領先優勢。以英偉達TensorRT開源庫爲例,其可以幫助開發人員優化推理過程,通過稀疏化矩陣降低一部分不必要的精度,從而降低token輸出的延遲、增強token吞吐量。當下市場主要聚焦於算力的最核心環節顯卡,市場普遍聚焦於企業擁有的顯卡數量,紙面算力等數據,而忽略了服務器到貨只是整個算力鏈條的第一步,軟件側的算力調優也是重要一環,通過一站式的模型末端調優服務,實現推理準確性與落地成本的平衡,這亦是打造超算互聯網需要考慮的場景。
硬件加快迭代,帶動光通信再提速。根據英偉達的技術路線圖,原本1.6T光模塊計劃在2025年大規模應用,現在隨着H200提前發佈,整個技術路線的迭代隨之加速,1.6T時代也有望更早來臨。市場此前存在疑慮,光模塊的需求量可能在一兩年內或隨着800G充分放量而步入下行階段。AI應用快速迭代成長,算力需求並未見頂,供應側利好頻出,新興業務蓬勃發展,投資者情緒高漲,當下應積極關注算力板塊後續發展。
算力——
算力調優/調度/租賃:恆爲科技、思特奇、中科金財、東方材料、博睿數據、中貝通信、恆潤股份、中科曙光、中國移動、中國聯通、中國電信。
光通信:中際旭創、新易盛、天孚通信、太辰光、騰景科技、德科立、聯特科技、華工科技、源傑科技、劍橋科技、銘普光磁。
算力設備:中興通訊、紫光股份、銳捷網絡、盛科通信、菲菱科思、恆爲科技、工業富聯、寒武紀、震有科技。
液冷:英維克、申菱環境、高瀾股份、佳力圖。
邊緣算力承載平臺:美格智能、廣和通、移遠通信、初靈信息、龍宇股份、網宿科技、佳訊飛鴻。
衛星通信:三大運營商、中國衛通、中國衛星、震有科技、華力創通、電科芯片、海格通信。
數據要素——
運營商:中國電信、中國移動、中國聯通。
數據可視化:浩瀚深度、恆爲科技、中新賽克。
BOSS系統:亞信科技、天源迪科、東方國信。
風險提示:AI發展不及預期,算力需求不及預期,市場競爭風險。