智通財經APP獲悉,根據TrendForce集邦咨詢調查顯示,2023年HBM(High Bandwidth Memory)市場主流爲HBM2e,包含NVIDIA A100/A800、AMD MI200以及多數CSPs自研加速芯片皆以此規格設計。同時,爲順應AI加速器芯片需求演進,各原廠計劃于2024年推出新産品HBM3e,預期HBM3與HBM3e將成爲明年市場主流。
HBM各世代差異,主要以速度做細分。除了市場已知的HBM2e外,在進入HBM3世代時,産業出現較爲混亂的名稱。TrendForce集邦咨詢特別表示,目前市場所稱的HBM3實際需細分爲兩種速度討論,其一,5.6-6.4Gbps的HBM3;其二,8Gbps的HBM3e,別名HBM3P、HBM3A、HBM3+、HBM3 Gen2皆屬此類。
目前叁大原廠HBM發展進度如下,兩大韓廠SK海力士(SK hynix)、叁星(Samsung)先從HBM3開發,代表産品爲NVIDIA H100/H800以及AMD的MI300系列,兩大韓廠預計于2024年第一季送樣HBM3e;美系原廠美光(Micron)則選擇跳過HBM3,直接開發HBM3e。
HBM3e將由24Gb mono die堆棧,在8層(8Hi)的基礎下,單顆HBM3e容量將一口氣提升至24GB,此將導入在2025年NVIDIA推出的GB100上,故叁大原廠預計要在2024年第一季推出HBM3e樣品,以期在明年下半年進入量産。
CSP陸續啓動自研AI加速芯片計劃,欲擺脫對NVIDIA與AMD的依賴
觀察AI服務器(AI server)所用的加速芯片,其中英偉達(NVIDIA)Server GPU市占最高。然而,單張2萬-2.5萬美元的H100/H800,一台AI服務器建議配置約爲8張卡,也使得總體擁有成本(Total Cost of Ownership,TCO)大幅提升。TrendForce集邦咨詢觀察到,各雲端服務業者(CSP)雖然仍會向NVIDIA或超威(AMD)采購Server GPU,但也同步進行自研AI加速芯片的計劃。
除了已經推出的Google TPU與AWS Trainium和Inferentia外,Google與AWS正着手研發次世代自研AI加速芯片,將采用HBM3或HBM3e。TrendForce集邦咨詢表示,其他包含北美及中國的雲端服務業者亦有相關驗證進行中,預期未來AI加速芯片版圖競爭會更加激烈。