英偉達,最“大”對手來了

發布 2026-5-15 上午09:01

英偉達公司 (NASDAQ:NVDA)的真正「大」對手來了。

5月14日,Cerebras以488億美元的估值,超額認購超過20倍登陸納斯達克。

據說這是今年來全球最大估值規模的IPO。

要知道,就在8個月前,這家公司估值還只有81億美元。現在等於翻了6倍,可見現在的市場對於AI鏟子股究竟有多瘋狂。

AI推理是時代來了,但英偉達的GPU不再是唯一解。

市場憑什麼認為Cerebras,能夠撼動英偉達的地位?



01

推理新王



2026年,隨著推理需求大爆發,傳統GPU架構在推理場景的物理瓶頸愈發凸顯,而Cerebras晶圓級晶片,為破解這一難題提供了顛覆性方案。

黃仁勳在GTC2026上明確提出:AI推理拐點已至。

據德勤數據,2023年,AI算力支出還是訓練占60%,推理占40%,但兩年後,這個比例幾乎都要翻過來了,推理預計將占企業AI預算的85%。

推理大模型還在持續放大這一趨勢。據a16z對100萬億token數據的研究,2025年推理模型的token消耗份額從近乎歸零飆升至總算力的半數以上。每一次模型升級,都在成倍放大推理的算力消耗。

GPU推理有一個結構性弱點。要理解它,需先明確LLM推理的兩大核心階段:Prefill(預填充)與Decode(解碼)。

Prefill階段負責處理用戶提示詞,支持平行計算,GPU很擅長,因此這階段GPU效率表現優異。

而Decode階段是逐一生成token,屬於串列運算,後一個token的生成必須等待前一個完成。且每生成一個token,都需要完整讀取全部模型權重與KVCache緩存,數據搬運成本極高、重複損耗嚴重。

以70B參數模型為例,其權重約140GB,疊加對話過程中持續膨脹、可達數十GB的KVCache,龐大的數據量進一步加重了GPU的運算與搬運負擔。

也就是說,GPU推理低效的核心,並非算力不足,而是傳統架構物理局限導致的記憶體牆問題。

這就是AI行業的核心「記憶體牆」——算力增長遠快於記憶體頻寬增長,計算性能被數據搬運卡住了。

數據顯示,算力每兩年提升3倍,HBM頻寬僅提升1.6倍;十年維度下,算力暴升1000倍,頻寬僅提升10倍,這相當於買了一張超級計算卡,實際跑推理的時候98%的時間在發呆。

性能剪刀差持續擴大,就導致了架構矛盾日益凸顯。

據HuggingFace Blog分析,B200在batch等於1時,tensor core空閒超過99%。

這個痛點也體現在英偉達核心營收上。

黃仁勳公開確認,其數據中心業務65%收入來自推理場景,意味著英偉達最核心的營收來源,恰恰是GPU架構效率最低的場景。這也是為什麼英偉達要斥資200億美元去收購Groq的原因。側面印證傳統GPU無法適配高端推理需求,行業亟需專用推理架構。

在此背景下,Cerebras跳出傳統GPU設計邏輯,以晶圓級計算架構給出了破局方案。其核心產品WSE-3摒棄晶片切割模式,將整片300mm矽晶圓作為單一處理器,集成90萬個AI核心、搭載44GB片上SRAM,官方頻寬達21PB/s,是B200 8TB/s頻寬的2625倍,實現了跨量級的性能突破。

也就是說,這是真正物理意義上的超大晶片,所以說它是英偉達的「大」對手,確實沒毛病。

晶圓級計算75年沒人做出來,不是沒人想過,是工程上做不到。Cerebras解了三個難題。

第一,突破光刻工藝極限。傳統光刻單次曝光最大面積僅26mm×33mm,遠小於晶圓尺寸。Cerebras聯合台積電研發「劃線橋接」技術,複用晶圓劃線區域延伸金屬沉積路徑,讓通信網路無縫覆蓋整片晶圓,徹底消除晶片邊界與跨晶片延遲。

第二,解決大晶片缺陷。雖然Cerebras把晶片做得極大,但它把每個AI核心做到了只有0.05平方毫米,約等於H100 SM核心面積的1%。單個缺陷只廢掉0.05平方毫米,而不是6平方毫米。據Cerebras官方博客,WSE-3的缺陷容忍度是GPU的100倍。額外加1%到1.5%的冗餘核心做替換。

第三,攻克超大功率供電散熱難題。WSE-3功耗達23kW,需輸送超2萬安培電流。Cerebras採用上置垂直供電、底部水冷散熱方案,將整片晶圓溫差控制在20℃以內,保障晶片高負載穩定運行。

據實測數據,Cerebras WSE-3對最佳GPU/雲方案,四個主流模型全部領先。Llama 3.3 70B差距最大,2140對120,18倍。Llama 4 Maverick 400B差距最小,2500對1000,超過2倍。

憑藉出奇快的推理速度,Cerebras的估值一路水升船高。根據S-1融資輪次數據,公司估值八個月升了六倍。從81億美元到230億再到488億。

並且,公司的商業前景也得到了科技巨頭的背書。OpenAI一上來就直接跟它簽了超百億美元的多年合同。還有AWS也選擇Cerebras作為Bedrock推理加速層。

整體而言,Cerebras以顛覆性的晶圓級架構,發起了對GPU行業霸主的技術挑戰。這套突破傳統束縛的技術方案,打破了長期的GPU算力壟斷,想像空間廣闊,也讓公司估值從一開始就偏離了正常的比較範圍。



02

估值合理嗎?



根據S-1檔,CerebrasIPO估值對應2025年5.1億美元營收,約95倍收入倍數。據StockMaven數據,NVIDIA大約25倍,Cerebras是NVIDIA的近4倍。

但盈利能力上Cerebras顯然還沒有證明自己,NVIDIA財報顯示其毛利率75%到80%,Cerebras只有39%。

公司2025年GAAP淨利潤2.378億美元,里面有3.63億非現金會計收益(遠期合約負債公允價值變動)。實際Non-GAAP虧損7570萬美元。毛利率從42.3%滑到39.0%,還在往下走。

這也說明了,公司的估值邏輯本身已經超出了晶片公司的標準,市場更像是把它當成了一種稀缺的AI基礎設施來定價。

但是翻一翻賬,估值給的太高還不是最大的問題。

根據S-1經審計財務報告附注,2025年公司86%的收入來自兩個阿聯酋實體。MBZUAI占62%,G42占24%。美國收入反而降了34%。

OpenAI的百億美元合同目前是該公司最大的一筆潛在收入。但事情還要更加複雜,OpenAI同時扮演了四個角色:客戶、債權人,潛在股東,還有個人投資者,Altman等人做過天使投資人。

數據還顯示,246億美元訂單積壓中,只有15%在2026到2027年確認。43%在2028到2029年。一旦交付不了產能,OpenAI有權終止合同並要求償還貸款。

雖然簽了百億合同,但OpenAI在同時押注多條路線,Cerebras只是其中一條。去年10月,OpenAI與AMD簽署了6GW部署協定。

實際上,每家科技巨頭都在推理上多方下注,沒有一家把Cerebras當成主力路線孤注一擲。亞馬遜跟Cerebras合作,但也只讓它負責decode加速層。主力推理用的依然是自研Trainium3。

近幾年,推理晶片創業公司的歸宿也佐證了這一點。Groq被NVIDIA收購,Graphcore被SoftBank收購,UntetherAI被AMD收購。而Cerebras是唯一獨立IPO的推理獨角獸。

對於科技巨頭而言,Cerebras又何嘗不是補丁,只是補丁熬到了上市。

再者,標稱速度也有水分。Cerebras用了推測解碼技術——讓小模型先猜、大模型再驗證,能快3倍。去掉技術加速,純硬件對推理速度的支持沒那麼多。而且測試是在單用戶條件下跑的,實際多用戶併發時優勢還會進一步縮水。

更關鍵的是,Cerebras的44GB片上記憶體只夠做"一問一答"式的快速推理。但推理市場增長最快的方向是AIAgent——需要長對話、大上下文,記憶體需求遠超44GB。據Stratechery判斷:內容在片上記憶體內,Cerebras速度驚人;一旦超出,就不划算了。

Cerebras未來能在推理市場拿下多大份額,取決於晶圓級架構能否突破44GB記憶體的天花板,從"一問一答"走向更複雜的推理場景。



03

尾聲



總的來說,"英偉達對手"這個定位,更多來自資本市場的敘事需求,支撐溢價的核心假設是"稀缺AI基礎設施"。

Cerebras能走多遠,還是要看自身的稀缺性能否轉換成更大的商業價值。

拆開看,稀缺性的成立依賴於兩個前提:其一,OpenAI百億合同的交付執行。其二,晶圓級架構能否突破場景限制。

尤其是後者,如果技術反覆運算停滯、應用場景難以拓展,那麼一切的敘事都可能變成巨大的泡沫,淪為AI算力生態里的邊角備胎。

財報季,美股數字睇到眼花? Warren AI一鍵解讀數據!現在InvestingPro立享50%折扣, 即刻點擊訂閱


最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2026 - Fusion Media Limited保留所有權利