就在近幾天博通因為ASIC大漲,英偉達公司 (NASDAQ:NVDA)股價卻從11月21日突破新高之後一直震蕩向下。
目前,Broadcom Inc (NASDAQ:AVGO)市值高達1.03萬億美元,在半導體晶元公司中僅次於3.29萬億的英偉達。 市場對博通及ASIC的關注,甚至蓋過了英偉達即將量產發貨的Blackwell。
下游科技大廠對英偉達的抵抗,終於來到高潮了嗎? 對於國內的AI產業又有什麼啟示?
01
英偉達時刻重現
上週四盤后,博通公佈第四財季及全年財報。 除了各項收入指標全面增長,其中最大的亮點是,2024年半導體業務收入中有122億美元來自AI收入,同比增長220%,2倍的增量主要得益於領先的人工智慧晶元XPU和乙太網網路產品群組。
同時博通還透露,目前正在與三個非常大型的客戶開發AI晶元,預計明年公司AI晶元的市場規模為150億-200億美元。
現在市場逐漸意識到,大型雲服務商們對博通定製人工智慧晶元和網路設備的需求旺盛,開始對一直統治AI加速晶元市場的英偉達構成了威脅。
這層理解,直接驅動博通在連續兩個交易日里上漲了38%,成為第二家萬億市值的晶元公司。 上一次大市值晶元公司能出現如此大的漲幅,還是去年5月份公佈超預期業績指引的英偉達,隨後也走上了萬億市值之路。
歷史何其驚人的相似,博通和英偉達的敘事里有一個共同點,那就是AI晶元需求的爆髮式增長,而英偉達卻是博通敘事里的那條“惡龍”。
眾所周知,英偉達的卡非常貴,還很難拿貨。 對於大型雲服務商來說,替換成本不僅僅是自研晶元那麼簡單,而是算力基礎設施投入運營,提供雲服務的綜合成本(TCO)優化,這直接影響了雲服務商之間的競爭。
因此,過去正當科技大廠們哄搶英偉達晶元的同時,他們還紛紛下場自研晶元,谷歌找到博通開發TPU,亞馬遜和Marvel達成五年合作協定,微軟在過去一年已經實現了“CPU+GPU+DPU”全面自研。
這裏,巨頭們的目標是一致的,即優化成本的定製化晶元需求,而博通提供的解決方案正好能夠解決燃眉之急。
ASIC是一款高度定製化的晶元,行業稱之為專用積體電路,跟通用GPU比起來,ASIC被應用於特定設計和製造設備里,執行和優化某項功能,比如更快的處理速度和更低的能耗。
一般下游大廠有需求,找晶元設計公司幫忙做出來,自己開發週期長,但一旦做出來之後不用再給英偉達交那麼多稅,專門應用於自己的演算法模型使用即可。 實際的例子,就是博通説明谷歌開發的TPU系列。
晶片設計公司在XPU的合作模式中承擔著越來越重要的角色,不僅接管了前後端的設計外包,有的甚至能把流片和封裝也幹了,最終説明大廠在算力性能和成本上達成平衡點。
在ASIC市場中,目前博通以55%-60%的份額位居第一,Marvell以13%-15%的份額位列第二。
國內做ASIC晶元也有這麼幾家,寒武紀、雲天勵飛、北京君正以及國科微。
近期連續上漲,市值已經超過2800億的寒武紀,公司的AI晶元走的就是ASIC路線,2016年即推出了首款NPU。 據悉,公司正在研發的思元590,直接對標華為的昇騰910B和英偉達H100。
雖然公司目前業績難以匹配上估值,但從三季度存貨和預付賬款大幅增長的趨勢可以看出未來積極的生產投入,隨著先進製程晶元自主可控的需求加強,未來收入放量確定性高。
有機構預計,客戶定製化的AI ASIC的增速預計將超過GPU計算。
除了英偉達以外,博通目前在晶元領域里佔據了最好的生態地位。
這是因為,AI基建並不只是搞定晶元那麼簡單。
英偉達統治AI訓練市場的王牌,除了晶元,還有CUDA和NV LINK,前者與晶元高度適配的軟體開發工具,後者則是能提供高速低延遲工作環境的專用網路協定。
定製化晶元擺脫了雲服務商對CUDA的依賴,但博通出色的不止是ASIC,網路專用協定和相關晶元IP也一應俱全,這使得博通有能力幫助客戶搞出XPU+超高速互聯集群伺服器來。
而英偉達之所以下跌,就是因為市場正在權衡未來英偉達GPU需求面臨的挑戰。
其一,Blackwell能否在未來繼續統治市場,這款晶片將在今年四季度小幅出貨,明年預計將成為英偉達主力產品。 但隨著大型科技公司定製化ASIC成為常態,以及推理計算需求的成倍增長,英偉達GPU可能無法繼續統治推理市場。
其二,英偉達面臨的另一個阻力,是過去兩年驚人的業績增長所設定的高標準。
FactSet調查的分析師普遍認為,2025年英偉達營收將增長55%,達到1914.5億美元,相比之下,預計2024年英偉達營收將增長一倍以上,達到1233.7億美元。
市場對AI晶元競爭格局的認知正在重新修正,明年可能就會有巨大的變化。
博通定製化ASIC方案嶄露頭角,跟當年台積電挑戰傳統IDM,有些異曲同工的。
02
明年將是推理之年
ChatGPT面世兩年多以來,AI的主戰場正從訓練端轉向一個規模更大、競爭更為激烈的領域:推理。
近月,AI應用端發生了許多令人印象深刻的事件。
Open AI連續12場帶著震撼產品更新的發佈會正在進行中,與此同時谷歌近期也大招頻出,Gemini 2.0、Veo 2、量子晶元...... 谷歌高管給Gemini 2.0的定位是:面向智慧體時代的AI模型。
時間再回到三個月以前,Open AI 發佈o1系列,通過強化學習,把LLM的邏輯推理能力又提升了一個級別。 並且,隨著更多的強化學習(訓練時間計算)和更多的思考時間(測試時間計算)投入,o1的性能不斷提高。
Open AI是Scaling Law的簇擁者,因為正是這條金律吸引來無數資本的注入,而Open AI希望能一直代表它。
但如今的數據猶如模型訓練的化石燃料,終將是會耗盡的,這是大模型競賽從預訓練轉向推理的重要原因,近期前Open AI高管Ilya Sutskever公開演講談及這一點,其預計,下一代AI模型將是真正的AI Agent,且具備推理能力。
而此前微軟CEO納德拉也強調,未來將會湧現出新的Scaling Law,將按照測試或者推理時間來進行定義。
所以o1不只是一次簡單的升級,而表明整個行業正在探索一條全新的遊戲規則,即模型“思考”的時間越長,就越能提供準確的答案。
在這個尺度上,推理場景將產生巨大的算力需求,並且推理成本有望隨著各種AI原生應用的飛輪效應快速地下降。
巴克萊的另一份報告則預計,預計AI推理需求將佔通用人工智慧總計算需求的70%以上,甚至達到訓練計算需求的4.5倍。
10月份,AI初創獨角獸Anthropic推出了Claude 3.5 Sonnet在性能測試上,擊敗了Open AI的o1。 並且,Sonnet還引入了自動化交互的操作,讓AI能夠直接操作電腦執行複雜指令。
在移動端,國內初創公司智譜推出的AutoGLM,繞過手機操作系統,在UI介面模擬使用者操作,從而實現“接管手機”。 而且根據媒體爆料,Open AI也將在明年1月推出Agent“Operator”。
谷歌呢? 當然有了。 從手機、AR眼鏡,瀏覽器,再到專門面向開發者和科研場景,都在Gemini 2.0基礎上做出了Agent。
細想一下,兩年前的ChatGPT僅僅只是個聊天機器人,而作為極為複雜的多模態交互推理場景之一,為了拆解複雜指令,AI Agent需要能夠從使用者終端的數據里學習和思考,以做出準確的操作,這恰恰是推理模型接下來精進和延申的方向。
而數據飛輪得以轉動的關鍵在於,開發合適的軟硬體來滿足使用者的需求。
今年下半年“AI+應用”的商業化賽道再次矚目,Applovin、Shopify、Palantir等不同賽道的美股公司,受益於AI帶來的業務爆發,股價持續走強。
國內也重點著力於AI應用的發展,位元組大模型雖然起步晚,但後來居上,目前豆包DAU接近900萬,增速超過15%,位居全球第二。 不僅打出了多款應用組合,還投入到了AI硬體中,積極尋找C端場景。 其他互聯網巨頭如百度、小米也開始投入到AR眼鏡的開發里。
03
AI滲透率即將跨越鴻溝?
機構預測,英偉達GPU目前在推理市場中市佔率約80%,但隨著大型科技公司定製化ASIC晶元不斷湧現,這一比例有望在2028年下降至50%左右。
但,ASIC的崛起並不意味著GPU的衰退。 這兩種技術可能將長期共存,為不同需求場景提供最佳解決方案。
可以肯定的說,AI目前還沒有達到我們期待的樣子,但推理技術的進步開始支援其走向終端,未來類似的“英偉達時刻”將會更多出現在推理端。
不過,欲戴王冠必承其重。 譬如Arm,在2月份給出了樂觀的預測,並表示這“只是人工智慧繁榮的開始”。 股價在接下來的三個交易日內飆升93%,但此後股價經歷了較大的波動,目前已較7月份的高點下跌逾20%。
而過去一周,博通2025財年每股凈收益的預期上漲了12%。 並非每一個「英偉達時刻」都能帶來持續增長。 (全文完)