今年來,英偉達貢獻了標普500指數全部漲幅的1/3,並創造了從1萬億美元增長到2萬億美元跨越的最快紀錄,市值陸續超過了亞馬遜、谷歌母公司Alphabet和沙特阿美。
近日,英偉達CEO黃仁勳表示,Blackwell芯片已經投產,計劃每年升級其AI加速器,並宣佈將於2025年推出Blackwell Ultra GPU。
GPU作為AI計算和數據中心基礎設施的關鍵組成部分,其技術叠代與市場應用,正深刻影響著科技產業的格局。
作為人工智能繁榮的最大受益者之一,旺盛需求讓數據中心營收保持驚人增速,谷歌母公司Alphabet、微軟、亞馬遜和其他科技公司正在爭奪英偉達高端芯片的有限供應,以爭奪雲計算的主導地位。
01 行業現狀
智算中心集合了釋放算力、調度算力、聚合算力、生產算力四個作業環節。
調度算力中智算中心通過CPU、GPU、FPGA、ASIC等底層算力資源,通過細粒度切分、算力標準化等算力池化和算力調度過程,實現算力服務管理。
人工智能模型的兩個基本要素為數據集和處理能力,系統在數據集上進行訓練,模型通過處理能力檢測這些數據集内外部之間的關系。
在某種程度上,這兩大基本要素可以相互替代:一個模型可以通過吸收更多數據或增加更多處理能力加以改進。然而,在專業人工智能芯片短缺的情況下,後者正變得越來越困難,這導致模型構建者加倍專注於尋找數據,GPU在處理大規模並行計算任務時具有明顯優勢,尤其在深度學習、圖像識别等AI領域。
GPU:圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、遊戲機和一些移動設備(如平板電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。
GPU主要由90%的ALU(運算單元),5%的Control(控制單元)、5%的Cache(緩存單元)組成。
根據應用,可將GPU分為獨立GPU、集成GPU和移動GPU,可根據使用者的應用場景所需計算量進行選擇。
AI芯片:目前主流的加速計算解決方案主要採用CPU系統搭載GPU、FPGA、ASIC等異構加速芯片,GPU可以支撐大量數據的並行計算,適合對數據密集型的應用進行計算和處理;FPGA可無限次編程,延時性比較低,同時擁有流水線並行和數據並行、靈活性高;ASIC通過算法固化實現極致的性能和能效、平均性很強;功耗很低;體積小。
從性能上看ASIC在三者最具優勢,但目前技術開發難度最大,技術落地時間難以估計,因此預計未來AI芯片仍以GPU為主流,首先Transformer架構是最近幾年的主流,該架構最大的特點之一就是能夠利用分佈式GPU進行並行訓練,提升模型訓練效率;GPU芯片通用性強,其中原本為圖形計算設計的大量算數邏輯單元(ALU)可以為深度學習提供良好的加速效果。
02 行業應用
中國新能源車企早期更加關注單車智能,目前正逐步推進網聯方案發展,科技公司借助AI技術,提供自動駕駛解決方案,互聯網公司借助内容服務與AI,滲透自動駕駛出行服務,運營商依託蜂窩網,為網聯式自動駕駛提供服務。
L1-L2級傳統汽車不需要太大的車載算力,因此多採用小算力、微控制器的解決方案。從L2級開始,尤其是L3級以上的自動駕駛汽車需要裝備大算力芯片支撐感知、決策算法的高效運行。根據地平線公司的預測,自動駕駛每提高一級,算力就增加一個數量級。L2級别大概需要20-80K DMIPS、5-100TOPS的算力,L3需要200K DMIPS、500+個TOPS,L4為200+K DMIPS、500+TOPS,L5為200+K DMIPS、1,000+TOPS,預計未來主要算力芯片將為GPU,隨著新能源汽車自動駕駛需求的不斷提升,GPU的需求也將不斷擴大。
03 產業鏈分析
隨著服務器端的需求量不斷增加,倒推GPU整體產業開始新一輪發展,預計AI的算力需求將會促成GPU新一輪供不應求的局面,且此次短缺將有可能持續1-2年。
文章來源:頭豹公眾號