OpenAI首席運營官近日預測2024年將是人工智能(AI)技術的“應用之年”,意味着類似OpenAI所開發的ChatGPT以及Sora等各種風靡全球的生成式AI應用可能將呈現“井噴爆發”之勢。隨着企業以及個人用戶逐漸意識到AI所帶來的工作效率大幅提升,預計AI技術不久後將在全球各經濟體和市場得到極爲廣泛的應用,因此基於AI的各類型AI軟件大爆發的臨界點似乎離我們越來越近,而致力於構建AI軟件開發生態的雲巨頭們,比如亞馬遜與微軟,有望迎來“iPhone時刻”——即業績與股價共同飆升的時刻。
根據業內對於AI軟件的定義,AI軟件指代的是能夠執行通常需要類似人類智能才能完成的任務的軟件系統,其中包括理解、學習、判斷和語言翻譯等能力。從這個定義出發,ChatGPT以及Anthropic推出的Claude等火爆全球的生成式AI應用,作爲能夠理解和生成接近人類水平的自然語言文本的AI系統,顯然可以被準確地歸類爲AI軟件。
亞馬遜旗下AWS以及微軟Azure這兩大市佔率遙遙領先其他參與者的全球雲計算巨頭自2023年AI熱潮席捲全球以來,大舉採購英偉達高性能AI GPU,發力佈局與AI相關的B端以及C端軟件應用開發者生態,旨在全面降低各行各業開發AI應用軟件的IT技術門檻。
近期兩大巨頭均表示創收預期十分樂觀,微軟首席財務官Amy Hood在第四季度業績聲明中表示,Azure 30%營收增速中的6 個百分點來自人工智能推動,並強調微軟客戶們對於人工智能產品的濃厚興趣將促使客戶在存儲和計算能力等基本服務上投入更多資金。繼宣佈將在倫敦設立新的人工智能中心後,微軟近日宣佈將在日本投資29億美元建設數據中心,力爭強化微軟在全球範圍的AI開發生態。
AWS第四季度實現營收同比增13%至242億美元,亞馬遜CEO Andy Jassy預計,人工智能將在未來幾年帶來高達百億美元營收,他強調,亞馬遜旗下幾乎所有消費者業務都已經或將擁有生成式AI應用。
華爾街銀行業巨頭摩根大通CEO傑米·戴蒙在近日公佈的年度股東信中,專門留出篇幅來強調AI對摩根大通以及對整個人類社會的重要性。這位摩根大通掌舵者表示他完全相信AI對人類社會帶來的影響將是巨大的,並將其潛在的影響力與蒸汽機以及計算機等歷史性的工業技術革新相提並論。戴蒙表示,摩根大通內部已經確定了400多個AI在營銷、預防欺詐和風險管理領域的具體應用案例,並開始探索大範圍部署生成式AI。
國際大行瑞銀(UBS)在近期發佈的一份研報中指出,全球科技行業剛剛開始大規模業績增長週期,瑞銀預計到2027年,AI技術將在全球各大經濟體的各行各業實現極其廣泛的應用規模,從而推動AI大模型及AI軟件應用成爲價值高達2250億美元的細分市場,與2022年僅22億美元規模相比,可謂史詩級飛躍,在此期間的複合年增速預期高達152%。瑞銀還預計,AI行業總營收規模將翻15倍,從2022年的大約280億美元增至2027年的4200億美元。
AI硬件部署漸入佳境的重要信號:英偉達AI GPU交付時間大幅縮短
具有劃時代意義的生成式AI——ChatGPT橫空出世,或意味着人類社會逐步邁入全新AI時代,此後不僅是科技行業,全球各行各業對英偉達AI芯片——即用於AI訓練/推理領域的A100/H100 AI GPU需求激增,使得該科技巨頭緊接着之前的三個季度之後,在2月份又一次發佈了令全球震驚的強勁業績。
有着“算力之王”稱號的AI芯片霸主英偉達(NVDA.US),當前可謂在全球AI數據中心扮演最重要角色。擁有大量計算核心、能夠同時執行天量級別矩陣運算任務,並且極度擅長處理並行化計算的英偉達AI GPU近年來成爲AI領域最核心硬件。
英偉達很早就認識到GPU在AI和深度學習領域的潛力,因此投入大量資源進行相關研發,併成功構建了圍繞其GPU硬件的強大軟硬件生態系統。英偉達在全球高性能計算領域已深耕多年,尤其是其一手打造的CUDA運算平臺風靡全球,可謂AI訓練/推理等高性能計算領域首選的軟硬件協同系統。英偉達當前最火爆的H100/H200 AI GPU基於英偉達突破性的Hopper GPU架構,提供了前所未有的計算能力,尤其是在浮點運算、張量核心性能和AI訓練/推理領域的特定加速方面。
因此,英偉達AI GPU整體交付時間大幅縮短,能夠在一定程度上說明全球範圍的AI硬件端部署工作漸入佳境。據瞭解,來自國際大行瑞銀的分析師們近期在一份研報中稱,英偉達AI GPU供應鏈多元化的努力措施終於開始奏效,該芯片巨頭現在已將旗下 AI GPU 的整體交付時間從此前的 8-11 個月大幅縮減至 3-4 個月,但該行未透露大幅縮短的具體原因。
業內分析人士則普遍猜測,其中一大部分原因可能在於英偉達H100/H200以及B100/B200等AI GPU唯一代工廠臺積電(TSM.US)大幅提升CoWoS封裝產能(據業內人士透露,預計到今年年底,臺積電CoWoS月產能有望高達3.2萬單元,這是一個巨大規模的數字,因爲在2023年初產能數字低得多),以及GPU所搭載的HBM存儲系統的供應商可能開始包含三星和美光,並且這些HBM供應商們大幅提高產能,而此前一段時間只有SK海力士爲英偉達H100 AI GPU提供HBM。
芯片製造商們產能擴張驅動英偉達旗下的AI GPU供應量規模得以出現大幅增長,因此,各大企業的AI硬件部署規模漸入佳境,亞馬遜與微軟等雲巨頭以及Meta等軟件巨頭對於AI GPU需求增量逐漸趨於穩定,而不是2023年長時間所呈現出的GPU採購量暴增之勢——在2023年很長一段時間因無法採購足夠AI GPU而無法滿足雲客戶算力需求。
藉助AWS以及Azure雲平臺,AI軟件醞釀“大規模湧現”之勢
在華爾街投資機構看來,隨着全球企業和個人用戶們逐漸意識到AI所帶來的生產率大幅提升,以及開發者紛紛藉助AWS以及Azure等雲計算平臺日趨完善的低技術門檻AI軟件開發生態,企業端的AI應用大規模部署以及面向個人用戶的更多創新C端AI應用軟件大爆發時機越來越成熟。
幫助各大企業開發不同類型和功能AI應用軟件的整個過程,正是亞馬遜(AMZN.US)AWS和微軟(MSFT.US)Azure等雲計算巨頭最擅長的領域。隨着AWS以及Azure等雲平臺的AI GPU部署漸入佳境,逐漸能夠滿足市場強勁的雲端AI算力需求,AI軟件可謂醞釀大規模湧現之勢。
亞馬遜計劃在未來15年向數據中心投入近1500億美元,以應對與AI相關的企業多元化數字服務需求的“爆炸式增長”這一預期。亞馬遜如今已深度將生成式AI相關核心技術服務全面融入旗下的AWS雲計算服務之中,展示出AWS在融入AI聊天機器人、底層基礎大模型庫、計算增強、數據存儲以及底層算力平臺方面的一系列積極AI進展,這也是華爾街投資機構看漲亞馬遜股價走勢的核心邏輯。
AWS前不久重磅推出全新升級版本的Amazon Bedrock,這是一項全面的生成式AI基礎服務,使得AWS的企業級客戶能夠便捷地使用單個API訪問來自領先AI公司的基礎模型(FMs)。這些模型被預先訓練,能夠應用於從搜索到內容創建再到藥物發現等多種核心的生成式AI用途。Amazon Bedrock 旨在幫助用戶輕鬆訪問並利用來自AI21 Labs、Anthropic、Cohere、Meta、Stability AI和Amazon等AI巨頭們的高性能基礎模型。
通過爲這些模型提供統一的API訪問,加上AWS提供的基於英偉達GPU和AWS自研AI加速器的算力雲平臺,Amazon Bedrock不僅降低了企業或者個人開發和部署AI應用軟件的技術門檻,而且使得AI軟件開發者能夠非常靈活地使用不同的FMs,還能夠極其簡便地升級到最新大模型版本。最終基於大模型的生成式AI具體用途包括從文本生成到圖像生成、視頻生成等多種用途。
憑藉OpenAI大股東身份的微軟則於去年推出基於ChatGPT技術的Azure OpenAI Studio雲服務,相當於Azure全新AI強化版本。Azure OpenAI 雲服務是微軟提供的一種融入OpenAI引以爲傲的AI大模型的強化雲計算服務,它允許用戶通過 REST API 調用 OpenAI 無比強大的最新版本AI大語言模型,其中包括 GPT-4、GPT-4 Turbo with Vision、GPT-3.5-Turbo 和 Embeddings 模型系列。這些模型可用於多種任務,包括回答內容生成、摘要、圖像理解、語義搜索和自然語言到代碼的翻譯。用戶可以通過 REST APIs、Python SDK 或 Azure OpenAI Studio 的基於網絡的界面訪問此AI雲服務。
Azure OpenAI Studio可以說專爲希望開發面向不同行業的企業級AI軟件開發人員,以及面向不同羣體的C端AI應用軟件開發者而設計,藉助Azure OpenAI集成資源以及雲端GPU算力資源,整個開發過程無需從頭開始構建以及深度訓練複雜而繁瑣的AI大模型,大幅降低AI應用開發門檻。藉助 Azure OpenAI Studio,企業開發者使用預構建的AI大模型和 API 添加、修改以及集成各種AI 功能,還可以將AI應用部署到基於英偉達強大GPU以及微軟自研AI加速器推理算力支持的Azure雲。
需要注意的是,Amazon Bedrock以及Azure OpenAI Studio雖然與AWS以及Azure緊密集成,但是均按照實際投入使用的大模型規模和計算資源量來進行額外計費。這意味着,儘管雲計算用戶需要進行Azure訂閱或AWS訂閱來訪問和使用AI相關的雲服務,但按照模型普遍參數和GPU算力資源來算,仍然將產生高額的訂閱之外費用。
除了上述面向較低技術門檻AI軟件開發者門的服務,亞馬遜AWS與微軟Azure還擁有着面向OpenAI、Anthropic以及Mistral AI等專業AI大模型開發企業的大型平臺,支持從數據準備到模型訓練、驗證和推理部署全過程。比如,微軟Azure Machine Learning擁有機器學習領域的最頂級資源,這些資源爲數據科學家和專業的AI開發人員們提供了無比全面的開發平臺,能夠使用幾乎所有的工具和庫來構建、訓練和部署創新型的超大規模參數AI大模型。
企業級AI可謂處於AI軟件開發的“最前沿陣地”,預期數據方面,Mordor Intelligence研究報告顯示,預計2024年到2029年,企業人工智能軟件市場的總規模將以每年52%的驚人速度快速增長。
Mordor Intelligence指出,全球第四次工業革命(工業4.0)以物理和先進數字技術爲特徵,如人工智能、無處不在的移動超級算力等,對全球各行業產生重大影響,尤其是全球企業當前逐漸認識到將人工智能融入其業務流程、通過AI自動化流程提高企業經營效率並降低成本的巨大價值,並且AI能夠幫助全球企業預測業務成果,提高企業盈利能力。
花旗、摩根士丹利以及高盛等華爾街大行將亞馬遜定位爲“2024年最熱門的電子商務或互聯網股票”。華爾街對亞馬遜股價前景的看漲信心主要來源於人工智能,他們認爲亞馬遜有望憑藉深度捆綁AWS的創新型AI相關產品在這波全球企業AI競賽中處於最佳地位,這也是亞馬遜股價近日創歷史新高重要原因。
Tipranks預期數據顯示,華爾街分析師們予以亞馬遜的共識評級爲“強力買入”,平均目標價則爲210美元,意味着股價已創新高的亞馬遜未來12個月保守漲幅達13%。摩根士丹利近日將亞馬遜目標股價從200美元上調至215美元(截至週三收於185.95美元),並維持“增持”以及“行業首選”評級;DA Davidson則將亞馬遜目標價由200美元上調至235美元。業績預期方面,分析師們近半年不斷上修亞馬遜EPS預期,預計2024年EPS有望同比激增45%。
微軟共識評級爲“強力買入”,平均目標價則爲474美元,意味着屢創新高的微軟未來12個月保守漲幅達12%。華爾街知名投資機構Wedbush近日表示微軟即將迎來“iPhone時刻”,將目標價從475美元上調至500美元(截至週三收於423.26美元),Tipranks顯示的最高目標價則高達550美元。
擁有龐大用戶羣的蘋果與Meta不甘示弱,欲健全AI軟件開發生態
全球消費電子巨頭蘋果(AAPL.US),以及社交媒體巨頭Meta(META.US),近期也不斷髮力AI軟件領域,試圖完善AI軟件領域的開發者生態。其中,蘋果爲“macOS以及iOS生態”應用程序開發者所開發的一款關鍵新AI工具可能即將完成,蘋果自去年開始一直在開發這一新工具,將該工具作爲蘋果旗艦編程軟件——Xcode下一個重大升級版本的最關鍵部分。蘋果內部擴大了對這些功能的測試,計劃最早於今年某個時候向蘋果系統端的第三方軟件製造商發佈這些新功能。
知情人士表示,新工具操作方式將類似於微軟旗下GitHub Copilot,即使用人工智能技術來預測和完成代碼編寫塊。這一AI技術可謂極大程度簡化了蘋果生態AI軟件部署的編程,爲全球科技企業節省大量時間以及部分技術成本。蘋果還專注於通過Core ML和Create ML等工具不斷加強其機器學習服務,試圖讓開發者在蘋果設備端輕鬆集成大模型。
Facebook母公司Meta 正在旗下高達30億用戶的家族應用軟件測試與部署20多種不同的全新生成式AI功能,覆蓋信息搜索、廣告投放到商業信息渠道等多個主流應用場景,Meta表示將在全球範圍內部署這些全新的生成式AI。在分析師們看來,Meta核心業務——數字廣告已重新恢復增長,在全新生成式AI加持下,Meta廣告業務規模有望加速擴張。
Meta還希望更多第三方開發者使用Meta AI Studio爲全球企業和創作者開發多樣化的AI聊天機器人,這些聊天機器人將被設計適用於企業和創作者,可以代表他們在Meta的應用上(如Facebook、Instagram等)與用戶進行交流和互動。簡而言之,Meta鼓勵第三方開發利用其平臺提供的AI工具和資源庫,開發能夠在不同用戶之間進行有效溝通的AI聊天機器人,從而全面增強30億用戶體驗併爲Meta商業和開發生態建設提供支持。
值得注意的是,英偉達在3月GTC正式推出名爲“NVIDIA NIM”的微服務,按每GPU使用時間收費,它是專注於優化的雲原生微服務,旨在縮短基於AI 大模型的生成式AI應用上市時間並簡化它們在雲端、數據中心和 GPU 加速工作站上的部署工作負載,使得企業能夠在英偉達雲推理算力基礎上部署AI應用,尋求建立專屬英偉達GPU體系的AI應用軟件開發生態。
NIM 入門可謂簡單明瞭,在NVIDIA API 目錄中,企業開發人員可以訪問各種 AI 大模型,這些模型可用於在NIM平臺快速構建和部署自己公司的 AI 應用程序。因此,我們可以簡單理解爲“NVIDIA NIM”與Azure OpenAI Service提供具有相似功能和應用場景的AI開發者服務生態,它們都旨在簡化基於AI大模型的應用軟件部署和推理工作負載。但是每個服務生態都擁有其特定的優化和功能集羣以及一些兼容區別,以滿足不同的企業和開發者需求,相比之下Azure OpenAI能夠調用GPT-4且建立在Azure雲之上,提供廣泛雲服務支持和更多集成選項。
隨着ChatGPT和Sora等以用戶爲中心的生成式AI應用接連問世,全球企業紛紛參與佈局生成式AI技術的熱潮,或將推動一場長達十年的AI繁榮發展時代。根據彭博行業研究分析師們發佈的一份最新報告,預計到2032年,生成式AI市場的總營收規模將從2022年的400億美元增長到1.3萬億美元,這一市場可謂10年間有望翻32倍,以高達42%複合速度高速增長。
彭博行業研究團隊表示,市場擴張首先集中於訓練AI系統所需的基礎設施的強勁需求,然後是使用人工智能模型的後續終端設備,以及廣告投放、軟件應用等其他服務類型的強勁需求。在廣告投放以及軟件應用等面向BC用戶的應用端生態,無疑是亞馬遜、微軟以及Meta最精通的領域,就連AI芯片霸主英偉達也尋求分一杯羹。
在Meta依賴的數字廣告領域,擁有30億用戶的Meta推出多項新型AI工具,力爭將生成式AI全面納入其覆蓋全球的廣告業務,爲用戶帶來基於人工智能的全新廣告投放模式,這可能是Meta近期股價屢創歷史新高的重要邏輯,華爾街知名機構Jefferies近日將Meta 12個月目標價從550美元 上調至585美元(截至週三收於519.83美元),另一機構Oppenheimer則將目標價從525美元 大幅上調至585美元。
大模型與軟件迭代趨勢下,硬件市場空間仍然龐大
雖然隨着供應瓶頸逐漸消除,AI GPU這一核心硬件需求增量可能趨於穩定,但是底層硬件的市場仍將不斷擴張,英偉達旗下高性能AI GPU的供不應求之勢可能在未來幾年難以徹底緩解。
尤其是AI大模型以及AI軟件不得不面臨的技術情景——即更新迭代趨勢的刺激之下軟件開發端勢必將不斷採購或升級AI GPU系統,因此未來幾年AI硬件市場規模仍然顯得無比龐大。根據市場研究機構Gartner最新預測,到2024年AI芯片市場規模將較上一年增長 25.6%,達到671億美元,預計到2027年,AI芯片市場規模預計將是2023年規模的兩倍以上,達到1194億美元。
據媒體報道,微軟與OpenAI正在就耗資高達1000億美元的超大型全球數據中心項目規劃進行細節層面的談判,該項目將包含一臺暫時命名爲“星際之門”(Stargate)的AI超級計算機,這將是兩家AI領域的領導者計劃在未來六年內建立的一系列AI超算基礎設施中最大規模的超算設施。
毋庸置疑的是,這個巨無霸級別的AI超算將配備“數以百萬計算”的核心硬件——英偉達不斷升級的AI GPU,旨在爲OpenAI未來更爲強大的GPT大模型以及比ChatGPT和Sora文生視頻等更具顛覆性的AI應用提供強大算力。
英偉達CEO黃仁勳預計,未來數據中心AI基礎設施規模將在五年內翻番,代表着每年數千億美元的市場機遇。英特爾CEO蓋爾辛格近日表示,英特爾將利用市場未來對AI芯片的狂熱需求,重新奪回英特爾在芯片製造領域的領袖地位。蓋爾辛格預測,到2030年英特爾將主要通過滿足對AI芯片的龐大需求,使其芯片代工規模達到全球第二,屆時其規模僅輸於代工之王臺積電。