隨着微軟(MSFT.US)和谷歌(GOOGL.US)在生成式人工智能模型與工具領域首先發力,亞馬遜(AMZN.US)也正奮起直追。同時,亞馬遜據悉已在美國得州奧斯汀秘密開發兩款定制芯片——分別爲Inentia和Trainium,它們爲亞馬遜雲服務AWS客戶提供了一種替代選擇,可以代替越來越難采購的英偉達(NVDA.US)GPU培訓大語言模型。
而且AWS在雲計算領域的主導地位是亞馬遜的一大優勢。AWS是全球最大的雲計算提供商,2022年占據了40%的市場份額。分析師認爲,從長遠來看,亞馬遜的定制芯片可能會讓它在生成式人工智能領域占據優勢。
AI模型、工具與芯片齊發力,亞馬遜奮起直追
直到今年4月,亞馬遜才推出了自己的大型語言模型Titan,以及一項名爲Bedrock的服務,以幫助開發人員使用生成式人工智能來增強軟件。研究機構Gartner副總裁分析師Chirag Dekate表示:“亞馬遜不習慣追逐市場。亞馬遜習慣于創造市場。我認爲,很長一段時間以來,他們第一次發現自己處于劣勢,他們正在努力追趕。”
然而,其他公司采取了更快的行動,投入了更多的資金,並乘上了人工智能的東風。當OpenAI于去年11月推出ChatGPT時,向OpenAI投資了130億美元的微軟因托管這款爆火的人工智能聊天機器人而受到廣泛關注。今年2月,微軟迅速將生成式人工智能模型添加到自己的産品中,並將其整合到必應中。同月,谷歌推出了自己的大語言模型Bard,隨後又向OpenAI的競爭對手Anthropic投資了3億美元。
另一家科技巨頭Meta(META.US)聯手微軟最近也發布了自己的大型語言模型、“ChatGPT競品”Llama 2,該模型現在可以在微軟Azure公共雲上進行測試。今年2月,Llama 1開源後,Meta就已收到了10萬多個訪問大型語言模型的請求。Llama的開放瞬間讓AI社區模型大爆發,UC 伯克利的Vicuna、斯坦福Alpaca等各種系列“羊駝”蜂擁而出。這次,Llama 2的開源直接向OpenAI和谷歌發起挑戰。在OpenAI和谷歌獨占鳌頭下,Meta此舉想通過另辟蹊徑改變大模型AI之爭的格局。
盡管如此,在美國得州奧斯汀,幾個亞馬遜員工正在設計兩種定制微芯片——Inentia和Trainium,以便用于訓練和加速生成式人工智能。這兩款定制芯片爲需要培訓大語言模型的亞馬遜雲服務AWS客戶提供了一種替代英偉達圖形處理器(GPU)的選擇。目前,企業采購英偉達GPU越來越難,而價格也越來越高。
6月份,AWS首席執行官Adam Selipsky接受采訪時表示:“全世界都希望有更多的芯片用于支持生成式人工智能,無論是GPU還是亞馬遜自己設計的芯片。我認爲,與世界上任何其他公司相比,我們更有可能爲客戶提供這種人人都想要的算力。”
Dekate指出,從長遠來看,亞馬遜的定制芯片可能會讓它在生成式人工智能領域占據優勢。他說:“我認爲,真正的區別在于他們帶來的技術能力。因爲你猜怎麽着?微軟沒有Trainium或Interentia。”
早在2013年,AWS就通過一款名爲Nitro的專用硬件悄然開始生産定制芯片,其現在是AWS芯片中産量最高的。亞馬遜告訴媒體,每台AWS服務器中至少有一個,使用總數超過2000萬。2015年,亞馬遜收購了以色列芯片初創公司Annapurna Labs。然後在2018年,亞馬遜推出了基于軟銀旗下英國芯片設計公司Arm架構的服務器芯片Graviton,直接對標AMD和英偉達等巨頭x86 CPU。
伯恩斯坦研究公司(Bernstein Research)高級分析師Stacy Rasgon表示:“Arm芯片在服務器總銷售額中所占的比例可能高達10%,其中很大一部分將來自亞馬遜。所以在CPU方面,他們做得相當不錯。”
同樣在2018年,亞馬遜推出了專注于人工智能的芯片。兩年前,谷歌發布了首款張量處理器(Tensor Processor Unit,簡稱TPU)。而微軟尚未宣布其正在與AMD合作開發的人工智能芯片Athena。
亞馬遜在美國得州奧斯汀設有芯片實驗室,並在那裏開發和測試Trainium和Inferentia。該公司産品副總裁Matt Wood解釋了這兩種芯片的用途。他說:“機器學習分爲這兩個不同的階段。所以,你需要訓練機器學習模型,然後對這些訓練過的模型進行推理。與在AWS上訓練機器學習模型的其他方式相比,Tradium在性價比方面提高了約50%。”
繼2019年推出第二代Interentia之後,Trainium于2021年首次上市。Wood指出,Interentia允許客戶“提供低成本、高吞吐量、低延遲的機器學習推理,這是你在生成式人工智能模型中輸入提示時獲得的所有預測,所有這些都會得到處理,然後獲得響應”。
然而,就目前而言,在訓練模型方面,英偉達GPU仍然是無可爭議的王者。今年7月,AWS推出了基于英偉達H100的新AI加速硬件。Rasgon指出:“在過去15年裏,英偉達圍繞其芯片建立起了龐大的軟件生態系統,這是其他公司所沒有的。目前,人工智能領域的最大贏家就是英偉達。”
雲計算技術在手,亞馬遜優勢在候
然而,AWS在雲計算領域的主導地位是亞馬遜的一大優勢。Dekate寫道:“亞馬遜不需要額外關注,該公司已經擁有非常強大的雲安裝基礎。他們所需要做的就是弄清楚如何利用生成式人工智能使現有客戶擴展到價值創造運動中。”
當在亞馬遜、谷歌和微軟之間選擇生成式人工智能服務時,數百萬AWS客戶可能會被亞馬遜吸引,因爲他們已經熟悉亞馬遜,並在AWS運行其他應用程序並存儲數據。
AWS技術副總裁Mai-Lan Tomsen Bukovec解釋稱:“這是一個有關速度的問題。這些公司能夠以多快的速度開發這些生成式人工智能應用程序,取決于他們首先從AWS中的數據開始,並使用我們提供的計算和機器學習工具來推動的。”
根據科技行業研究機構Gartner的數據,AWS是全球最大的雲計算服務提供商,到2022年占據40%的市場份額。盡管亞馬遜的營業利潤已經連續叁個季度同比下降,但在亞馬遜第二季度77億美元的營業利潤中,AWS仍然占到了70%。而且從曆史上看,AWS的運營利潤率遠高于谷歌雲。
AWS還擁有越來越多的專注于生成式人工智能的開發者工具組合。AWS負責數據庫、分析和機器學習的副總裁Swami Sivasubramanian表示:“讓我們把時鍾撥回去,甚至回到ChatGPT公布之前。並且這不是說在那之後,我們突然匆忙拿出了一個計劃,因爲你不可能在那麽快的時間內設計出一款新芯片,更不可能在2到3個月的時間內建立Bedrock服務。”
Bedrock可以讓AWS客戶訪問由Anthropic、Stability AI、AI21 Labs和亞馬遜Titan開發的大語言模型。Sivasubramanian表示:“我們不相信一種模型會統治世界,我們希望我們的客戶擁有來自多個供應商的最先進模型,因爲他們會爲正確的工作選擇正確的工具。”
亞馬遜最新的人工智能産品之一是AWS HealthScribe,該服務于7月推出,旨在幫助醫生使用生成式人工智能起草患者就診摘要。亞馬遜還有機器學習中心SageMaker,提供算法、模型等服務。另一個重要工具是CodeWhisperer,亞馬遜表示,它使開發人員完成任務的速度平均提高了57%。去年,微軟也報告說,其編碼工具GitHub Copilot提高了工作效率。
今年6月,AWS宣布了斥資1億美元建立生成式人工智能創新中心。AWS首席執行官Selipsky表示:“我們有很多客戶都想要生成式人工智能技術,但他們不一定知道這在他們自己的業務背景下對他們意味着什麽。因此,我們將引入解決方案架構師、工程師、策略師和數據科學家,與他們一對一地合作。”
雖然到目前爲止,AWS主要專注于開發工具,而不是打造ChatGPT的競爭對手,但最近泄露的一份內部郵件顯示,亞馬遜首席執行官Andy Jassy正在直接監督一個新的中央團隊,該團隊也在構建可擴展的大型語言模型。
在第二季度財報電話會議上,Jassy表示,AWS的“相當大一部分”業務現在是由人工智能和它提供的20多種機器學習服務驅動的。其客戶包括飛利浦、3M公司、Old Mutual和彙豐銀行。
對AI數據安全問題方面,AWS也具有天然的優勢。人工智能的爆炸式增長帶來了一系列安全擔憂,公司擔心員工將專有信息放入公共大型語言模型使用的培訓數據中,以致于使得內部機密數據泄露。Selipsky對此表示:“我無法告訴你,我接觸過的財富500強公司有多少家禁用了ChatGPT。因此,通過我們的生成式人工智能方法和Bedrock服務,你通過Bedrock所做的任何事情、使用的任何模型,都將在你自己獨立的虛擬私有雲環境中。它將被加密,它將具有相同的AWS訪問控制。”
目前,亞馬遜只是在加速推進生成式人工智能,聲稱目前有“超過10萬”客戶在AWS上使用機器學習。雖然這只占AWS數百萬客戶的一小部分,但分析師表示,這種情況可能會改變。
Dekate稱:“我們沒有看到企業在說:哦,等一下,微軟已經在生成式人工智能方面領先,讓我們走出去,讓我們改變我們的基礎設施戰略,把所有東西都遷移到微軟。如果你已經是亞馬遜的客戶,你很可能會更廣泛地探索亞馬遜的生態系統。”