智通財經APP獲悉,中金髮布研究報告稱,本週Open AI與谷歌分別發佈新一代模型:GPT-4o和Gemini系列模型。該行認爲,隨着AI在端側的逐漸落地,將帶動消費電子終端創新升級,並對雲端算力硬件系統尤其是推理側需求提出更高要求。
中金主要觀點如下:
Gemini 1.5 Pro與GPT-4o有何異同?
我們認爲,GPT-4o是端到端模型的創新,帶來人機交互方式新突破;谷歌Gemini性能升級,AI能力廣泛接入旗下生態。對比來看,兩者都是原生多模態大模型,有望引發行業的效仿熱情,原生多模態或成爲未來發展趨勢;但差異點在於,Gemini上下文窗口更大,且定價更具吸引力;GPT-4o模型性能更強,且更強調實際應用場景中的人機交互創新。
AI端側落地帶來消費電子終端人機交互方式變革,關注操作系統升級及應用前景。
在硬件側,我們認爲,此次兩大模型發佈從四個方面加快了AI落地端側的進度:1)多模態交互方式革新;2)AI語音助手擬人化;3) AI功能在移動設備的應用前景;4)商業化前景。雖然當前大模型仍以雲端算力調用爲主,但從當前各家在模型參數壓縮的努力,結合端側商業變現的前景,未來部分算力下沉到端側將成爲必由之路,對應消費電子終端在硬件層面也將迎來創新升級。在操作系統及應用側,語音助手擬人化程度提升,一方面使AI agent成爲可能,另一方面未來交互方式變化或帶來流量入口變化,深刻影響生態格局。
雲端算力硬件:GPT-4o部分功能的免費開放,Gemini能力的提升或對單位算力成本下探提出要求,AI infra面臨大幅優化。
我們看到,當下行業對算力硬件性能、成本的衡量以訓練導向逐漸轉爲推理導向。除了芯片端、網絡硬件端(如光模塊)持續升級外,系統工程能力也正不斷強化:爲獲得更低的硬件利用率,降低推理成本,優化顯存、實施算子融合/算子實現優化、低精度(量化)推理、分佈式推理均是主流實現方式。我們認爲算力硬件市場有望隨應用落地步入以價換量時代,市場規模或將持續增長。
風險
AI算法技術及應用落地進展不及預期,AI變現模式不確定,消費電子智能終端需求低迷。