中金:AI端側落地加速 關注操作系統升級及應用前景

發布 2024-5-17 上午07:56
© Reuters.  中金:AI端側落地加速 關注操作系統升級及應用前景
UNIs/USD
-
WINK/USD
-

智通財經APP獲悉,中金髮布研究報告稱,本週Open AI與谷歌分別發佈新一代模型:GPT-4o和Gemini系列模型。該行認爲,隨着AI在端側的逐漸落地,將帶動消費電子終端創新升級,並對雲端算力硬件系統尤其是推理側需求提出更高要求。

中金主要觀點如下:

Gemini 1.5 Pro與GPT-4o有何異同?

我們認爲,GPT-4o是端到端模型的創新,帶來人機交互方式新突破;谷歌Gemini性能升級,AI能力廣泛接入旗下生態。對比來看,兩者都是原生多模態大模型,有望引發行業的效仿熱情,原生多模態或成爲未來發展趨勢;但差異點在於,Gemini上下文窗口更大,且定價更具吸引力;GPT-4o模型性能更強,且更強調實際應用場景中的人機交互創新。

AI端側落地帶來消費電子終端人機交互方式變革,關注操作系統升級及應用前景。

在硬件側,我們認爲,此次兩大模型發佈從四個方面加快了AI落地端側的進度:1)多模態交互方式革新;2)AI語音助手擬人化;3) AI功能在移動設備的應用前景;4)商業化前景。雖然當前大模型仍以雲端算力調用爲主,但從當前各家在模型參數壓縮的努力,結合端側商業變現的前景,未來部分算力下沉到端側將成爲必由之路,對應消費電子終端在硬件層面也將迎來創新升級。在操作系統及應用側,語音助手擬人化程度提升,一方面使AI agent成爲可能,另一方面未來交互方式變化或帶來流量入口變化,深刻影響生態格局。

雲端算力硬件:GPT-4o部分功能的免費開放,Gemini能力的提升或對單位算力成本下探提出要求,AI infra面臨大幅優化。

我們看到,當下行業對算力硬件性能、成本的衡量以訓練導向逐漸轉爲推理導向。除了芯片端、網絡硬件端(如光模塊)持續升級外,系統工程能力也正不斷強化:爲獲得更低的硬件利用率,降低推理成本,優化顯存、實施算子融合/算子實現優化、低精度(量化)推理、分佈式推理均是主流實現方式。我們認爲算力硬件市場有望隨應用落地步入以價換量時代,市場規模或將持續增長。

風險

AI算法技術及應用落地進展不及預期,AI變現模式不確定,消費電子智能終端需求低迷。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利