智通財經APP獲悉,中金髮布研究報告稱,過去一年,大模型在邏輯推理、智商等方面擁有顯著突破,並出現由多模態推動的趨勢,如Open AI GPT-4、文生視頻Sora以及Google的原生多模態Gemini系列。大模型可以對世界的概率建模,它並不需要理解每一個符號,而當它把標記空間做的足夠大時,僅僅通過符號與符號之間連接的豐富性和準確性,就能夠產生一個有邏輯的答案。基於此,大模型或有能力把對AI Agent的暢想落地。更進一步,AI Agent或可打造出AI原生場景及應用。
▍中金主要觀點如下:
大模型面世有望開啓AI Agent時代。
過去一年,大模型在邏輯推理、智商等方面擁有顯著突破,並出現由多模態推動的趨勢,如Open AI GPT-4、文生視頻Sora以及Google的原生多模態Gemini系列。大模型可以對世界的概率建模,它並不需要理解每一個符號,而當它把標記空間做的足夠大時,僅僅通過符號與符號之間連接的豐富性和準確性,就能夠產生一個有邏輯的答案。基於此,大模型或有能力把對AI Agent的暢想落地。更進一步,AI Agent或可打造出AI原生場景及應用。
AI Agent現狀:從基礎形態邁向通用Agent。
AI Agent應用實際落地可分爲單一任務和多任務場景。單一任務場景聚焦垂類賽道,AI僅具備相對初級的協同能力,典型案例如社交(如聊天機器人Character.ai、Pi等)、娛樂(如定製化內容生成AI——Sora、Runway等;個性化內容推薦AI等)、遊戲(如AI生成遊戲資產和NPC、模擬人類世界的生成式代理等)、交易(如電商、本地生活等)、生產力(聚焦辦公類,如微軟Copilot和Google Gemini)等。
多任務場景則代表AI更爲高級的階段,向着通用Agent(具備調配資源並自主集合形成問題解決方案能力的Agent)的方向邁進,典型案例如GPTs、斯坦福小鎮等,這將使Agent從過程導向轉變爲目的導向的形態。更進一步,通用Agent未來或可升級爲通用機器人(如Google的RT-2),引入線下實踐和經驗,使其更智能。
AI Agent初期傳統龍頭基於已有產品的探索看似更加活躍,但長期對其而言,挑戰與機遇並存。
AI Agent在發展初期與傳統互聯網龍頭關聯性或更高,主要在於他們資源優勢顯著,不僅是大模型研發的主要參與者,還把持了現有的商業場景,但現有大模型能力不足,在此基礎上或者找到PMF難度較大,或者即使找到的PMF,都有可能隨着大模型的快速進化而被降維打擊。
長期看,對龍頭而言,真正的機會出現在圍繞scaling law的紅利趨緩、底層模型本身進化速度收斂時,如果龍頭在技術上仍能保持不掉隊,則有望發揮自身的用戶和場景優勢。同時,AI Agent帶來的觀念轉變,需要大廠在既有文化裏去產生新組織,也帶來了相應的挑戰。
風險
數據、隱私風險;法律道德倫理風險;長期人類生存危機。