中信證券:2024或爲AI Agent智能體落地之年

發布 2024-5-31 上午10:02
© Reuters.  中信證券:2024或爲AI Agent智能體落地之年
ADSK
-
ADBE
-

智通財經APP獲悉,中信證券發佈研報稱,自2024年以來,Google、OpenAI等頭部廠商模型技術路線更側重於應用落地,原生多模態、長文本處理成爲其算法模型更新的重點,AI Agent(智能體)作爲當前語言模型應用落地的最佳形式,料將迎來技術轉折。展望後續AI Agents應用的發展路徑,成本優化將是焦點,目前的技術方案提供了多種針對成本問題的優化方案,但仍需要時間來進行實踐,判斷距離AI Agents應用落地還有約6-12個月時間。

投資維度,建議關注:AI Agents的核心記憶部分(數據倉庫、向量數據庫等)、AI算力(芯片、存儲、網絡)、上層應用環節(互聯網、軟件)等相關環節領先廠商。

中信證券主要觀點如下:

報告緣起:

在2023年的AI熱潮過去後,市場投入了大量人力與資本押注基於語言模態的Transformer大模型,如GPT、Gemini、Claude等,其在語言問答的相關能力上已經較爲成熟,但遲遲沒有看到進一步的爆款應用落地。當前AI應用仍主要圍繞以擴散模型(Diffusion Model)爲底層的圖片創作和圖片修改模型,以Transformer爲底層的大語言模型整體應用落地進度較爲緩慢。預計2024年以來的技術路線變化將顯著改變這一情況。考慮到當前頭部模型廠商對多模態以及長文本能力的重視,AI Agent(智能體)將會是當前語言模型應用落地的最佳形式。

AI應用現狀:落地進度較慢,同質化嚴重

當前較爲成熟的AI商業化模式集中在文生圖,基於擴散模型的應用進展迅速,而大語言模型的落地速度較慢。擴散模型因其低成本和高效生成圖像的能力而受到青睞,Midjourney和Adobe等公司在這一領域取得了顯著成果。相比之下,儘管Transformer模型備受關注,但其商業化進展緩慢,成功應用主要集中在GPT Store和微軟Office Copilot等少數項目。

大模型應用落地面臨兩大主要挑戰。首先,單一的文字模態限制了實際應用場景,多模態模型由於成本和延遲問題尚未廣泛應用,難以滿足複雜需求。根據《2024: Gartner's IT Automation Trends Revisited》報告,Gartner預計,截至2024年,圖片內容處理將佔實際使用場景的32%,而文字模態無法滿足這一需求。其次,任務流程鏈較短導致模型同質化,缺乏對複雜任務的支持,影響應用效果和用戶體驗。這些問題表明,提升記憶能力和支持多模態輸入是實現大模型廣泛應用的關鍵。

AI Agent技術支撐:原生多模態、長文本記憶等

2024年初,多模態與長文本處理成爲AI大廠更新的核心重點,Gemini 1.5 Pro、Claude 3、GPT-4o以及Kimi等模型在多模態能力與長文本處理上取得突破,意味着AI Agent技術出現標誌性轉折點。原生多模態技術有效解決了Agent模態轉換中的延遲問題,OpenAI推出的GPT-4o通過端到端訓練處理多模態輸入,充分體現了原生多模態在AI Agents應用中的潛力。支持長任務鏈流程是避免模型同質化的核心要點,其中長上下文(long context)被認爲是解決問題的根本途徑。2024年初各大模型在文本輸入能力上實現大幅提升,通過優化編碼器-解碼器架構和注意力機制,模型在長任務鏈記憶上的表現顯著提升,從基礎能力上對AI Agent的支持成爲可能。

AI Agent當前約束:成本優化

成本是增加上下文長度帶來的核心問題,AI Agent的落地需要進一步優化成本。上下文長度增加會顯著提升attention的計算成本,如果將KV Cache持久化,則需要大量存儲空間。如果Agent要與用戶建立長期關係,例如每天一小時的語音聊天,大約會生成15K tokens,一個月就會達到450K tokens,超出大多數長上下文模型的限制。即使支持450K tokens的上下文,做簡單估算GPT-4-Turbo的1K輸出token成本爲$0.03大多數場景下用戶無法負擔如此高的費用。僅在一些to B應用場景和高附加值的to C場景(如AI心理諮詢、AI在線教育)中使用GPT-4-Turbo才能保持盈虧平衡。相比之下,從性價比更高的GPT-3.5開始構建Agent可能是更具經濟效益的選擇。

據中信證券測算,對於性能要求不高的簡單陪聊類Agent,8B模型的1K輸出token成本甚至可以降到$0.0001,是GPT-4-Turbo價格的1/300。因此,類似於MOE的模型路由可能是AI Agent的一個可行方向,可以將簡單問題分配給簡單模型,複雜問題分配給複雜模型,從而降低成本。

風險因素:

AI核心技術發展不及預期風險;科技領域政策監管持續收緊風險;私有數據相關的政策監管風險;全球宏觀經濟復甦不及預期風險;宏觀經濟波動導致歐美企業IT支出不及預期風險;AI潛在倫理、道德、用戶隱私風險;企業數據泄露、信息安全風險;行業競爭持續加劇風險等。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利