智通財經APP獲悉,華泰證券發佈研報稱, AI Agent是一種能夠感知環境、進行決策和執行動作的智能實體,市場對Agent+終端的研究聚焦於硬件層面,但軟件算法及生態領域的研究也十分重要。從AI Agent的進展看,在理論研究中發現通過CoT(思維鏈)、ReAct(推理+行動)等方式能夠完成部分的任務規劃,且長期看通過AI Agent或有望進一步走向整體智能;在實踐中,通過將AI助手嵌入工作流也已打造出基於特定數據、場景的Agent產品雛形。隨着底層大模型能力的提升,Agent+工作流的工程化實踐深入,AI Agent能力有望進一步提升,或將推動AI商業化進程加速。
LLM推動AI Agent進入新階段,AI應用商業化或加速
AI Agent是一種能夠感知環境、進行決策和執行動作的智能實體,從發展歷程看,經歷了用邏輯規則和符號封裝知識、快速響應環境、基於強化學習等發展階段。隨着大語言模型(LLM)的快速發展,AI Agent在感知、記憶、規劃、行動等模塊方面的能力均得到了進一步的提升。我們認爲LLM推動AI Agent進入了新階段,與LLM結合的AI Agent在智能化程度、自主性方面有進一步提升的潛力,通過與終端的進一步結合,有望推動AI應用商業化加速。
AI Agent能力提升:感知/規劃/記憶模塊強化或工程化優化
從AI Agent的研究看, AI Agent的要素基本上可以分爲感知、定義、記憶、規劃、行動五類模塊。從AI Agent的能力提升路徑看,主要包括:1)單個模塊的持續強化:感知模塊的模態持續豐富、記憶模塊增長上下文或提供更加豐富的數據來源、規劃模塊中通過CoT或ReAct等方式提升推理能力、行動模塊補充第三方插件;2)系統性方式優化:如通過將AI各個模塊作爲整體發揮作用,利用不同環境之間交互獲取的跨模態數據,在物理和虛擬世界中運行等。綜上,在底層模型升級+工程化方法改進的共同推進下AI Agent的性能有望持續提升。
Agent自動解決固定範式的問題,關注Agent Workflow
基於LLM的Agent實踐已經取得一定的成果,從AutoGPT、GPTs、Devin等案例中可以看出,當前Agent將LLM應用於信息檢索、工具學習、任務分解、垂直知識學習、人機交互等場景,實現了能力的突破。一方面LLM相比傳統NLP在處理文本信息中的效率有所提升,另一方面特定數據訓練賦予LLM較好的解決垂類問題的能力,基於此當前LLM對於固定範式下解決問題已經能夠實現較好的自動化。我們認爲通過Agent Workflow的方式,能夠更好的實現AI Agent與具體任務的結合,或將推動LLM技術在更復雜的應用場景中進一步提升效率。
Agent改變人機交互方式,關注軟硬件產業機遇
AI+終端實現了安全性與個性化的結合,爲Agent落地打下良好基礎。AI Agent有望改變人機交互的方式,落地方式包括AIPC、AI手機等。終端掌握了重要的交互入口,據Apple WWDC,Siri用戶每天發出的語音請求數量高達15億次,大量的交互爲Agent提供了豐富的場景載體;此外通過壓縮模型到適合端側大小的模型,使用優化算法加速推理,實現在端側落地。對比Agent的技術架構,往往也需要基礎模型和小模型的共同支撐,我們認爲端側模型技術的發展(模型壓縮等技術)有助於Agent落地於終端。
相關公司梳理
從AI Agent的進展看,在理論研究中發現通過CoT(思維鏈)、ReAct(推理+行動)等方式能夠完成部分的任務規劃,且長期看通過AI Agent或有望進一步走向整體智能;在實踐中,通過將AI助手嵌入工作流也已打造出基於特定數據、場景的Agent產品雛形,我們認爲隨着:1)底層大模型能力的提升;2)Agent+工作流的工程化實踐深入,AI Agent能力有望進一步提升,或將推動AI商業化進程加速。重點關注公司:1)協同辦公廠商;2)垂直應用廠商;3)終端廠商。具體公司名單,請見研報原文。
風險提示:模型能力進步不及預期;安全性風險;本研報中涉及到未上市公司和未覆蓋個股內容,均系對齊客觀公開信息的整理,並不代表本研究團隊對該公司、該股票的推薦或覆蓋。