👁 挖掘大牛股就用 AI 技術觀點,向專家看齊。周一網購日促銷,即將結束!獲取優惠

國泰君安:2024年人形機器人最具突破性的進展主要體現在具身智能領域

發布 2024-8-22 上午09:32
© Reuters.  國泰君安:2024年人形機器人最具突破性的進展主要體現在具身智能領域
NVDA
-
TSLA
-

智通財經APP獲悉,國泰君安證券發佈研報認爲,2024年人形機器人最具突破性的進展主要體現在具身智能領域,各大研發廠商先後發佈相關進展,特斯拉(TSLA.US)發佈視頻,展示Optimus精準分揀特斯拉電動車4680電池的場景。國內人形機器人產業硬件供應鏈優勢明顯,但在具身智能、數據採集、人才領域的短板需要補齊。分層端到端是目前具身智能的主要路徑,一般分爲三層:基礎大模型(LLM或VLM)、決策大模型、操作大模型。其中在操作大模型領域,大多數廠商都剛起步。

2024年人形機器人最具突破性的進展主要體現在具身智能領域:3月,Covariant發佈端到端具身大模型RFM-1,具身智能創業團隊Sergey Levine和Chelsea Finn創立Pi(Physical Intelligence),Figure AI發佈接入OpenAI GPT-4V的Figure 01 demo。4月,李飛飛創立World Labs,致力於解決AI在三維空間感知和理解方面的難題。5月,特斯拉發佈視頻,展示Optimus精準分揀特斯拉電動車4680電池的場景,使用完全端到端神經網絡,只利用2D攝像頭視頻和機載自傳感器,直接生成關節控制序列,完全靠視覺輔助和人類示範進行訓練。國內人形機器人產業硬件供應鏈優勢明顯,在具身智能、數據採集、人才領域的短板需要補齊。

分層端到端是目前具身智能的主要路徑。大模型分爲非具身大模型(基礎大模型)、具身智能大模型(機器人大模型),區別是能否生成運動姿態。非具身大模型如GPT、Sora等,輸入和輸出的模態都是語言、圖片和視頻。具身智能大模型輸入視覺、語言信號,輸出三維物理世界的操作,其中,端到端的具身大模型對數據和算力要求高,如Tesla FSD、谷歌RT模型;Figure AI等大多數公司都採取了分層端到端的具身大模型,一般分爲三層:基礎大模型(LLM或VLM)、決策大模型、操作大模型,其中決策大模型以ChatGPT for Robotics、谷歌PaLM-E爲代表,技術方向從LLM 向強化學習(RL)演進,基於RL的範式可以使模型能夠在不同環境和任務中學習和適應,實現更高級的決策能力。操作大模型根據決策大模型的輸出執行具體動作,需要與機器人硬件深度集成,且必須通過數據採集來實現,技術方向從“MPC+WBC”向“RL+仿真”演進,MPC更適合具有精確模型和短期優化目標的場景,RL更適用於不確定性高、需要長期學習和自適應的環境。在操作大模型領域,大多數廠商都剛起步。

數據採集的主要方式:遠程操作、仿真合成數據。互聯網上各類文本、圖像和視頻數據集龐大,機器人的場景和交互有價值的數據量小,限制了AI模型在人形機器人上的泛化能力。特斯拉Tesla Bot開發團隊使用人類的真實運動方式來訓練機器人,英偉達推出MimicGen和Robocasa模型,通過真人的遙操作數據捕獲,再通過生成合成運動數據和模擬環境,加速機器人技術的研發和應用。國內人形機器人創新中心加速建設人形機器人訓練場。

具身智能估值邏輯:硬件、數據、模型、人才。硬件是一切的基礎,如果沒有自己的硬件,就無法根據算法和數據進行硬件的快速優化和修改。涉及數據的採集、組織管理以及與模型的閉環開發,需要有強大組織能力的團隊,核心團隊需要具備組織大規模工程師的經驗;越來越多的算法陸續開源,開源算法可以提供基礎的功能和技術,但要實現高質量、高性能的人形機器人,需要專業的算法團隊進行深入研究和開發。

風險提示:1)競爭環境惡化;2)新技術的應用速度低於預期。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2024 - Fusion Media Limited保留所有權利