紐約 - Facebook母公司Meta Platforms Inc.今天宣布,其研究部門推出了新的人工智能(AI)模型。其中包括一個"自學評估器",這可能會減少人類在AI開發過程中的參與。這個工具最初在8月的一篇研究論文中介紹,採用了類似OpenAI最新模型的"思維鏈"技術。
這種方法將複雜問題分解為更小的邏輯步驟,提高了在科學、編碼和數學等困難領域的回應準確性。
"自學評估器"僅使用AI生成的數據進行訓練,這意味著在開發的這個階段不需要人類輸入。這一進展暗示了創建能夠從自身錯誤中學習的自主AI代理的潛力。根據Meta研究人員的說法,這些自我改進的模型最終可能無需人類幫助就能執行廣泛的任務,超越目前對人類反饋強化學習(RLHF)的需求。RLHF是一種成本高昂且效率較低的方法,需要專門的人類註釋者來標記數據並驗證複雜的答案。
Meta研究人員之一Jason Weston分享了他對AI未來的願景,表示:"我們希望,隨著AI變得越來越超人類,它將越來越擅長檢查自己的工作,以至於實際上會比普通人更好。"他強調了自學和自我評估在達到前所未有的AI熟練程度方面的重要性。
雖然其他公司,如Google和Anthropic,也進行了類似概念的研究,如AI反饋強化學習(RLAIF),但Meta的獨特之處在於將其模型公開供公眾使用。
除了"自學評估器",Meta今天還推出了更新的AI工具。這些包括對公司的圖像識別Segment Anything模型的改進,一個加速大型語言模型(LLMs)響應生成時間的工具,以及支持發現新無機材料的數據集。
路透社對本文有所貢獻。
此文章由人工智能協助翻譯。更多資訊,請參閱我們的使用條款。