💎 挖掘低估值寶藏股立即開始

開源證券:OpenAI o1模型來臨 RL助力模型提升推理能力

發布 2024-9-13 下午04:53
© Reuters.  開源證券:OpenAI o1模型來臨 RL助力模型提升推理能力

智通財經APP獲悉,開源證券發佈研報稱,早期AI大語言模型性能提升主要憑藉Scaling law,在語料數據集以及模型參數持續提升的情況下,模型的性能持續突破,而新一代o1系列模型問世,代表着模型能通過RL在除開訓練側之外的推理側,引入思維鏈等新技術的方式提升模型的性能,爲科學、數學、編碼等專業領域提供更準確的答案,或是生成式AI發展的重要拐點。此外,OpenAI表示除了新的OpenAI o1系列之外,仍在繼續開發GPT系列模型。

OpenAI發佈o1-preview和o1-mini模型,推理能力顯著提升

北京時間2024年9月13日,OpenAI發佈新一代o系列模型o1以及o1-mini,在模型訓練時引入大規模reinforcement learning(RL),隨着訓練時計算(train-timecompute)時間的增加以及推理(test-time compute)時間的延長,o1模型性能持續提升。

通過RL訓練,o1模型在推理時使用思維鏈(Chain of Thought)的方式解決問題,能夠將複雜問題分解成多個簡單步驟,並即時識別和糾正錯誤,顯著提升了模型的推理能力。在最大化推理時間的前提下,o1在絕大多數推理密集型任務中性能顯著優於GPT-4o,模型測試結果顯示,57個MMLU 子類別中,o1在54個子類別中的表現優於GPT-4o,性能可與人類專家媲美。

o1模型尚未單獨定價,計劃爲chatgpt免費用戶提供o1-mini使用權限

從推理成本上看,o1模型主要在大型文本數據集上預訓練,推理成本較高且速度較慢,o1-mini模型在預訓練階段爭對STEM推理進行優化,尤其擅長數學及代碼領域,模型參數較小且延時推理較低,推理成本比OpenAI o1-preview低80%。

目前,ChatGPT Plus和 Team用戶將能夠訪問 ChatGPT中的o1系列模型,Enterprise和Edu用戶將在下週開啓訪問,OpenAI當前僅在ChatGPT和API中提供模型預覽版本,未來將上線瀏覽、文件和圖像上傳以及其他功能,未來將爲ChatGPTFree用戶提供o1-mini使用權限。o1模型並未額外定價,但使用存在限制,o1-preview模型的每週使用限制爲30條消息,o1-mini的每週使用限制爲50條消息。

AI大模型持續迭代,國內外雲巨頭持續增加對AI基礎設施的資本開支,持續看好算力產業鏈

推薦標的:寶信軟件(600845.SH)、中際旭創(300308.SZ)、英維克(002837.SZ)、新易盛(300502.SZ)、天孚通信(300394.SZ)、中興通訊(000063.SZ)、盛科通信(688702.SH)。

受益標的:潤澤科技(300442.SZ)、源傑科技(688498.SH)、華工科技(000988.SZ)、紫光股份(000938.SZ)、光迅科技(002281.SZ)、華豐科技(688629.SH)、網宿科技(300017.SZ)、烽火通信(600498.SH)、雲賽智聯(600602.SH)等。

風險提示:AI發展不及預期、智算中心建設不及預期、行業競爭加劇。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2024 - Fusion Media Limited保留所有權利