OpenAI推出o3-mini,提供高性價比的推理能力

編輯Frank DeMatteo
發布 2025-2-1 上午03:28
© Reuters.

週五,OpenAI推出了最新模型o3-mini,現已在多個平台上向開發者和用戶開放。這個新模型旨在成為公司推理系列中最具成本效益的選擇,在科學、數學和編程方面提供卓越的能力。o3-mini在保持低成本和減少延遲的同時,延續了2024年12月預覽時的特點。

OpenAI的這一宣布緊隨本週AI領域的動盪而來,中國的DeepSeek剛剛推出了其開源AI模型,該模型以較低成本在較舊的NVIDIA GPU上構建。

OpenAI o3-mini作為公司首個小型推理模型,包含了函數調用、結構化輸出和開發者消息等開發者功能,使其可以立即投入生產使用。它還支持流式處理,並提供低、中、高三種推理努力選項,以滿足不同用例需求。這些選項使模型能夠專注於解決複雜挑戰或優先考慮速度以最小化延遲。然而,對於視覺推理任務,開發者仍建議使用OpenAI o1,因為o3-mini不支持視覺能力。

從今天開始,ChatGPT Plus、Team和Pro的訂閱者可以使用o3-mini。預計一週內Enterprise用戶也將可以使用。新模型將在模型選擇器中取代OpenAI o1-mini,並提供更高的速率限制和更低的延遲。Plus和Team用戶的速率限制將增加三倍,允許每天使用o3-mini發送150條消息,相比之下o1-mini只能發送50條。此外,o3-mini還整合了搜索功能,提供最新的答案和相關的網絡源鏈接,目前處於早期原型階段。

OpenAI首次向免費計劃用戶開放通過ChatGPT使用推理模型。用戶可以通過在消息編輯器中選擇"推理"選項或重新生成回應來嘗試o3-mini。這一舉措將OpenAI的高級推理能力擴展到更廣泛的受眾。

雖然OpenAI o1仍然是通用知識推理的首選模型,但o3-mini為需要精確和快速問題解決的技術領域提供了專門的選擇。在ChatGPT中,o3-mini使用中等推理努力以確保回應速度和準確性之間的平衡。所有付費用戶都可以在模型選擇器中選擇o3-mini-high,這個版本提供更高的智能,但回應時間稍長,Pro用戶可以無限制地使用o3-mini和o3-mini-high。

專家測試人員評估了o3-mini,發現它比前代o1-mini更快、更準確,特別是在STEM領域。測試人員56%的時間更喜歡o3-mini的回應,並注意到在具有挑戰性的現實世界問題上,重大錯誤減少了39%。當設置為中等推理努力時,o3-mini在困難推理和智力評估(如AIME和GPQA)中的表現與o1相當。

昨天,有報道稱OpenAI將以3,400億美元的估值籌集高達400億美元的資金。軟銀據說正在洽談投資高達250億美元。微軟仍然是該公司最大的股東和合作夥伴之一。

此文章由人工智能協助翻譯。更多資訊,請參閱我們的使用條款。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利