週五,OpenAI推出了最新模型o3-mini,現已在多個平台上向開發者和用戶開放。這個新模型旨在成為公司推理系列中最具成本效益的選擇,在科學、數學和編程方面提供卓越的能力。o3-mini在保持低成本和減少延遲的同時,延續了2024年12月預覽時的特點。
OpenAI的這一宣布緊隨本週AI領域的動盪而來,中國的DeepSeek剛剛推出了其開源AI模型,該模型以較低成本在較舊的NVIDIA GPU上構建。
OpenAI o3-mini作為公司首個小型推理模型,包含了函數調用、結構化輸出和開發者消息等開發者功能,使其可以立即投入生產使用。它還支持流式處理,並提供低、中、高三種推理努力選項,以滿足不同用例需求。這些選項使模型能夠專注於解決複雜挑戰或優先考慮速度以最小化延遲。然而,對於視覺推理任務,開發者仍建議使用OpenAI o1,因為o3-mini不支持視覺能力。
從今天開始,ChatGPT Plus、Team和Pro的訂閱者可以使用o3-mini。預計一週內Enterprise用戶也將可以使用。新模型將在模型選擇器中取代OpenAI o1-mini,並提供更高的速率限制和更低的延遲。Plus和Team用戶的速率限制將增加三倍,允許每天使用o3-mini發送150條消息,相比之下o1-mini只能發送50條。此外,o3-mini還整合了搜索功能,提供最新的答案和相關的網絡源鏈接,目前處於早期原型階段。
OpenAI首次向免費計劃用戶開放通過ChatGPT使用推理模型。用戶可以通過在消息編輯器中選擇"推理"選項或重新生成回應來嘗試o3-mini。這一舉措將OpenAI的高級推理能力擴展到更廣泛的受眾。
雖然OpenAI o1仍然是通用知識推理的首選模型,但o3-mini為需要精確和快速問題解決的技術領域提供了專門的選擇。在ChatGPT中,o3-mini使用中等推理努力以確保回應速度和準確性之間的平衡。所有付費用戶都可以在模型選擇器中選擇o3-mini-high,這個版本提供更高的智能,但回應時間稍長,Pro用戶可以無限制地使用o3-mini和o3-mini-high。
專家測試人員評估了o3-mini,發現它比前代o1-mini更快、更準確,特別是在STEM領域。測試人員56%的時間更喜歡o3-mini的回應,並注意到在具有挑戰性的現實世界問題上,重大錯誤減少了39%。當設置為中等推理努力時,o3-mini在困難推理和智力評估(如AIME和GPQA)中的表現與o1相當。
昨天,有報道稱OpenAI將以3,400億美元的估值籌集高達400億美元的資金。軟銀據說正在洽談投資高達250億美元。微軟仍然是該公司最大的股東和合作夥伴之一。
此文章由人工智能協助翻譯。更多資訊,請參閱我們的使用條款。