國泰君安:OpenAI提升用戶體驗 o3模型在AI領域創新突破

發布 2024-12-30 上午06:44

智通財經APP獲悉,國泰君安發佈研報稱,OpenAI 12 days發佈會最後四天發佈了o1 API、o3等最新功能。o1模型通過增強API功能(如函數調用、結構化輸出和視覺輸入),大幅提升了開發者的效率和應用場景的多樣性;o3系列模型則在編碼、數學和科學推理等領域展現出接近或超越人類專家的能力,同時通過靈活的推理強度設置,顯著降低了使用成本。重點關注以下賽道:AI開發工具與平臺(如API服務和SDK支持);AI推理與高性能計算,以及AI安全對齊技術產品。這些領域或將受益於OpenAI的技術突破而得到更多發展機遇。

國泰君安主要觀點如下:

OpenAI通過發佈o1模型,顯著增強了API功能。新功能包括函數調用、結構化輸出和視覺輸入,極大地提升了開發者的工作效率。o1模型在結構化輸出調用中的準確率達95%,遠超GPT-4o模型,確保了複雜任務中的高準確性和穩定性。此外,開發者消息和推理努力程度的控制選項,幫助開發者在性能與成本之間找到最佳平衡,進一步優化了開發體驗。視覺輸入功能的加入,使得o1模型能夠直接處理圖像輸入,如分析表格中的錯誤,進一步擴展了其應用場景。

ChatGPT桌面應用的原生化與深度集成大幅提升了編程與創作效率。用戶可通過快捷鍵快速調用ChatGPT,在Xcode和Warp終端生成複雜代碼片段,顯著縮短開發時間,提升代碼質量。與Notion、Apple Notes等創作工具的集成,進一步提升了文檔編輯和信息整合的效率,使得ChatGPT更加深入用戶的日常工作和創作流程。高級語音模式的引入,增強了用戶與ChatGPT的互動體驗,爲用戶帶來了更高的便利性和生產力。

OpenAI推出的o3系列模型在性能、成本和安全性上取得突破。o3在ARC AGI基準測試中得分達到87.5%,超越人類平均水平,顯著提升了編碼、數學和科學問題解決能力。在Codeforces競技編程中,o3的ELO值接近2727,遠超o1模型的1891;在Epoch AI的Frontier Math Benchmark中準確率超過25%,這是目前最難的數學基準測試之一,此前所有現有模型的準確率均低於2%。o3 mini通過靈活的推理強度設置(低、中、高),在低推理強度下編碼能力已超越o1 mini,中等推理強度下性能優於o1,爲開發者在使用成本和推理性能之間提供了平衡的選項。o3 mini在低推理強度下的延遲已接近GPT 4o的水平,而成本僅爲o1模型的一小部分,爲大規模商業化應用提供了堅實基礎。此外,OpenAI首次開放o3系列模型給外部研究人員進行安全測試,增強了公衆對技術的信任,進一步鞏固了OpenAI在AI領域的領先地位。

風險提示:技術突破存在安全與隱私風險;商業化進程不及預期。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利