智通財經APP獲悉,據知情人士透露,與OpenAI一樣,谷歌(GOOGL.US)和亞馬遜(AMZN.US)支持的Anthropic的大語言模型性能也進入了停滯不前的瓶頸期。三名知情人士稱,即將推出的Gemini未達內部預期。此外,Anthropic已經推遲了其Claude模型的下一個版本,即3.5 Opus。公司們表示,目前仍缺乏用於訓練模型的人工數據。
正處於一個里程碑關鍵時刻的OpenAI在9月完成了一個大型新人工智能模型的首輪訓練,希望該模型能夠大大超越ChatGPT背後的先前技術版本,並向超越人類的強大人工智能的目標更近一步。但據兩名知情人士透露,這款內部稱爲“獵戶座”(Orion)的模型並未達到公司預期的性能。
知情人士說,例如,截至夏末,Orion在試圖回答未接受過訓練的編程問題時表現不佳。總體而言,到目前爲止,Orion對OpenAI現有模型的提升並不像從GPT-3.5到GPT-4的提升那麼大。GPT-3.5最初是OpenAI旗艦聊天機器人的動力系統。
OpenAI並不是最近唯一遇到障礙的公司。在多年來以極快的速度推出愈加複雜的人工智能產品之後,三家領先的人工智能巨頭目前卻發現,爲開發新模型而付出的高昂代價產生的回報正在減少。
Anthropic上個月發佈了一款名爲Claude 3.5 Haiku的新版本,以及Claude 3.5 Sonnet的升級版本。今年9月,OpenAI公司推出了一系列新人工智能模型,名爲o1和o1-mini,可對複雜任務進行推理,並解決比以前的科學、編程和數學模型更難的問題。
但據三位知情人士透露,Alphabet旗下谷歌即將推出的Gemini軟件版本未達到內部預期。與此同時,Anthropic期待已久的Claude模型3.5 Opus的發佈時間表也已推遲,而且未提供具體發佈日期。
這些AI巨頭目前正面臨着一些挑戰。要找到用於構建更先進人工智能系統的新的、未開發的高質量人工訓練數據來源正變得越來越困難。兩名知情人士表示,Orion的編程表現不理想,部分原因是缺乏足夠的編程數據進行訓練。與此同時,即使是適度的提升可能也並不足以證明與製造和運營新模型相關的巨大成本具有合理性,以及達到將產品標榜爲重大升級所帶來的期望。
不過,這些模型仍有很大潛力可以改進。據其中一位知情人士透露,OpenAI一直在讓Orion經歷一個長達數月的被稱爲“後培訓”的過程。這是公司公開發布新型人工智能軟件之前的常規流程,包括納入人類反饋以改善其迴應,並改進模型與用戶互動的基調等。但一位知情人士表示,Orion仍未達到OpenAI希望的可向用戶發佈的水平,公司也不太可能在明年年初之前推出該系統。《The Information》此前曾報道OpenAI開發新模型所面臨挑戰的一些細節,包括編程任務。
此外,OpenAI首席執行官薩姆·奧特曼(Sam Altman)此前曾表示,整體算力水平也是最新一輪人工智能模型浪潮需要面臨的一個問題。奧特曼最近在Reddit上表示:“所有這些模型都變得相當複雜,我們無法同時推出那麼多東西。”“我們還面臨着許多限制和艱難的決定,即如何將我們的計算分配給許多偉大的想法。”