智通財經APP注意到,早在2024年5月份,OpenAI 就表示正在開發一款工具,讓創作者可以指定他們希望自己的作品如何納入或排除在其 AI 訓練數據中。但 7 個月過去了,這項功能仍未面世。
OpenAI 當時表示,該工具名爲媒體管理器(Media Manager),可以“識別受版權保護的文本、圖像、音頻和視頻”,以反映創作者“跨多個來源”的偏好。它旨在避開公司一些最激烈的批評者,並可能保護 OpenAI 免受與知識產權相關的法律挑戰。
但知情人士透露,該工具在內部很少被視爲重要發佈。“我不認爲這是一個優先事項,”一位前 OpenAI 員工說。“說實話,我不記得有人在開發它。”
一位負責協調公司工作的非員工去年 12 月透露,他們過去曾與 OpenAI 討論過這款工具,但最近沒有任何進展。
而 OpenAI 法律團隊中一位曾擔任媒體經理的 Fred von Lohmann 則於 10 月轉任兼職顧問。
OpenAI 尚未公佈媒體管理器的進展情況,該公司錯過了自己設定的“2025 年之前”推出該工具的最後期限。
知識產權問題
OpenAI等人工智能模型會學習數據集中的模式。ChatGPT可以寫出令人信服的電子郵件和文章,而 OpenAI 的視頻生成器Sora可以製作相對逼真的鏡頭。
能夠借鑑寫作、電影等範例來創作新作品,讓人工智能變得異常強大。但它也有反芻性。當以某種方式提示時,模型(其中大多數是在無數網頁、視頻和圖像上進行訓練的)會生成這些數據的近似副本,儘管這些數據是“公開的”,但並不適合以這種方式使用。
這自然會讓那些作品未經許可就被納入人工智能訓練的創作者感到不安。許多人已經聘請了律師。
OpenAI 正在應對藝術家、作家、 YouTube 用戶、計算機科學家和新聞機構提起的集體訴訟,所有這些人都聲稱這家初創公司非法訓練他們的作品。原告包括作家 Sarah Silverman 和 Ta Nehisi-Coates、視覺藝術家以及《紐約時報》和加拿大廣播公司等媒體集團。
OpenAI 已與精選合作伙伴達成許可 協議 ,但並非所有創造者都認爲這些條款具有吸引力。
媒體管理器
OpenAI 爲創作者提供了幾種“退出”其 AI 訓練的臨時方式。去年 9 月,該公司推出了一個提交表單,允許藝術家標記他們的作品,以便從其未來的訓練集中刪除。而且 OpenAI 長期以來一直允許網站管理員阻止其網絡爬蟲程序在其域中抓取數據。
但創作者批評這些方法雜亂無章,不夠充分。對於書面作品、視頻或錄音,沒有具體的退出機制。而對於圖像的退出表格則要求提交每張要刪除的圖像的副本以及說明,這是一個繁瑣的過程。
今天,媒體管理器被宣傳爲 OpenAI 退出解決方案的徹底改進和擴展。
OpenAI 在 5 月份的公告中表示,媒體管理器將使用“尖端機器學習研究”,使創作者和內容所有者能夠“告訴 [OpenAI] 他們擁有什麼”。OpenAI 聲稱在開發該工具時正在與監管機構合作,並表示希望媒體管理器能夠“爲整個 AI 行業樹立標準”。
從那以後,OpenAI 再也沒有公開提及過媒體管理器。
在沒有媒體管理器的情況下,OpenAI 實施了過濾器(儘管並不完善),以防止其模型重複訓練示例。在它所面臨的訴訟中,該公司繼續聲稱享有合理使用保護,聲稱其模型創造的是變革性作品,而不是抄襲作品。
OpenAI 很有可能在版權糾紛中獲勝。
法院可能會判定該公司的人工智能具有“變革性目的”,這是 大約十年前出版業起訴谷歌的先例 。在那起案件中,法院裁定谷歌複製數百萬本圖書用於谷歌圖書(一種數字檔案)是允許的。
OpenAI 曾公開表示,如果不使用受版權保護的材料(無論是否授權),訓練具有競爭力的人工智能模型是“不可能的”。該公司在 1 月份提交給英國上議院的一份文件中寫道:“將訓練數據限制在一個多世紀前創作的公共領域書籍和圖畫上可能會產生一個有趣的實驗,但不會提供滿足當今公民需求的人工智能系統。”
如果法院最終宣佈 OpenAI 勝訴,那麼媒體管理器就沒有什麼法律意義了。OpenAI 似乎願意下這個賭注——或者重新考慮其退出策略。