智通財經APP獲悉,中國銀河證券發佈研究報告稱,出版行業公司大多擁有豐富的電子化的圖文資源,這可以作爲國內外大模型訓練的重要數據集。出版行業公司在版權和IP上的資源優勢有望助力其作爲海內外AI大模型研發的重點助力。疊加當前出版行業本身整體估值相對較低。建議關注行業內擁有大量可數字化的優質內容和獨有素材的公司:中原傳媒(000719.SZ)、中國出版(601949.SH)、鳳凰傳媒(601928.SH)、中信出版(300788.SZ)、山東出版(601019.SH)等。
事件:近期,新聞出版巨頭施普林格出版集團(AxelSpringer)與ChatGPT開發機構OpenAI簽署協議,成爲全球第一家與OpenAI合作將新聞業與人工智能技術進行更深入整合的出版機構。ChatGPT用戶將收到AxelSpringer旗下品牌的新聞報道摘要以及原始報道來源的歸屬和鏈接,充分優化OpenAl的模型在其聊天機器人的回答結果。AxelSpringer還將提供其媒體品牌的內容來作爲OpenAl大型語言模型的訓練數據,幫助訓練OpenAI旗下的人工智能模型GPT-4。
中國銀河證券觀點如下:
大模型訓練數據付費,有望創造新收入:
OpenAI與AxelSpringer簽訂的協議表明,人工智能在使用媒體品牌內容進行大模型訓練時將需要向媒體品牌付費,這意味着AI大模型向數據提供方的知識產權付費或將成爲行業趨勢。對於擁有高質量數據資源的出版行業公司來說,這一付費模式有望幫助它們利用現有的“塵封”版權資源,創造高質量的數據集以服務AI大模型廠商,從而創造新的營收增長點。
大模型數據需求旺盛,利好版權出海概念:
據NewsMediaAlliance發佈報告內容表明,用於訓練熱門人工智能模型的數據集“顯著”更多地依賴於出版商內容,與通用網絡內容相比,其比重範圍從5倍多到近100倍。該行認爲,在訓練數據集付費即將成爲大趨勢的前提下,海外大模型訓練需要的高質量數據集將通過版權出海的方式實現。因此,具有高質量、高稀缺性數據資源的出版公司將有望通過版權出海的方式開闢新業務增長點。
大模型訓練數據版權政策出臺,凸顯優質訓練數據價值:
年內多地出臺促進AI技術發展的政策文件,如《北京市促進通用人工智能創新發展的若干措施》和《深圳市加快推動人工智能高質量發展水平應用行動方案》,其中均提到“高質量數據集”。此外,國家網信辦等七部門聯合發佈的《生成式人工智能服務暫行管理辦法》規定了生成式AI服務提供者不得侵害他人知識產權。該行認爲,當前AI政策密集出臺,高質量數據集和訓練數據版權問題得到重視,未來優質訓練數據庫的價值將得到凸顯。
風險提示:版權出海進度不及預期的風險,出版市場政策出現變化的風險,大模型發展進度不及預期的風險