中信證券:Sora橫空出世標誌着AI大模型保持高速迭代升級 建議關注三條投資主線

發布 2024-2-23 上午08:26
中信證券:Sora橫空出世標誌着AI大模型保持高速迭代升級 建議關注三條投資主線

智通財經APP獲悉,中信證券發佈研報表示,近期隨着Sora橫空出世,該行認爲其標誌着AI大模型保持高速迭代升級,AI大模型在泛化以及特化兩條發展路徑取得了長足進步。OpenAI再次推出行業顛覆級新產品,Sora爲目前文生視頻領域SOTA模型,在時長、分鏡、物理引擎、視頻格式、語義理解等文生視頻重點指標均大幅優於同類別產品。

展望行業未來發展趨勢,該行認爲Sora再次驗證當下AI大模型行業的規模效應規律,算力仍爲AIGC行業發展“底座”,以AI芯片爲核心的算力產業鏈仍具備空中加油的潛力。同時,該行認爲Sora有望在短視頻領域率先應用,短視頻的時長普遍在60秒及以下,Sora的內容產出能力充分適配短視頻時長與使用場景,可以大幅提升創作效率並降低創作門檻。此外,Sora等AI工具將大幅降低大衆利用AI合成高質量視頻的難度,AIGC內容濫用風險或將持續擴大,因此該行認爲AIGC監管重要性也將持續提升。

該行綜合梳理三條投資主線:1)受益於算力產業鏈高景氣的支撐硬件;2)受益於AI大模型升級的AI應用;3)AIGC內容濫用風險擴大帶來豐富的AI監管需求。

中信證券的主要觀點如下:

OpenAI發佈Sora,重新定義文生視頻。

近期,OpenAI發佈文生視頻大模型Sora,再次點燃AIGC行業。根據OpenAI官網信息,Sora可生成時長爲1分鐘的高清視頻,初步具備對通用物理世界進行建模的能力。2023年以來,AIGC在文字、圖片以及視頻生成領域均迎來跨越式發展,該行認爲Sora爲目前文生視頻領域SOTA(state-of-the-art)模型,在時長、分鏡、物理引擎、視頻格式、語義理解等領域均大幅優於同類別產品:

1)時長方面,根據新京報貝殼財經數據,在相同的提示詞下,Sora可生成近1分鐘的視頻,Pika僅能生成3秒的視頻,Gen-2video可以生成4秒的視頻;

2)分鏡方面,該行認爲Sora具備媲美人類的場景設計能力,可直接輸出多角色、多場景和運鏡的視頻;

3)物理引擎方面,根據OpenAI官網公開的樣例,該行認爲Sora已初步具備模擬物理世界運行方式的能力,尤其對物體紋理以及物體運行軌跡模擬優於同類別產品;

4)視頻格式方面,Sora可支持多樣式視頻格式,可以採樣寬屏1920x1080p視頻、豎屏1080x1920視頻以及介於兩者之間的所有視頻格式,具備更高的可用性;

5)語義理解方面,Sora對提示詞有更深入的理解,能夠準確理解用戶意圖,在同一視頻的不同畫面可保持一致的視覺風格,保持較強的邏輯性。

融合多類型技術方案,OpenAI引領AIGC升級。

OpenAI持續推動AIGC行業發展,Sora橫空出世體現了OpenAI已將其在文字以及圖片生成領域的領先優勢延展至視頻領域。根據OpenAI官網技術文檔,OpenAI應用了諸如時空補丁(Spacetime Patches)、擴散轉換器(Diffusion Transformers)等技術,可將各類可視化數據轉化爲統一表示,從而達成生成式模型的大規模訓練,並最終實現生成不同持續時間、縱橫比和分辨率的視頻和圖像。另外,OpenAI也在Sora中借鑑或應用了DALL·E3和GPT技術,藉助其綜合AI大模型能力實現文生視頻SOTA模型。Sora借鑑DALL·E3中的re-captioning技術,對高度描述性的視頻轉譯進行訓練,顯著提高文本保真度和視頻的整體質量。同時,OpenAI還利用GPT技術將簡短的用戶提示轉換爲更長的詳細轉譯,使得Sora能夠精確地按照用戶提示生成高質量的視頻。

規模效應(Scaling Law)持續有效,算力產業鏈仍具備空中加油的潛力。

AI大模型具有“湧現能力”,當訓練量超過某個閾值時,模型精度會突然暴增。根據OpenAI官網技術文檔,Sora研發團隊發現擴散轉換器在視頻生成領域具有巨大的潛力,展示了不同訓練階段下,使用相同種子和輸入的視頻樣本對比,結果發現隨着訓練量的增加,樣本質量有着明顯的提高。該行認爲Sora實現現象級文生視頻效果再次證明,在現有的AI模型框架下,規模效應仍爲最有效方案之一,提供更爲充沛的算力基礎繼而提升模型訓練量爲升級AI大模型表現的重要途徑。因此,隨着AIGC行業技術發展,AI大模型向着泛化及特化兩條路徑持續發展,該行認爲算力仍爲AIGC行業發展“底座”,頭部科技企業仍將進行“算力軍備競賽”以推進AI大模型能力持續升級,以AI芯片爲核心的算力產業鏈仍具備空中加油的潛力。

該行預計文生視頻將在短視頻行業率先應用,2025年潛在市場空間中值達80億元。

Sora模型出色的語義理解、視頻編輯和擴展能力爲創作者提供了靈活和廣泛的創意空間,該行認爲有望加速文生視頻應用在各行業的滲透率。短視頻的時長普遍在60秒及以下,Sora的內容生成能力充分適配短視頻時長及應用場景,可以大幅提高創作效率並降低創作門檻。目前,我國短視頻行業仍處在快速發展階段,根據《2023中國網絡視聽發展研究報告》(中國互聯網絡信息中心),2022年我國短視頻市場規模接近3000億元。該行假設視頻創作成本佔短視頻市場規模的10%,在AI+視頻滲透率5%-35%、短視頻中視頻創作市場規模340-460億元的假設下,該行測算國內文生視頻應用在短視頻領域2025年潛在市場空間中值達80億元。

AIGC內容濫用風險擴大,AIGC監管重要性提升。

隨着Sora逐步推廣,大衆利用AI合成高質量視頻的難度將會進一步降低。因此,AIGC濫用生成包含有害內容或虛假信息的文本、照片、視頻,對個人、機構、社會帶來了新的安全問題。根據量子位智庫預測,中國AIGC市場規模有望在2030年達到11491億元。信息化投入中,安全投入佔比一般在5%-10%以上。由於AI大模型的特殊性,AI安全將會貫穿從數據標註、模型訓練和開發、內容生成、應用開發的全過程,投入佔比較高。該行假設AIGC監管在整個產業鏈中的佔比爲5%-10%,則測算出2030年我國AIGC監管市場規模將達到575-1149億元。

風險因素:

Sora等文生視頻模型商業化進展不及預期;Sora等文生視頻模型實際使用體驗不及預期;算力成本優化不及預期;政策監管持續收緊;行業競爭持續加劇;AI監管發展不及預期;地緣政治風險。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利