智通財經APP獲悉,天風證券發佈研究報告稱,在圖像生成領域,以擴散模型爲代表的方法已經取得了特別成功,迅速取代了基於生成對抗網絡(GANs)和自迴歸變換器的方法。該行認爲從排名靠前的應用中可以看出多模態AIGC與效率工具有可能是GPTs應用中的重要部分,多模態領域較高的比重也說明了圖片與視頻模態的生成是用戶需求的主要方向之一。text-to-video技術的奇點正在加速到來,該行看好視頻多模態領域的AI產業機會。
天風證券主要觀點如下:
採取擴散模型的視頻生成與編輯算法取得快速突破,Runway、Pika等公司產品持續迭代
在圖像生成領域,以擴散模型爲代表的方法已經取得了特別成功,迅速取代了基於生成對抗網絡(GANs)和自迴歸變換器的方法。同樣自從VideoDiffusionModel首次嘗試設計用擴散模型用於視頻生成後,擴散模型在視頻生成,於2023年迎來了學術上的快速發展,相應的論文數量顯著增加。相應的,Runway、Pika等公司的產品也在取得持續突破,Runway從3月份測試GEN-2模型開始,6月份正式向公衆發佈,隨後在11月更新了4K模式,生成視頻的一致性也迎來了重大改進,不連貫、閃爍變形等問題逐步解決。Pika在7月份於Discord推出服務器,截至目前用戶已超50萬,隨後在11月29日推出了Pika1.0,用戶能夠通過Pika實現畫布延展、局部修改、視頻時長拓展等編輯需求。
GPTs應用數量突破3萬,截止12月1日,最佳GPTs應用聚焦於多模態AIGC與效率工具
從最流行的10個GPTs應用來看,5個爲包括圖像和視頻生成在內的多模態AIGC領域,3個爲與包括寫作在內的效率工具,其餘2個爲與Coding相關、主要面向開發者的網頁設計,排名前五的分別是面向科研人員的ResearchGPT、多模態生成的BrickBoxGenerator、PhotoMultiverse、VideoGPTbyVEED,和撰寫博客等文章的Bloggy:AutomatedBlogPostWriter。該行認爲從排名靠前的應用中可以看出多模態AIGC與效率工具有可能是GPTs應用中的重要部分,多模態領域較高的比重也說明了圖片與視頻模態的生成是用戶需求的主要方向之一。
text-to-video技術的奇點正在加速到來,該行看好視頻多模態領域的AI產業機會
文生視頻是一個年輕的方向,該領域面臨多方面的挑戰,包括高算力成本、缺乏高質量的數據集等,但隨着視頻擴散模型技術的突破,VideoLDM、Text2Video-Zero、RunwayGen1、RunwayGen2等算法模型不斷湧現,該行也看到以Runway爲代表的企業在近半年內取得了較大的進步,生成視頻的一致性和保真度也有了較大改進,該行看好未來在視頻多模態領域的應用機會,同時算力基礎設施在視頻模態技術的帶領下也有望迎來快速增長。
建議關注:多模態應用:萬興科技、美圖公司(與海外組聯合覆蓋)、易點天下、網達軟件、焦點科技、當虹科技
算力:(1)華爲昇騰:神州數碼、高新發展、烽火通信、拓維信息、廣電運通;(2)非華爲國產AI芯片:海光信息、寒武紀、雲天勵飛、景嘉微(與電子組聯合覆蓋)
風險提示:自主芯片技術不及預期、視頻多模態技術發展速度不及預期、應用推廣不及預期。