智通財經APP獲悉,中信建投發佈研究報告稱,當前國內大模型能力逐步提升,中文領域處理和部分特性如長文本處理等有對齊和領先優勢。隨着Kimi熱度提升,國內多家大模型廠商加入長文本能力競爭,產業C端落地加速。該行認爲模型迭代和推理需求提升,促進底層算力基礎設施需求釋放,利好算力產業鏈,此外,模型參數量起來,對於高質量的數據需求增加,數據豐富對模型效果有較大影響。
中信建投觀點如下:
國內大模型能力持續迭代,表觀參數逐步接近海外大模型。
自2022年底ChatGPT橫空出世,爲大家展示了AGI的巨大可能性後,國內廠商紛紛跟進推出自己的大模型產品,國內一度呈現“百模大戰”的投資和研發熱潮。在高端GPU獲取受限後國內大模型陷入了一段時間的瓶頸期。當前國內大模型競爭逐步向頭部互聯網廠商集中,這些廠商具備較強的研發能力,並且能夠承擔較高的早期投入,緊跟大模型發展浪潮,帶動自身大模型能力持續提升。具體來看,國內大模型綜合表現較海外模型落後,由於訓練數據源的差異和特性方向的訓練,例如數據源中具有更多的中文數據,在中文處理能力的在理解和生成方面較海外模型表現更好。此外,AI創業公司的大模型值得期待,例如23年10月發佈並於近期爆火的Kimi,憑藉200w長文本能力在金融領域掀起訪問熱潮;3月23日階躍星辰發佈Step-2萬億參數MoE語言大模型預覽版,從參數端對標GPT-4水平,可以看到國內大模型進入一個新紀元。
AIGC經歷去年普及後,活躍用戶數持增加,Kimi訪問火爆導致階段性宕機。
去年來,隨着AIGC帶來的新產業熱潮,國內各頭部廠商開發了辦公、設計、遊戲娛樂、電商等多個領域的相關應用。國內用戶對於這些應用也產生了較大熱情,根據Quest Mobile數據,截至2024年1月,國內前十大AIGC APP活躍用戶加總去重人數超5000萬人,同比增長超37倍。近期爆火的Kimi日度訪問人數持續提升,導致算力資源緊張,較多用戶在使用中出現宕機情況。Kimi所屬公司月之暗面發佈公告表示:自3月20日以來觀測到Kimi系統流量持續異常增高,公司已進行5次擴容,後續還將配合流量進行擴容以儘量承載持續增長的用戶量。
Kimi“鯰魚效應”,帶動多家大模型廠商宣佈開放長文本能力,產業端落地加速。
自Kimi宣佈內測200w長文本能力以來,國內頭部大模型廠商迅速跟進,百度文心一言將於下個月升級,提供200-500萬字長文本能力,相較當前2.8萬字顯著提升;阿里則表示將向全部用戶免費開放1000萬字長文檔處理功能。除長文本能力外,近日階躍星辰公佈的2萬億參數MoE大模型則從參數量角度對標GPT-4。Kimi的爆火有望帶動國內大模型+應用新一輪加速發展,持續推動模型能力迭代和應用月活提升。
總結:當前國內大模型能力逐步提升,中文領域處理和部分特性如長文本處理等有對齊和領先優勢。AIGC產業蓬勃發展,AIGC應用月活人數持續增長,2月活躍人數同比增長超37倍,突破5000多萬人次。Kimi近期訪問量快速增長導致出現間斷性宕機,公司已進行多次擴容仍無法滿足算力需求。隨着Kimi熱度提升,國內多家大模型廠商加入長文本能力競爭,產業C端落地加速。
同時,一方面,模型迭代和推理需求提升,促進底層算力基礎設施需求釋放,利好算力產業鏈;另一方面,模型參數量起來,對於高質量的數據需求增加,數據豐富對模型效果有較大影響。建議關注:1)AI應用:重點關注涉及長文本處理,如法律文本、合同文本、知識庫學習、閱讀、客服等需要文本知識輸出的場景的應用;2)算力產業鏈,預期隨着AI產業的發展,算力短期仍將處於需求大於供給的狀態;3)數據產業鏈,高質量合規數據的提供商有望持續受益模型迭代。