國泰君安:計算機國產大模型性能領先 場景應用加速落地

發布 2024-12-31 下午03:27
© Reuters.  國泰君安:計算機國產大模型性能領先 場景應用加速落地

智通財經APP獲悉,國泰君安發佈研報稱,DeepSeek-V3的發佈標誌着國產AI在規模、效率和成本方面實現重大突破。DeepSeek-V3在多項評測中超越多款頂尖模型,且成本極具競爭力,其強大性能與開源策略顯著提升了其市場競爭力,具備高投資價值。因此AI大模型在各行業落地的技術路徑有望逐步明確,MoE架構的低成本、高性能的大模型在垂類領域中的運用潛力巨大。

國泰君安主要觀點如下:

DeepSeek-V3的強大性能與開源策略顯著提升了其市場競爭力,具備高投資價值。

DeepSeek正式發佈了其全新系列模型DeepSeek-V3,並同步開源。該模型爲自主研發的MoE架構,擁有6710億參數和37億激活參數,在14.8萬億token上進行了預訓練。DeepSeek-V3在多個評測中超越了Qwen2.5-72B和Llama-3.1-405B等開源模型,其性能與頂尖閉源模型GPT-4o和Claude-3.5-Sonnet相媲美。尤其在知識類任務、長文本處理、代碼編寫和數學競賽等方面表現出色。

DeepSeek-V3的生成速度提升和靈活的API定價策略爲用戶帶來更高的使用價值。

通過算法和工程上的創新,DeepSeek-V3的生成吐字速度從每秒20次提升至60次,實現了3倍的性能提升,用戶體驗更加流暢。DeepSeek調整了API服務的價格,新的定價爲每百萬輸入tokens0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens8元。高性價比有望爲DeepSeek帶來了更大市場份額和收入增長。

DeepSeek-V3的開源權重和本地部署能力增強其社區支持和應用擴展性,推動了技術生態發展。

DeepSeek-V3採用FP8訓練,並開源原生FP8權重,得到開源社區的廣泛支持。DeepSeek提供從FP8到BF16的轉換腳本,方便社區進行適配和拓展應用場景。模型權重可通過HuggingFace平臺下載,進一步促進了本地部署和多樣化應用。這種開放的生態系統爲其在AGI普惠化方面奠定了堅實基礎。

風險提示:較低定價壓縮盈利空間,技術競爭加劇的風險。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利