獲取40%折扣優惠
最新!💥 獲取ProPicks查看哪些策略擊敗標普500指數1,183% 領取40%折扣優惠

華泰證券:開源模型發展達新里程碑 後續需關注國內大模型應用發展

發布 2024-4-23 上午09:58
© Reuters.  華泰證券:開源模型發展達新里程碑  後續需關注國內大模型應用發展

智通財經APP獲悉,華泰證券發佈研報稱,北京時間4月19日,Meta發佈Llama 3,本次開源參數量爲8B和70B的兩個版本,未來數個月內還會推出其他版本,升級點包括多模態、多語言能力、更長的上下文窗口和更強的整體功能。Llama 3性能大幅超越前代Llama 2,在同等級模型中效果最優。Meta目前正在訓練超過400B的版本,性能比肩GPT-4,但尚未決定是否開源。對於國內大模型,後續需要關注:1)Llama 3中文化促進國內AI垂類模型、大模型應用的性能提升;2)Llama 3中文化與國內閉源模型的競爭。

華泰證券主要觀點如下:

模型效果:大幅超越前代Llama 2,同等級效果最優

Llama 3分爲大中小三個版本,相比其他模型:小規模的8B模型效果比同類大小的模型Mistral 7B、Gemma 7B略好或基本持平;中等規模的70B模型效果比Gemini Pro 1.5、Claude 3 Sonnet略好或相當,並超過GPT-3.5;最大的400B模型仍在訓練過程中,設計目標是多模態、多語言,根據Meta公佈的目前訓練數據,其性能與GPT-4相當。相比前代Llama 2:對比指令精調模型,Llama 3 8B在多項基準測試中超過Llama 2 70B。在未來幾個月中,Meta將發佈多個具有新功能的模型,包括多模態、多語言能力、更長的上下文窗口和更強的整體功能,並將發佈研究論文。

技術亮點:訓練數據量與上下文長度擴充,GQA提升推理效率

華泰證券表示,Llama 3的模型結構相比Llama 2變化不大,都採用decoder-only架構,技術亮點主要在於預訓練數據量、上下文長度、分組查詢注意力機制:1)訓練數據量極大擴充。Llama 3經過超15T token的預訓練,訓練數據集比Llama 2使用的數據集大七倍,其中代碼數據擴充了4倍,使得Llama 3的代碼能力和邏輯推理能力大幅度提升。2)上下文長度擴充。Llama3支持8k上下文長度,是Llama 2的2倍,同時大大降低了錯誤拒絕率,改善了一致性,但相比其他主流模型仍有差距(GPT-4 turbo 128k,Claude 3 100k,GPT-4 32k);3)採用分組查詢注意力(GQA)以加速推理。

應用:智能助手Meta AI、雷朋Meta智能眼鏡等

Meta同時更新基於Llama 3構建的智能助手Meta AI,無需切換即可在 Instagram、Facebook、WhatsApp和Messenger的搜索框中暢通使用Meta AI。Llama 3很快將在AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM和Snowflake上推出,並得到AMD、AWS、戴爾、英特爾、英偉達、高通提供的硬件平臺的支持。此外,雷朋Meta智能眼鏡也將支持多模態的Meta AI。

行業觀點:利好AI應用,關注Llama 3中文化與國內閉源大模型競爭

華泰證券表示,Llama 3的推出爲開源模型注入了新的活力,未來還將新增多模態能力,看好Llama 3促進AI應用繁榮。海外頭部廠商中,OpenAI和谷歌閉源模型領先,Meta憑藉開源模型獨樹一幟的競爭格局繼續維持。對於國內大模型,後續需要關注:1)Llama 3中文化促進國內AI垂類模型、大模型應用的性能提升;2)Llama 3中文化與國內閉源模型的競爭。

風險提示:AI及技術落地不及預期;本研報中涉及到未上市公司或未覆蓋個股內容,均系對其客觀公開信息的整理,並不代表本研究團隊對該公司、該股票的推薦或覆蓋。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2024 - Fusion Media Limited保留所有權利