智通財經APP獲悉,近日,新華社研究院中國企業發展研究中心發佈《人工智能大模型體驗報告3.0》報告,對主流大模型進行了全面的評估,併爲中國企業的大模型產品選型提供了專業指導。報告顯示,商湯(00020)商量SenseChat在定量實測的情商維度上,位居全部10款大模型第一,並在定性評估中入選大模型市場未來領袖象限。此外,商湯賦能電力AI平臺智能化升級的實踐,也入圍此次新華社研究院報告的“廠商最佳實踐案例”。
新華社研究院:商量SenseChat情商表現第一,中國大模型市場的“未來領袖”
新華社研究院測評選取了10家國產主流大模型產品,進行了深入的定量實測,覆蓋基礎能力、智商、情商和工作提效四個維度的1000道題,並精選其中的400道進行實際問答測試,準確地反映大模型在不同場景和問題下的實際表現。
實測中,商湯商量取得1746分的優異結果,其中情商維度表現位居10家主流大模型第一。分析顯示,在智商指數方面,商湯商量能夠根據指令回答問題;在情商指數方面,能夠給出方案詳盡,問題切入角度多樣,且能夠引發用戶進行深入思考的答覆。
而在工作提效方面,商湯商量不僅能夠較好地解答日常疑惑,在法學、經濟學、文學方向上也表現不凡,能夠以較快的速度響應並給出準確可信的結果。
同時此次評測升級了評測體系,首次納入象限評估模式,從“技術實力”和“發展潛力”兩個維度進行詳細的定性分析,並選入未來領袖、技術爲王、潛力無限和中規中矩四個象限,體現大模型在技術和市場方面的綜合實力。商湯商量也憑藉在“技術實力”和“發展潛力”不俗的表現,在衆多大模型中脫穎而出,被新華社研究院認可爲中國大模型市場的“未來領袖”。
廠商最佳實踐案例:商湯商量助力能源電力企業升級AI平臺
隨着大模型能力提升,以及應用場景的逐步豐富。新華社研究院報告指出,以商湯商量爲代表,大模型已經覆蓋了職場、營銷、出行、生活、公文、客服等多個行業和場景。同時,大模型的產業價值也受到了越來越多的關注。如何將大模型與產業深度融合,通過提升生產效率、優化決策和管理、創新業務模式等,推動社會經濟的發展和進步,成爲了大模型廠商更爲重要的課題。
在新華社研究院報告的“廠商最佳實踐案例”部分,商湯與電力企業共同探索大模型技術與新型電力系統的創新結合,並在電力生產和運維領域應用大模型技術,實現了降本增效,助力電力企業AI平臺的智能化升級。
這個案例中,某國有電力企業希望藉助大模型能力,爲龐大規模用戶提供高質量服務。同時在電網自動化巡檢、電力調度等領域,也面臨着智能化能力構建和提升的迫切需求。面對這一需求,以商湯大模型體系爲核心,雙方共同探索電力人工智能平臺建設,優先解決在運維場景對長尾故障和缺陷進行智能識別和判斷的問題。根據規劃,未來雙方將共同推動電力行業AI大模型訓練與應用、算力建設、標準建設、產業轉化和市場拓展,加快推動電力行業的人工智能創新及應用。
據統計,目前商湯商量在金融、手機、醫療、汽車、地產、能源、傳媒、工業製造等衆多垂直行業,已經與超過500家客戶建立了深度合作,和行業企業一起探索大模型的產業落地,加速賦能企業的智能化轉型。新華社研究院報告也認爲,隨着大模型快速的升級迭代,大模型的技術能力開始越來越多地體現在產品能力上,大模型將會推動數字經濟和產業經濟的深度融合,掀起一輪技術革命,爲社會經濟發展提供源源不斷的科技動力。
領先基礎設施和研發體系,鞏固商湯大模型競爭力
事實上商湯商量今年4月正式推出,是國內最早推出的基於千億參數大語言模型的產品之一,並一直不斷迭代更新。在今年9月SuperCLUE的評測中,商湯商量位列中文大模型總榜及AI智能體子榜雙榜排名第一,展示了在大模型方面極強的綜合競爭力。
這些離不開商湯對人工智能基礎設施的前瞻性打造、以及圍繞大模型及研發體系的規模化投入。商湯以SenseCore商湯AI大裝置爲基礎,建立了一套工程化的體系來支撐大模型的快速迭代,軟件、系統、和硬件都在以服務大模型快速迭代爲目標做研發配合,實現了敏捷、低成本、大批次地做模型迭代,有助於商湯發現大模型最好、最有效的生產配方。
其中商湯上海臨港AIDC是目前全國規模最大的人工智能智算中心之一,截止2023年8月底已上架的GPU數量達到約3萬張。而在對大模型的迭代訓練過程中,商湯也積累了稀缺的算法和工程上的專業知識,以及改進數據管理的方法。商湯通過人工和算法結合的方式,對原始語料數據來做分門別類的精細化清洗,目前已經實現每月產出2萬億token的高質量訓練數據,預計在2023年底,可以突破10萬億token。
藉助這些豐厚、領先的算力和數據資源,商湯不斷優化迭代大模型能力,同時創造領先的大模型落地和生成式AI應用生態,通過幫助客戶打造行業大模型和更多的領域應用,推動更多產業的智能化升級。