💎 查看市場今日表現最穩健公司立即開始

京東發佈千億級大模型「言犀」,號稱「最懂產業的大模型」

發布 2023-7-14 下午04:53

全球大模型競賽依舊在持續,京東也推出自己的千億級大模型「言犀」。

7月13日,在2023京東全球科技探索者大會暨京東雲峰會上,京東推出言犀大模型,率先佈局產業應用。同時,京東還發佈言犀AI開發計算平台,該平台已經啓動預約注冊,預計8月正式上線。

與一般大模型相比,京東言犀具備天然的「產業基因」。京東集團技術委員會主席曹鵬表示,京東靈犀大模型源於產業、服務產業,具有更高的產業屬性。

從場景中來,回到場景中去

大模型背後競爭的本質,或是數據要素的競爭。

智能大模型訓練是指使用大規模數據和高級計算資源對深度學習等人工智能訓練的過程。

在人工智能領域,大模型通常指的是參數數量龐大、層數深的神經網絡模型,如ChatGPT等。這些模型具有強大的學習能力和表達能力,但同時也需要大量的數據和計算資源來進行訓練。

由此,大模型訓練所需要的數據的重要性越來越突出,數據規模與質量都會影響模型最終呈現效果。

從過往大模型發展看,很多Transformer的通用大語言模型都依賴於來自維基百科、CommonCrawl、書籍、期刊等大型公共數據集,以及大量從互聯網上抓取到的内容。

與之相比,京東言犀大模型孵化於產業場景豐富的京東,具備天然的「產業基因」。

作為一家新型實體企業,京東具備豐富的產業場景,包括零售、物流、科技、健康、工業、產發等領域,積累下每年數百億條優質交互數據。

深厚的產業數據積累,以及千行百業Know-How,成為京東佈局大模型的核心優勢。京東用於訓練言犀大模型的數據庫,便是由70%通用數據和30%供應鏈原生數據組成,由此,訓練出的大模型天然具備「產業基因」,具有「更高產業屬性、更強泛化能力、更多安全保障」的優勢。

此外,在訓練過程中,京東言犀還採用數萬小時含有不同噪音、方言的真實場景數據進行叠代,包括把正常語境下的句子變成一種含有噪聲或方言的數據再輸入到模型里,從而進一步提升模型的抗幹擾能力。

源於產業、用於產業,京東言犀未來將服務於產業,致力於深入零售、物流、金融、健康、政務等知識密集型、任務型產業場景,解決真實產業問題。

此前言犀已經與大同12345政務熱線合作,呼入電話接起率達到100%。同時,言犀也自動完成了工單創建、智能匹配至對應委辦局、跟蹤工單執行情況、自動對市民回訪等全閉環流程。

在養老行業,言犀還聯合天津市河西區的智慧養老服務平台,每天早上9點自動給近5000名獨居老人撥打問候電話,避免其突發疾病或無人照顧等情況。

京東集團CEO許冉表示,「大模型真正實現自己的價值,一定是在產業應用中。」「京東的大模型技術演進,遵循了京東的技術追求:成本、效率、體驗、可信、普惠、突破。成本、效率和體驗是從京東的經營理念傳承而來,也是零售的第一性原理。可信、普惠和突破則是技術服務於產業和社會的承諾。」

京東集團技術委員會主席、京東雲事業部總裁曹鵬表示,「數智供應鏈訓練了產業大模型,而大模型則依託供應鏈深入產業」。

依託京東言犀大模型,以及京東在產業和供應鏈側的優勢,京東還發佈了兩大服務平台,包括全新升級的優加DaaS和言犀智能服務平台,以及面向零售、金融、城市、健康、物流五大領域的行業解決方案。

京東積極錘煉大模型

京東從很早就開始佈局大模型。

京東探索研究院院長、京東科技智能服務與產品部總裁何曉冬公開表示,京東大模型並不是馬上就產生的,而是多年的鋪墊。2020年時京東就關注到了深度學習模型和語言生成,當時也開啓了語言模型研發。

2021年,京東推出十億級模型K-PLUG,2022年推出百億級模型Vega,本次大會則展示了千億級模型。

一開始,京東就發揮供應鏈和豐富的產業場景優勢,來訓練更加適合行業使用要求,更容易實現場景落地的大模型產品。

其早先研究的K-PLUG模型已經在京東的發現好貨等場景廣泛應用。其對於給定商品的sku,可以自動生成長度不等的商品文案,目前已經覆蓋2000多個京東的品類。在商品文案的生成上,K-PLUG明顯比ChatGPT的更加符合商家需求。

2022年針對模型泛化性不足,京東提出了百億級模型Vega,服務京東物流一站式數智化供應鏈數據管理平台,助力企業降本增效。

百億級模型之後,今年京東再推出千億級大模型。本次千億級大模型言犀推出,讓京東形成了一套大模型的完整工具鏈:言犀AI開發計算平台、向量數據庫,以及全新升級的基礎設施雲艦、雲海和京剛。

國内大模型千帆競發

ChatGPT系列大模型再次引發人工智能在全球的火爆,國内互聯網大廠也紛紛秀肌肉。2023年以來,國内大模型產品批量湧現。

今年3月,百度發佈國内首個知識增強大語言模型「文心一言」,只需簡單提出需求,文心一言就能自動生成内容,並能設計排版、AI繪畫等。

日前,百度文心大模型正式從3.0升級到3.5,在問答、推理、代碼、文生圖等能力都向前邁了一步,實現安全性顯著提升,訓練和推理速度也大幅提升。

另一家人工智能龍頭科大訊飛(002230.SZ)在今年5月正式發佈「1+N認知智能大模型」星火,並火速在AI學習機的中英文作文輔導、中英文口語學習,以及訊飛聽見一段錄音一鍵成稿、訊飛辦公本自動文本摘要等場景落地。

6月,訊飛星火還迎來V1.5版本更新,在開放式知識問答、多輪對話等多方面都有全新升級。

此外,國内大模型領域還湧現出通義千問、商量、序列猴子……據世界人工智能大會官方微信披露數據,2023年的大會上聚齊了三十多個大模型及相關產品。

在行業發展如火如荼之際,相關監管政策也落地。

7月13日,《生成式人工智能服務管理暫行辦法》自2023年8月15日起施行,以促進生成式人工智能健康發展和規範應用。

東方證券認為,認為,《暫行辦法》的實施初步建立起了我國對於生成式人工智能領域的監管體系,並且未來將會進一步完善。隨著監管體系的逐步建立,我國的AI領域從基礎模型到上層應用的商業化進程將有望快速推進,AI生態有望快速建立。

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2024 - Fusion Media Limited保留所有權利