金融圈重磅消息!彭博研究人員最新推出BloombergGPT 在金融任務上的表現遠超現有模型

發布 2023-3-31 下午02:03
金融圈重磅消息!彭博研究人員最新推出BloombergGPT 在金融任務上的表現遠超現有模型

FX168財經報社(香港)訊 週五(3月31日)最新消息,美國彭博社重磅發佈爲金融界構建的大型語言模型(LLM)——BloombergGPT。該模型依託彭博社的大量金融數據源,構建了一個3630億個標籤的數據集,支持金融行業內的各類任務。

彭博社主要是一家金融數據公司,數據分析師在公司成立的40年的時間裏收集了大量的金融文件,擁有廣泛的金融數據檔案,涵蓋一系列的主題。

根據彭博社最新發布的報告顯示,其構建迄今爲止最大的特定領域數據集,並訓練了專門用於金融領域的LLM,開發了擁有500億參數的語言模型——BloombergGPT。

據悉,該模型在金融任務上的表現遠超過現有模型,且在通用場景上的表現與現有模型也能一較高下。

在BloombergGPT相關論文中顯示,BloombergGPT 的優勢包括特定領域模型仍有其不可替代性且彭博數據來源可靠,金融相關任務上的性能明顯優於現有模型等。

彭博報告指出,自然語言處理(NLP)在金融科技領域應用廣泛且複雜,應用範圍包括情感分析、命名實體識別和問答系統等。大型語言模型(LLM)已經被證明在許多任務中有效;然而,在文獻中並沒有報道專門爲金融領域設計的 LLM。在這個研究中,我們介紹了BloombergGPT,一個擁有500億參數的語言模型,它通過廣泛的金融數據進行訓練。

報告顯示:「我們基於彭博社的數據源構建了3630億個標籤的數據集,並將其從通用數據集中添加到其中,這可能是目前金融領域最大的數據集之一。我們使用標準 LLM 基準、開放金融基準和一組內部基準來驗證BloombergGPT,這些方法最能準確地反映我們的意圖使用。我們的混合數據集訓練導致在金融任務中比現有模型表現優異,而無需犧牲通用 LLM 基準的性能。此外,我們解釋了我們的建模選擇、訓練過程和評估方法。作爲下一步,我們計劃發佈訓練日誌( Chronicles),詳細描述我們在訓練BloombergGPT 時的經歷。」

(截圖來源:Paper Reading)

報告指出,從測試結果來看,BloombergGPT在五項任務中的四項(ConvFinQA,FiQA SA,FPB和Headline)表現最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT具有其優勢性。

(截圖來源:彭博社)

擁有近20萬粉絲的推特賬號「外匯交易員」在推特上寫道,彭博發文介紹BloombergGPT,依託自身海量金融數據,構建了一個3630億個標籤的數據集,基於通用和金融業務的場景進行了混合模型訓練。彭博稱其在金融任務上超過了現有的模型(信息理解、情感分析、標註、實體命名等),而在通用場景上的表現則與之相當甚至優於現有模型。

(截圖來源:推特)

就最新的BloombergGPT,ChatGPT如何看待自己的競爭對手?

ChatGPT認爲,BloombergGPT是專門爲金融領域開發的一種語言模型,可以更好地處理金融領域的數據和任務,並且在金融領域的基準測試中表現出色。這將有助於金融從業者更好地理解和應用自然語言處理技術,促進金融科技的發展。BloombergGPT還可以爲其他領域的語言模型的發展提供參考和借鑑。總的來說,BloombergGPT是一個有益的技術創新。

成立於1981年的美國彭博資訊公司,是全球最大的財經資訊公司,其前身是美國創新市場系統公司。

彭博社是全球最大的金融信息服務供應商,其數據終端系統「彭博專業服務」可以幫助客戶查閱和分析實時的金融市場數據,並進行交易。使用該數據終端的客戶遍佈全球,包括交易員、投行、美聯儲、美國其他官方機構以及全球各大央行等。

原文鏈接

最新評論

風險聲明: 金融工具及/或加密貨幣交易涉及高風險,包括可損失部分或全部投資金額,因此未必適合所有投資者。加密貨幣價格波幅極大,並可能會受到金融、監管或政治事件等多種外部因素影響。保證金交易會增加金融風險。
交易金融工具或加密貨幣之前,你應完全瞭解與金融市場交易相關的風險和代價、細心考慮你的投資目標、經驗水平和風險取向,並在有需要時尋求專業建議。
Fusion Media 謹此提醒,本網站上含有的數據資料並非一定即時提供或準確。網站上的數據和價格並非一定由任何市場或交易所提供,而可能由市場作價者提供,因此價格未必準確,且可能與任何特定市場的實際價格有所出入。這表示價格只作參考之用,而並不適合作交易用途。 假如在本網站內交易或倚賴本網站上的資訊,導致你遭到任何損失或傷害,Fusion Media 及本網站上的任何數據提供者恕不負責。
未經 Fusion Media 及/或數據提供者事先給予明確書面許可,禁止使用、儲存、複製、展示、修改、傳輸或發佈本網站上含有的數據。所有知識產權均由提供者及/或在本網站上提供數據的交易所擁有。
Fusion Media 可能會因網站上出現的廣告,並根據你與廣告或廣告商產生的互動,而獲得廣告商提供的報酬。
本協議以英文為主要語言。英文版如與香港中文版有任何歧異,概以英文版為準。
© 2007-2025 - Fusion Media Limited保留所有權利