FX168財經報社(香港)訊 週五(3月31日)最新消息,美國彭博社重磅發佈爲金融界構建的大型語言模型(LLM)——BloombergGPT。該模型依託彭博社的大量金融數據源,構建了一個3630億個標籤的數據集,支持金融行業內的各類任務。
彭博社主要是一家金融數據公司,數據分析師在公司成立的40年的時間裏收集了大量的金融文件,擁有廣泛的金融數據檔案,涵蓋一系列的主題。
根據彭博社最新發布的報告顯示,其構建迄今爲止最大的特定領域數據集,並訓練了專門用於金融領域的LLM,開發了擁有500億參數的語言模型——BloombergGPT。
據悉,該模型在金融任務上的表現遠超過現有模型,且在通用場景上的表現與現有模型也能一較高下。
在BloombergGPT相關論文中顯示,BloombergGPT 的優勢包括特定領域模型仍有其不可替代性且彭博數據來源可靠,金融相關任務上的性能明顯優於現有模型等。
彭博報告指出,自然語言處理(NLP)在金融科技領域應用廣泛且複雜,應用範圍包括情感分析、命名實體識別和問答系統等。大型語言模型(LLM)已經被證明在許多任務中有效;然而,在文獻中並沒有報道專門爲金融領域設計的 LLM。在這個研究中,我們介紹了BloombergGPT,一個擁有500億參數的語言模型,它通過廣泛的金融數據進行訓練。
報告顯示:「我們基於彭博社的數據源構建了3630億個標籤的數據集,並將其從通用數據集中添加到其中,這可能是目前金融領域最大的數據集之一。我們使用標準 LLM 基準、開放金融基準和一組內部基準來驗證BloombergGPT,這些方法最能準確地反映我們的意圖使用。我們的混合數據集訓練導致在金融任務中比現有模型表現優異,而無需犧牲通用 LLM 基準的性能。此外,我們解釋了我們的建模選擇、訓練過程和評估方法。作爲下一步,我們計劃發佈訓練日誌( Chronicles),詳細描述我們在訓練BloombergGPT 時的經歷。」
(截圖來源:Paper Reading)
報告指出,從測試結果來看,BloombergGPT在五項任務中的四項(ConvFinQA,FiQA SA,FPB和Headline)表現最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT具有其優勢性。
(截圖來源:彭博社)
擁有近20萬粉絲的推特賬號「外匯交易員」在推特上寫道,彭博發文介紹BloombergGPT,依託自身海量金融數據,構建了一個3630億個標籤的數據集,基於通用和金融業務的場景進行了混合模型訓練。彭博稱其在金融任務上超過了現有的模型(信息理解、情感分析、標註、實體命名等),而在通用場景上的表現則與之相當甚至優於現有模型。
(截圖來源:推特)
就最新的BloombergGPT,ChatGPT如何看待自己的競爭對手?
ChatGPT認爲,BloombergGPT是專門爲金融領域開發的一種語言模型,可以更好地處理金融領域的數據和任務,並且在金融領域的基準測試中表現出色。這將有助於金融從業者更好地理解和應用自然語言處理技術,促進金融科技的發展。BloombergGPT還可以爲其他領域的語言模型的發展提供參考和借鑑。總的來說,BloombergGPT是一個有益的技術創新。
成立於1981年的美國彭博資訊公司,是全球最大的財經資訊公司,其前身是美國創新市場系統公司。
彭博社是全球最大的金融信息服務供應商,其數據終端系統「彭博專業服務」可以幫助客戶查閱和分析實時的金融市場數據,並進行交易。使用該數據終端的客戶遍佈全球,包括交易員、投行、美聯儲、美國其他官方機構以及全球各大央行等。