第四色五月天乱伦,国产2021中文天码字幕,久久国产美女免费观看精品,免费一级a一片高清免费,国产精品线在线精品,亚洲黄色网站www.,国产精品熟女视频二区2021

中國西藏網(wǎng) > 即時新聞 > 博覽

彭博針對金融業(yè)推出大型語言模型BloombergGPT

發(fā)布時間:2023-04-03 09:03:00來源: 中國新聞網(wǎng)

  中新網(wǎng)3月31日電 3月30日,彭博發(fā)布公告稱,推出為金融界打造的大型語言模型(LLM)——BloombergGPT。

  

  圖片來源:彭博網(wǎng)站截圖

  彭博是一家全球商業(yè)、金融信息和新聞資訊提供商。3月30日,該公司發(fā)布了一篇關(guān)于BloombergGPT開發(fā)情況的研究論文,詳細介紹了這一大規(guī)模生成式人工智能(AI)模型。該大語言模型(LLM)專門針對各類金融數(shù)據(jù)進行訓(xùn)練,以全方位支持金融領(lǐng)域的自然語言處理(NLP)任務(wù)。

  據(jù)彭博微信公眾號消息,該模型將幫助彭博改進現(xiàn)有的金融NLP任務(wù),如市場情緒分析、命名實體識別、新聞分類和問題回答等。此外,BloombergGPT還將釋放更多新機遇,調(diào)動彭博終端上的海量數(shù)據(jù),將人工智能的潛力帶到金融領(lǐng)域。

  據(jù)介紹,彭博的研究人員開創(chuàng)了一種混合訓(xùn)練法,將金融數(shù)據(jù)與通用數(shù)據(jù)集結(jié)合起來訓(xùn)練模型,以達到在金融基準(zhǔn)上取得最佳結(jié)果,同時在通用LLM基準(zhǔn)上也保持足夠的競爭力。

  與此同時,彭博的機器學(xué)習(xí)產(chǎn)品和研究小組和人工智能工程團隊合作,利用彭博在數(shù)據(jù)創(chuàng)建、收集和整理方面的資源,構(gòu)建了迄今為止規(guī)模最大的專業(yè)領(lǐng)域數(shù)據(jù)集之一。

  作為一家金融數(shù)據(jù)公司,彭博的數(shù)據(jù)分析師在四十多年的時間里收集和維護了運用大量金融用語的文檔。開發(fā)團隊從這個由海量英文金融文檔組成的檔案庫中,提取并創(chuàng)建了一個包含3630億詞例(token)的金融數(shù)據(jù)集。這批數(shù)據(jù)又與另一個包含3450億詞例的公共數(shù)據(jù)集疊加,成為了包含超7000億詞例的大型訓(xùn)練語料庫。

  彭博的研究團隊利用該語料庫的一部分內(nèi)容,訓(xùn)練了純解碼器(decoder-only)因果語言模型,包含500億個參數(shù)。團隊還對訓(xùn)練出的模型進行了基準(zhǔn)測試。金融領(lǐng)域的NLP任務(wù)采用了一套彭博的自有基準(zhǔn),各類通用NLP任務(wù)則采用市面上流行的基準(zhǔn)。

  彭博稱,BloombergGPT模型在金融任務(wù)上的表現(xiàn)遠超類似規(guī)模的開放模型,而在一般NLP基準(zhǔn)上的表現(xiàn)也達到甚至超過平均水平。

  彭博首席技術(shù)官肖恩·愛德華茲(Shawn Edwards)還表示,“BloombergGPT將使我們能夠處理許多新型的應(yīng)用,不僅比定制化模型的表現(xiàn)更好,而且開箱即用,能夠大大縮短上線時間。”

(責(zé)編: 王東)

版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。