以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > 波場 > Info

金融圈注意了 BloombergGPT來了_GPT

Author:

Time:1900/1/1 0:00:00

ChatGPT引爆的AI熱潮也“燒到了”金融圈,彭博社重磅發布為金融界打造的大型語言模型(LLM)——BloombergGPT。

3月30日,根據彭博社最新發布的報告顯示,其構建迄今為止最大的特定領域數據集,并訓練了專門用于金融領域的LLM,開發了擁有500億參數的語言模型——BloombergGPT。

報告顯示,該模型依托彭博社的大量金融數據源,構建了一個3630億個標簽的數據集,支持金融行業內的各類任務。該模型在金融任務上的表現遠超過現有模型,且在通用場景上的表現與現有模型也能一較高下。

一般來說,在NLP領域,參數數量和復雜程度之間具有正相關性,GPT-3.5模型的參數量為2000億,GPT-3的參數量為1750億。

Midas Investments創始人推出了新的DeFi金融平臺Locus Finance:金色財經報道,已關閉的托管加密投資平臺Midas Investments的創始人Iakov Levin推出了一個新的DeFi金融平臺Locus Finance。Locus Finance在一份聲明中表示,Locus最初將提供三種基于以太坊質押、DeFi增長和Arbitrum交易的收益產品。

Midas Investments成立于2018年,在2021年的鼎盛時期積累了超過2.5億美元的管理資產。2022Midas 損失了超過5000萬美元。

同年12月,Levin宣布關閉Midas Investments。[2023/7/24 15:55:36]

關于BloombergGPT

報告指出,研究人員利用彭博社現有的數據,對資源進行創建、收集和整理,通過構建迄今為止最大的特定領域數據集來完成BloomberGPT,并基于通用和金融業務的場景進行混合模型訓練:

京北方:公司基于區塊鏈技術開發了供應鏈金融產品和數字人民幣統一接入系統:金色財經報道,京北方在回答投資者提問時表示,公司申請的發明專利“一種基于區塊鏈的數據存儲方法、裝置、設備及存儲介質”,主要研究對數據庫的數據項、數據庫分片、數據庫快照、數據庫等進行存證,提升數據真實性、一致性和安全性;申請的發明專利“基于區塊鏈的貨幣流通監管的方法、系統設備及介質”,主要研究對物理貨幣和數字貨幣流通環節的統一跟蹤,旨在提升貨幣流通的安全性和監管性。上述專利是公司研發實力的凝聚,公司基于區塊鏈技術開發了供應鏈金融產品和數字人民幣統一接入系統,已經開始向客戶提供服務。(同花順)[2022/3/30 14:27:00]

彭博社主要是一家金融數據公司,數據分析師在公司成立的四十年的時間里收集了大量的金融文件,擁有廣泛的金融數據檔案,涵蓋了一系列的主題。

我們將這些數據添加到公共數據集中,以創建一個擁有超過7000億個標簽的大型訓練語料庫。

聲音 | IMF常務董事拉加德:加密貨幣等金融科技填補了經濟體系中的空白:據bitcoinexchangeguide消息,本周在達沃斯召開的世界經濟論壇上,傳統金融和加密貨幣領域的話題成為參與者討論的熱點。國際貨幣基金組織(IMF)常務董事克里斯蒂娜?拉加德(Christine Lagarde)表示,如果整體經濟不需要再次依賴央行來抵御下一次沖擊,那將是非常好的。以加密貨幣為代表的金融科技填補了經濟領域的空白,這將撼動整個經濟體系。[2019/1/27]

使用這個訓練語料庫的一部分,我們訓練了一個具有彭博風格的,達500億參數的模型,該模型是根據Hoffmann和Le Scao等人的指導方針設計,基于通用和金融業務的場景進行混合模型訓練。

結果表明,我們的混合訓練方法使我們的模型在金融任務上的表現大大超過了現有的模型,而在通用場景上的表現則與之相當甚至優于現有模型。

動態 | 韓國金融委員會在本月內進行組織改編:韓國金融委員會準備在本月內進行組織改編,將 “虛擬通貨科”為新設的正式部門。金融委此舉可視為,將虛擬貨幣市場拉近制度圈內的信號。今日(7月5日)韓國金融委有關人員稱“在本月內將虛擬貨幣關聯科室晉升為正式部門。”[2018/7/5]

1.BloombergGPT優勢:特定領域模型仍有其不可替代性且彭博數據來源可靠

在論文中,彭博社指出,現階段,通用的自然語言處理模型可以涵蓋許多領域,但針對特定領域模型仍有其不可替代性,因彭博社的大多數應用均為金融領域,著手構建了一個針對金融領域的模型尤其優勢,同時可以在通用LLM基準測試上保持競爭力:

政策 | 歐洲議會經濟和貨幣事務委員會:央行數字貨幣可創造更穩定的金融體系:據fstech消息,歐洲議會經濟和貨幣事務委員會表示,雖然加密貨幣由于可擴展性的限制無法取代傳統貨幣,但央行數字貨幣(CBDCs)可以創造一個更穩定的金融體系。一份由德國基爾世界經濟研究所(Kiel Institute for the World Economy)成員撰寫的論文也得出結論:CBDCs前景中可以作為目前部分儲備銀行體系的替代品。[2018/6/26]

除了構建金融領域的LLM外,本文的經驗也為其他研究領域的專用模型提供了參考。我們的方法是在特定領域和一般數據源上訓練LLM,以開發在特定領域和通用基準上表現優異的模型。

此外,我們的訓練數據不同于傳統的網絡爬取數據,網絡上的數據總有重復和錯誤,但我們的數據來源可靠。

2.BloombergGPT的訓練數據集:

BloombergGPT的訓練數據庫名為FINPILE,由一系列英文金融信息組成,包括新聞、文件、新聞稿、網絡爬取的金融文件以及提取到的社交媒體消息。

為了提高數據質量,FINPILE數據集也使用了公共數據集,例如The Pile、C4和Wikipedia。FINPILE的訓練數據集中大約一半是特定領域的文本,一半是通用文本。為了提高數據質量,每個數據集都進行了去重處理。

對金融領域的理解更準

報告指出,在金融領域中的自然語言處理在通用模型中也很常見,但是,針對金融領域,這些任務執行時將面臨挑戰:

以情感分析為例,一個題為“某公司將裁員1萬人”,在一般意義上表達了負面情感,但在金融情感方面,它有時可能被認為是積極的,因為它可能導致公司的股價或投資者信心增加。

報告指出,從測試來看,BloombergGPT在五項任務中的四項(ConvFinQA,FiQA SA,FPB和Headline)表現最佳,在NER(Named Entity Recognition)中排名第二。因此,BloombergGPT有其優勢性。

測試一:ConvFinQA數據集是一個針對金融領域的問答數據集,包括從新聞文章中提取出的問題和答案,旨在測試模型對金融領域相關問題的理解和推理能力。

測試二:FiQA SA,第二個情感分析任務,測試英語金融新聞和社交媒體標題中的情感走向。

測試三:標題,數據集包括關于黃金商品領域的英文新聞標題,標注了不同的子集。任務是判斷新聞標題是否包含特定信息,例如價格上漲或價格下跌等。

測試四:FPB,金融短語庫數據集包括來自金融新聞的句子情緒分類任務。

測試五:NER,命名實體識別任務,針對從提交給SEC的金融協議中收集金融數據,進行信用風險評估。

對于ConvFinQA來說,這個差距尤為顯著,因為它需要使用對話式輸入來對表格進行推理并生成答案,具有一定挑戰性。

ChatGPT為彭博點贊

華爾街見聞就這個問題專門詢問了ChatGPT,ChatGPT認為BloombergGPT是一項很有意義的技術進步:

它是專門為金融領域開發的一種語言模型,可以更好地處理金融領域的數據和任務,并且在金融領域的基準測試中表現出色。

這將有助于金融從業者更好地理解和應用自然語言處理技術,促進金融科技的發展。同時,BloombergGPT還可以為其他領域的語言模型的發展提供參考和借鑒。總的來說,BloombergGPT是一個有益的技術創新。

華爾街見聞

媒體專欄

閱讀更多

金色財經 善歐巴

金色早8點

白話區塊鏈

歐科云鏈

Odaily星球日報

Arcane Labs

MarsBit

深潮TechFlow

BTCStudy

鏈得得

Tags:GPTMBEBLOBERBGPT幣ATOMBEARMisblocSAUBER幣

波場
未經治理流程出售代幣?解析Arbitrum基金會爭議操作始末_BSP

今日,一則關于 Arbitrum 這一明星項目的新聞引發了社區爭議,且仍在持續發酵之中.

1900/1/1 0:00:00
對話何寶宏:元宇宙將推動數字經濟與實體經濟走向深入融合_區塊鏈

近年來,我國高度重視數字經濟的發展,“數字經濟”一詞從2017年迄今已經六次被寫入政府工作報告了,同時,在“十四五規劃”以及今年發布的《數字中國建設整體布局規劃》中,也都重點闡述了數字經濟.

1900/1/1 0:00:00
Shapella 升級后 行業專家對以太坊后續走勢看法不一_SHA

加密社區期待已久的以太坊 Shapella 升級終于完成。 比推終端數據顯示,截至北京時間4月13日6:30 AM,以太坊的交易價格為 1,917 美元,過去24 小時波動率 1.25%,在 1.

1900/1/1 0:00:00
Polygon 和 ZkSync 的新 ZK Rollups:以太坊的未來?_POL

最近,Polygon和Matter Labs的ZkSync都發布了他們期待已久的由其革命性的zkEVM支持的零知識Rollups.

1900/1/1 0:00:00
以太坊上海升級 DeFi 3.0的序章_以太坊

出品:歐科云鏈研究院 作者:畢良寰 距離以太坊Shapella升級(也曾被稱為上海升級)僅剩一天的時間!自2015年以太坊上線以來,它已成為世界排名第二的加密虛擬資產.

1900/1/1 0:00:00
NFTFi衍生品賽道早期探索:下一個“Blur”在哪里?_NFT

原文:《早期探索:NFTFI 衍生品賽道及項目盤點 nftperp、tribe3、putty 等》 作者:Maverick 注:本文撰寫于2月14日,一些數據可能出現延遲過去一個月.

1900/1/1 0:00:00
ads