I.引言
Crypto政策在制定時很少會用到真實且細化的數據,原因主要有以下三點:
1.新興技術領域的相關政策大多還停留在理論及定性分析層面,早期階段很少會使用到數據。
2.盡管鏈上數據全部開放透明,但要想訪問這些數據人們需要在短期內完成大量工作,即便對于Crypto原生從業者來說也是如此。
3.區塊鏈「取證」公司和數據供應商有少量的數據產品,但它們都不具備靈活性/可定制性,也不能滿足經濟/金融研究人員的需求。
許多現代經濟學和金融學研究人員錯過了將工具應用于Crypto數據分析的機會。從設計上講,Crypto可以向任何人提供細化數據,但大部分政策在制定時仍依賴于CoinMarketCap等外部預聚合時間序列數據源,而不是直接從數據源獲取數據,這又是什么原因導致的呢?
正如政策制定者可以查詢美國每家主要銀行的資產負債表,并逐秒觀察消費者存款的變化一樣,他們也可以毫不費力地查看整個Ethereum生態系統的Stablecoin發行情況,但大多數分析Stablecoin的政策文件卻采取了一種探討假設事件的分析方法。
我將在本篇中具體闡釋以下幾點內容,希望可以對想要使用鏈上數據的政策研究人員有所幫助:
Volt為加密交易平臺Kriptomat推出實時支付:金色財經報道,銀行支付全球門戶Volt與加密貨幣交易平臺Kriptomat宣布建立合作關系,使歐洲各地的Kriptomat客戶能夠進行實時賬戶對賬戶支付,以購買、出售和交換加密貨幣。
Kriptomat于2018年在愛沙尼亞塔林成立,客戶群超過50萬,主要來自中歐和東歐的新興市場。除了買賣和交換加密貨幣,該平臺還為用戶提供了成本平均投資產品,允許用戶按固定間隔自動購買加密貨幣。(finextra)[2022/11/24 8:04:30]
·鏈上數據的獲取方法
·鏈上數據所采用的結構
·提取和使用鏈上數據的幾個基本工具
在隨后的文章中,我將探討如何使用這里收集的數據來判斷Crypto市場的走勢。同時,我將在結尾發布可供免費使用的數據和代碼。通過闡明如何在區塊鏈中查詢數據,我希望向大家展示Crypto的開放性可以為數據決策開辟的新方法。
如果您就職于一家監管機構或研究機構,并在獲取Crypto數據時遇到了困難,歡迎與我們取得聯系分享你的想法,了解Paradigm可以為您提供哪些幫助。
II.鏈上數據獲取方法
數據:過去一周Circle USDC流通量減少18億美元:11月6日消息,據官方消息,10月27日至11月3日期間,Circle共發行38億美元USDC,贖回56億美元USDC,流通量減少約18億美元。截至10月20日,USDC總流通量為421億美元,儲備量為423億美元,其中現金101億美元,短期美國國債322億美元。[2022/11/6 12:21:49]
一般來講,數據收集工作應集中在一個區塊鏈及特定項目的子集上,這些項目主要是以美元計價、法幣支持的Stablecoin,具體包括USDC、Tether、BinanceUSD、PaxDollar和GeminiDollar。該方法廣泛適用于鏈上數據,即便你想創建一個不同的數據集。
Etherscan這類區塊瀏覽器非常適用于查看交易快照以及收集特定智能合約的信息,但根據我的經驗,它們卻不太能用于生成大型數據集。在收集和處理原始數據時,你基本上有兩個選擇:在本地運行一個完整的節點,或查詢已經從鏈上直接寫入原始數據的數據庫。第一種方法對于專業技能和計算資源的要求比較高,而第二種方法則只需要基本的SQL和Python技能就可以實現,所以這里我們將采用第二種方法。
Dune和谷歌云平臺的BigQuery有最新的鏈上數據,這些數據都以表格的形式存儲在數據庫中,研究人員可使用SQL命令對其進行查詢。Dune還提供免費的數據庫,不過其速度較慢,而且還有些局限性,但它非常適合于A/B測試的數據查詢,也有助于你熟悉數據庫的運行模式,尤其是對于那些不善于使用SQL查詢關聯數據庫的人。BigQuery雖然更加靈活快捷,但谷歌會對計算資源收費,所以其價格也相對昂貴。我在第一次處理數據時,為了節省費用,我會先在Dune中測試查詢語句,然后再將其輸入GCP中運行。在大多數情況下,這種方法都能起到很好的效果
Coinbase第三季度虧損減少一半:金色財經報道,Coinbase周四報告稱,第三季度虧損從第二季度的11億美元減少了50%至5.45億美元,因為該公司控制了成本并削減了工人并增加了利息收入。
然而,該公司在其股東信中表示,其交易收入繼續受到宏觀經濟和加密市場逆風的顯著影響,預計這種逆風將持續到2023年,以及交易量轉移到海外。
由于交易量下降,交易收入為3.66億美元,比第二季度下降44%。Coinbase提到的這一下降的因素之一是“交易量已經從我們的業務集中的美國轉移。”它指出,這種轉變部分是由于一些數字資產發行人可能對美國加密貨幣監管框架存在“不確定性認知”。
總體凈收入為5.76億美元,低于FactSet分析師一致估計的6.46億美元,低于第二季度的8.03億美元。[2022/11/4 12:15:35]
III.鏈上數據結構
要回答這個問題,你首先需要搞清楚自己處理數據的目的。對于這個測試案例,我決定為主要的法定支持Stablecoin建立一個大型的時間序列數據集,并觀察一些特定的行為:鑄幣,燒毀(即停止流通Stablecoin)和轉移。我之所以選擇以這種方式進行研究,是因為政策制定者和學者目前最為關注法定支持的Stablecoin,所以這些數據在短期內可能相當有用。
加密借貸平臺Vauld暫停平臺提款,或將進行重組:金色財經報道,加密貨幣交易所Vauld首席執行官Darshan Bathija周一在一篇博客文章中表示,該公司“做出了艱難的決定,立即暫停Vauld平臺上的所有提款、交易和存款。”
Bathija稱,由于各種因素的影響,包括市場波動和商業伙伴的財務困難,Vauld在財務上陷入困境。Bathija說:“我們的管理層仍然完全致力于與我們的財務和法律顧問合作,盡我們最大的努力探索和分析所有可能的選擇,包括潛在的重組方案,以最好地保護Vauld的利益相關者的利益。”(The Block)[2022/7/4 1:49:33]
以美元計價的幾大Stablecoin都采用了ERC-20Token標準。顧名思義,ERC-20是一種在Ethereum上使用智能合約創建Token的標準化方式。如果你把區塊鏈理解為一個巨大的去中心化Excel表格,那么智能合約就類似于Excel函數。在函數中輸入參數之后,它將使用其內置邏輯產生一個特定的輸出結果。
我們可以使用智能合約的Ethereum地址來對它們進行定位,這些地址是區塊鏈數據結構中的唯一標識符:
·?USDC
·?TetherUSD
加密公司 Tiptop Labs 完成 2300 萬美元 A 輪融資,a16z 領投:金色財經消息,Postmates 創始人 Bastian Lehmann 成立的加密貨幣公司 Tiptop Labs 在 5 月份完成 2300 萬美元 A 輪融資,Andreessen Horowitz(a16z)領投,參投方包括 Sam Altman、Naval Ravikant、Gokul Rajaram、Scott Banister、Cyan Banister、Nabeel Hyatt、Dan Romero、Jude Gomila、Sean Plaice、Andy McLoughlin、Jeff Clavier、Vivek Patel 等。
4 月份,Bastian Lehmann 準備成立加密貨幣公司,并已于 2 月在美國特拉華州注冊一家名為 Tiptop Labs 的公司。 據 Tiptop Labs 信息顯示,該公司計劃建立一個將法定貨幣與加密貨幣聯系起來的金融解決方案。[2022/6/10 4:15:15]
·?BinanceUSD
·?PaxDollar
·?GeminiDollar
與API類似,智能合約也是可以重復使用的程序。每次智能合約獲得互動指令時,都會產生該互動的記錄,并由Ethereum協議以日志的形式記錄在區塊鏈上,而這些日志則構成了智能合約活動的可靠信息來源。
當智能合同執行一個特定函數時,例如燒毀ERC-20Stablecoin以將其從流通中移除,該函數及其參數將作為交易日志記錄在區塊鏈上。
在下面的交易中,USDCStablecoin的發行商Circle燒毀了價值1056.92美元的USDC。
如果你切換到「日志」標簽,你就可以查看交易事件日志,相應的字段為
·地址:智能合約的合約地址。USDCStablecoin的合約地址是0xa0b86991c6218b36c1d19d4a2e9eb0ce3606eb48。
·名稱:智能合約執行的函數,以及該函數中的參數。在這里,智能合約正在調用燒毀函數,該函數接收的參數指定了所燒毀幣的發送地點和燒毀幣的數量。
Etherscan的輸出結果還會顯示主題和數據字段,這些字段包含了我們在分析交易時需要解析的大部分相關信息。
·Topic0是函數簽名的哈希值。從本質上講,它會將函數及其參數經由單向算法得到一個唯一的函數哈希值。Ethereum使用的是Keccak-256哈希函數,當你通過Keccak-256算法輸入函數簽名時,它總是會產生相同的哈希值,所以任何時候該哈希值出現在日志中,你都能確信是調用了同一個函數。
·Topic1是燒毀函數的一個索引參數。在這里,Topic1是燒毀的Token被發往的地址。(注意:如果燒毀函數有更多的參數,這些參數將作為額外的主題出現)
·這里的數據字段表示所燒毀Token的數量。
既然我們已經了解了鏈上數據的基本結構,就可以開始從Dune和GCP中提取數據了。
IV.提取并處理鏈上數據的基本工具
如前所述,在這個例子中,我選擇從現有數據庫中提取鏈上數據,而不是訪問Ethereum網絡上的活動節點。為了便于理解,我使用SQL從GCP提取了大量原始數據表格,然后在Python中使用pandas庫對其進行清理。
當我們從GCP提取表格時,我們將使用BigQuery,它儲存有很多Ethereum的數據表,如下圖左邊一欄所示。當你點擊一個表格時,相應的數據庫模式就會出現,就如下圖中的ethereum.logs表。與此同時,其中涉及的地址、數據和主題都會記錄到日志數據中去。
下圖中的查詢語句將用于提取日志表中涉及與USDC、TetherUSD、BinanceUSD、PaxDollar或GeminiDollar合約互動的所有記錄。除了ethereum.logs中的信息外,一些額外的信息也很有用,所以我還合并了ethereum.block表中的數據,其中涵蓋了Gas費等信息。
得到的表格可以直接由Python讀取,并借助pandas數據框架細分為以下字段:
·log_index
·transaction_hash
·transaction_index
·address
·data
·topics
·block_timestamp
·block_number
·block_hash
·number
·miner
·size
·gas_limit
·gas_used
·base_fee_per_gas
這些字段中的大多數都可以直接使用,不過第三節中討論的主題字段需要用Python進行一些額外的清理,以便將其分成多列。
V.結語
這篇文章使用的是Ethereum的日志數據,同樣的方法也可以用來訪問鏈上的各種數據。Python和SQL是大多數經濟學家和政策制定者所熟悉的工具,它們可以發揮很大作用。與傳統金融相比,Crypto更具透明度。這樣一來,研究人員就可以利用實時數據來闡明金融體系的運作方式,并及時控制住可能出現的風險。
在下一篇文章中,我將著重分析法幣支持Stablecoin的鑄造與燒毀,并提前準備好相應的數據集。在第三篇文章中,我將以圖表的形式向大家展示精細化鏈上數據可用來研究的問題。
責任編輯:Kate
Tags:THEETHETHEETHERMothershipreth幣下架Ethereum RoyaltyTetherBlack
雖然元宇宙成為了近兩年最火的概念,并且吸引了大量資本和科技公司的投入,但普通玩家似乎對于Web3游戲似乎并不那么接受.
1900/1/1 0:00:002022年9月15日,以太坊合并。這是一個歷史性的時刻,以太坊為此準備了5年、推遲了6次,由于反復的調試與長期的開發、萬眾矚目的暈輪效應,很多人誤以為合并會自然而然地帶來更高的可擴展性、安全性和.
1900/1/1 0:00:00概述 在此次市場周期中,Web3風投已經演變成一個復雜而且彼此差異化的行業,有傳統的主題驅動型基金、企業風險投資(CVC)、也有新式的DAO風險投資、以及世界頭部交易所旗下的風險投資部門.
1900/1/1 0:00:00不出意外的話,特斯拉首席執行官ElonMusk將在本周五前完成對Twitter收購。據悉,為這筆交易提供總計130億美元債務融資的銀行已經完成了最終信貸協議的起草,目前已到了簽署文件階段.
1900/1/1 0:00:00牛市優化敘事,熊市優化基本面。雖然這種說法過于籠統,但它是參與者在不同市場環境中如何思考和反應的基本邏輯.
1900/1/1 0:00:00據彭博社報道,美國證券交易委員會正在調查YugaLabs的BoredApeYachtClubNFT??和ApeCoin代幣是否為未注冊證券.
1900/1/1 0:00:00