作者?|?新缸中之腦
責編|?Carol
來源|區塊鏈大本營
在最近的會議演講中我經常會被問到:區塊鏈數據分析的最大挑戰是什么?我的回答就一個詞:
去匿名化。
我堅定地認為,識別不同類型的參與者并理解其行為是解鎖區塊鏈分析潛力的核心挑戰。我們花費了相當多的時間來考慮這個問題以識別出與數字貨幣運動的倫理不發生沖突的正確邊界。在這篇文章里,我想進一步探討這個思路。
市場上大多數區塊鏈的架構依賴于匿名或偽匿名機制來保護其節點的隱私并實現去中心化。數據混淆機制可以將加密資產交易數據記錄在公開的賬本上讓每個人都能訪問,但是也讓分析這些數據變得異常困難。
如果不能識別參與者的身份,就很難理解區塊鏈數據集并分析出有意義的結果,而且區塊鏈分析只能徘徊在初級階段。然而,重要的一點是要理解,去匿名化區塊鏈數據集并不是要知道賬本中每個地址的真實身份,這個方向基本上是不具備可擴展性的可能。
Matrixport:比特幣可能反彈20%至3.6萬美元左右:金色財經報道,加密貨幣服務提供商Matrixport周四在一份研究報告中表示,比特幣可能會反彈20%,達到35,000-36,000美元左右。報告說,比特幣一直在一個縮小的楔形中交易,這個楔形即將被向上突破,并補充說,從技術上看,這可能會預測一個更高的走勢,其數額相當于楔形開始形成時的數額,范圍約為20%。雖然美聯儲昨天又加了25個基點的利率,但這很可能是本周期的最后一次加息。這可能為市場帶來另一次強勁的反彈。[2023/5/4 14:42:09]
相反的,我們可以識別并理解區塊鏈中已知參與者的行為,例如交易所、OTC柜臺、礦工以及其他構成區塊鏈生態系統的核心成員。
地址數量會不知不覺誤導你
Rug Radio與NFT鑄造平臺Fair.xyz合作推出全新激勵計劃“Stubs”,3月擬推“聽眾證明”節目:金色財經報道,據Fair.xyz在社交媒體宣布,該NFT鑄造平臺已和Rug Radio達成合作擬向社區推出名為“Stubs”的全新獎勵計劃,目標是在 Rug Radio 生態系統中提供“能讓聽眾獲得 NFT 獎勵的創新方式”。此外,Rug Radio 還宣布新的“聽眾證明”節目將于下個月在“GM Web3”中首次亮相,為 Rug Radio 的活躍聽眾提供福利,每場 GM Web3 節目期間,主持人都會發布“Stubs Mint 通行證的限量供應”,節目聽眾可以通過輸入代碼來領取,這些通行證只能由 Rug Radio 和 Degenz Access Pass持有人領取,通行證持有人隨后可以選擇燒毀以換取 Stubs 藝術品。[2023/2/21 12:19:09]
網絡的量度是區塊鏈分析中無所不在的一個指標,也是一個可以清晰地展示去匿名化威力的指標。
Tether應執法部門要求開始凍結FTX的USDT:11月10日消息,Tether在調查期間應執法部門的要求開始凍結FTX的USDT。據鏈上數據顯示,一個余額為46,360,701枚USDT的未知地址遭到凍結,隨后該地址被證實屬于FTX。[2022/11/10 12:45:48]
地址數量是最常見的一個具有誤導性的指標,因為并非所有的地址都同等重要。交易創建的一個用于臨時性轉賬的地址,顯然不能和另一個長期持有資產的錢包地址相提并論。
類似的,像幣安這樣的交易所的熱錢包,肯定也不同和我的個人錢包采用同樣的方法和指標去分析。同等對待所有地址的匿名性,注定會導致解讀的有限性并且經常會得出誤導性的結論。
Acala:已定位到總計30.2億異常增發aUSD中剩余的5200萬aUSD:金色財經消息,Acala更新aUSD異常增發事件鏈上追蹤進度,已定位到總計30.2億異常增發aUSD的剩余的1.7%(約5200萬),不過大部分跟蹤工作都用于分析所涉及地址的交易和aUSD錯誤鑄幣的移動。Acala表示將盡快公布調查結果。
此前報道,Acala在8月22日幣更新aUSD異常增發事件鏈上追蹤結果,官方追蹤了16個已識別地址聲稱的30億枚異常增發的aUSD。此外目前社區公投通過并銷毀了異常增發的29.7億枚aUSD。[2022/8/29 12:54:36]
匿名性vs.可解讀性
匿名或偽匿名身份是可伸縮的去中心化架構的關鍵因素之一,但是這也讓從區塊鏈數據集中獲取有價值的信息變得極端困難。理解這一觀點的一個辦法,就是把匿名性視為區塊鏈分析的可解讀性的一個反因子。
CoinShares:機構投資者資金連續七周涌入以太坊:8月9日消息,根據CoinShares的最新報告顯示,機構投資者資金正涌入基于以太坊的數字資產基金,目前已經連續七周錄得正資金流入。據報道,上周上述資金流入達到1630萬美元,過去七周資金流入總額為1.59億美元。
CoinShares研究主管James Butterfill在8月8日表示:\"我們相信,投資者情緒的轉變是由于更加明確了合并時間,即以太坊從工作量證明轉為權益證明。[2022/8/9 12:11:46]
在區塊鏈數據集中匿名性與可解讀性之間的摩擦相對來說還比較小。一個區塊鏈數據集的匿名性越高,從中獲取有意義的信息的難度就越大。參與者的身份提供了其行為的上下文環境,而上下文環境則是可解讀性的關鍵構建模塊。
去匿名化vs.打標簽
「你是什么」遠比「你是誰」要重要。
去匿名化區塊鏈數據集并不涉及了解每個參與者的真實身份。試圖了解每個用戶的真實身份不僅是一個意義重大的任務,而且也會讓分析工作難以突破一定的規模。
相反,我們可以試著理解一個參與者的關鍵特征來讓我們的分析達到一定程度的可解讀性。因此,不需要清楚地識別每個地址的真實身份,我們可以給地址打標簽或者附加一些描述性的元數據,來讓其行為具備一定的上下文環境。
在大規模數據中,打標簽常常要比個體識別更有效果。理解區塊鏈生態系統中特定個體的行為當然會讓分析達到更個性化的程度,但是對于在宏觀層面理解行為的趨勢就顯得相對受限了。
因此,相對與對區塊鏈地址的個體真實身份的識別,去匿名性的挑戰與地址的關鍵性屬性的標注的關系更大。我們如何實現這一點?
機器學習會是一個優秀的解決方案
標注或者去匿名化區塊鏈的思路可以讓區塊鏈分析更好地生態中已知參與者的行為模式和特征。直覺上我們可以考慮創建一些規則來分析區塊鏈生態系統中的不同成員,例如:
“如果一個地址持有大量比特幣地址并且一次執行100個交易,那么這是一個交易所地址……”
雖然很有吸引力,但是基于規則的方法將很快失效,無法再提供有用的信息。下面列出了部分原因:
預置知識的完整性:基于規則的分類會假定我們對于如何識別區塊鏈生態中的不同參與者有足夠的知識。這顯然是不正確的假設。
持續的變化:區塊鏈解決方案的架構一直都在演變,這對任何嵌入的規則而言都是挑戰。
特征屬性的數量:創建一條有兩三個參數的規則很簡單,但是試圖創建一條有幾十個甚至上百個參數的規則就沒那么簡單了。要識別出像交易所或OTC柜臺這樣的地址需要大量的特征。
因此我們不能使用預置的規則,我們需要一種可以從區塊鏈數據集中學習模式的機制來自動推斷出有意義的規則讓我們可以標注相關的參與方。從概念上來說,這是一個經典的機器學習問題。
從機器學習的觀點,我們應該從兩個主要途徑來考慮應對去匿名化的挑戰:
無監督學習:無監督學習聚焦于學習指定數據集中存在的模式并識別相關分組。在區塊鏈數據集的上下文中,可以使用無監督學習模型基于地址的特征將其匹配到不同的分組中并對這些分組進行標注。
監督學習:監督學習方法可以利用已有的知識來學習指定數據集中的新的特性。在區塊鏈上下文中,可以使用監督學習方法基于已有的交易所地址數據集訓練一個模型來識別出新的交易所地址。
去匿名化或者給區塊鏈數據集打標簽很少是只用監督學習或者只用非監督學習,更多的情況下需要兩種方法的結合。機器學習模型可以有效地學習區塊鏈生態系統中特定參與者的特征,并利用這些特征來理解其行為。
在使用區塊鏈ETL工具將區塊鏈原始數據加載到數據庫或大數據分析平臺后,將標注層引入區塊鏈數據集是進行更有價值的區塊鏈數據分析的一個關鍵挑戰。
這些標簽提供了更好的上下文環境,也讓區塊鏈分析模型具有更好的可解讀性。不過盡管我們有機器學習這樣強大的工具,去匿名性依然是分析理解區塊鏈生態系統的道路上一個不可忽視的重大路障。
12月8日,由中國區塊鏈應用研究中心主辦的區塊鏈高峰論壇在北京召開。本屆論壇的主題很有意思,叫“即將流行的未來區塊鏈2020展望”,從中可以窺見主辦方的美好期待.
1900/1/1 0:00:00作者:李昕 來源:?零壹財經 2019年10月24日,中共中央局就區塊鏈技術發展現狀和趨勢進行第十八次集體學習,并肯定了區塊鏈技術在經濟發展和產業創新中的重要地位.
1900/1/1 0:00:00作者|哈希派分析團隊 A股開盤 大盤低開 區塊鏈跌0.27% :大盤低開,區塊鏈板塊低開后小幅跳水,目前指數為1139.182點,跌幅0.27%,75只概念股中,僅19家上漲.
1900/1/1 0:00:00作者|哈希派分析團隊 BTC剩余未開采量已不足170萬枚:金色財經報道,據 Btc.com 數據顯示,目前 BTC 流通量為 19,319,031.25 枚,剩余未開采量為 1,680.
1900/1/1 0:00:00商品期貨市場的出現,原本源于一個美好的初衷。雖然商品的價格取決于供給和需求,但是在信息不對稱和運輸、倉儲等條件缺乏的環境下,商品過剩和商品短缺之間并列的矛盾,常常給消費者和生產者帶來巨大的風險,
1900/1/1 0:00:00來源:人民日報?原題《答好區塊鏈發展“應用題”》 作者:何鼎鼎 發展和利用區塊鏈技術,必須堅持守正創新,回歸技術應用的本原對企業、平臺而言,站在這樣一個新風口,樂觀展望容易,難的是守住邊界.
1900/1/1 0:00:00