以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > Fil > Info

想做好區塊鏈數據分析?先來看看如何解決“去匿名化”這個大難題_區塊鏈

Author:

Time:1900/1/1 0:00:00

編者按:本文來自區塊鏈大本營,作者:新缸中之腦,Odaily星球日報經授權轉載。在最近的會議演講中我經常會被問到:區塊鏈數據分析的最大挑戰是什么?我的回答就一個詞:去匿名化。我堅定地認為,識別不同類型的參與者并理解其行為是解鎖區塊鏈分析潛力的核心挑戰。我們花費了相當多的時間來考慮這個問題以識別出與數字貨幣運動的倫理不發生沖突的正確邊界。在這篇文章里,我想進一步探討這個思路。市場上大多數區塊鏈的架構依賴于匿名或偽匿名機制來保護其節點的隱私并實現去中心化。數據混淆機制可以將加密資產交易數據記錄在公開的賬本上讓每個人都能訪問,但是也讓分析這些數據變得異常困難。如果不能識別參與者的身份,就很難理解區塊鏈數據集并分析出有意義的結果,而且區塊鏈分析只能徘徊在初級階段。然而,重要的一點是要理解,去匿名化區塊鏈數據集并不是要知道賬本中每個地址的真實身份,這個方向基本上是不具備可擴展性的可能。相反的,我們可以識別并理解區塊鏈中已知參與者的行為,例如交易所、OTC柜臺、礦工以及其他構成區塊鏈生態系統的核心成員。地址數量會不知不覺誤導你

Celsius律師:Ripple法院的裁決不太可能影響Celsius清算:金色財經報道,破產的加密貨幣貸款機構Celsius的律師周二對紐約一家法院表示,關于與Ripple相關的XRP代幣是否為證券的具有里程碑意義的判決不太可能影響破產的加密貨幣貸款機構Celsius的清盤計劃。[2023/7/19 11:03:06]

網絡的量度是區塊鏈分析中無所不在的一個指標,也是一個可以清晰地展示去匿名化威力的指標。地址數量是最常見的一個具有誤導性的指標,因為并非所有的地址都同等重要。交易創建的一個用于臨時性轉賬的地址,顯然不能和另一個長期持有資產的錢包地址相提并論。類似的,像幣安這樣的交易所的熱錢包,肯定也不同和我的個人錢包采用同樣的方法和指標去分析。同等對待所有地址的匿名性,注定會導致解讀的有限性并且經常會得出誤導性的結論。

Arthur Hayes:美聯儲向其他國家央行提供美元互換額度是一種救助方法:金色財經報道,BitMEX 創始人 Arthur Hayes 發推表示,美聯儲向其他國家央行提供美元互換額度,將有利于減少國債拋售到流動性市場,可以救助美國小型銀行。

該解決方案的過程是:美聯儲向歐洲央行等主要央行提供美元互換額度,歐洲央行允許歐盟銀行按面值向它們提供國債, 歐洲央行向銀行提供美元,銀行可以處理任何美元存取款。[2023/3/20 13:14:33]

匿名性vs.可解讀性

匿名或偽匿名身份是可伸縮的去中心化架構的關鍵因素之一,但是這也讓從區塊鏈數據集中獲取有價值的信息變得極端困難。理解這一觀點的一個辦法,就是把匿名性視為區塊鏈分析的可解讀性的一個反因子。在區塊鏈數據集中匿名性與可解讀性之間的摩擦相對來說還比較小。一個區塊鏈數據集的匿名性越高,從中獲取有意義的信息的難度就越大。參與者的身份提供了其行為的上下文環境,而上下文環境則是可解讀性的關鍵構建模塊。

CZ:去年幾個失敗的加密貨幣項目短期內阻礙了加密貨幣行業的增長:金色財經報道,Binance首席執行官CZ在社交媒體上稱,去年幾個失敗的加密貨幣項目的影響?短期內,它們阻礙了加密貨幣行業的增長。但我們已經看到了復蘇。長期來看,因為它們確實阻礙了傳統金融業者采用該技術,并可能導致他們在采用曲線上進一步落后,這可能會在10-20年后對他們產生生存影響。[2023/1/28 11:33:09]

去匿名化vs.打標簽

「你是什么」遠比「你是誰」要重要。去匿名化區塊鏈數據集并不涉及了解每個參與者的真實身份。試圖了解每個用戶的真實身份不僅是一個意義重大的任務,而且也會讓分析工作難以突破一定的規模。相反,我們可以試著理解一個參與者的關鍵特征來讓我們的分析達到一定程度的可解讀性。因此,不需要清楚地識別每個地址的真實身份,我們可以給地址打標簽或者附加一些描述性的元數據,來讓其行為具備一定的上下文環境。在大規模數據中,打標簽常常要比個體識別更有效果。理解區塊鏈生態系統中特定個體的行為當然會讓分析達到更個性化的程度,但是對于在宏觀層面理解行為的趨勢就顯得相對受限了。

Nomad已聘請Chainalysis幫助追蹤資金以及識別黑客:8月30日消息,Nomad宣布已聘請Chainalysis幫助其追回被盜資金,Chainalysis將負責追蹤資金走向以及識別黑客。[2022/8/31 12:58:46]

因此,相對與對區塊鏈地址的個體真實身份的識別,去匿名性的挑戰與地址的關鍵性屬性的標注的關系更大。我們如何實現這一點?機器學習會是一個優秀的解決方案

標注或者去匿名化區塊鏈的思路可以讓區塊鏈分析更好地生態中已知參與者的行為模式和特征。直覺上我們可以考慮創建一些規則來分析區塊鏈生態系統中的不同成員,例如:“如果一個地址持有大量比特幣地址并且一次執行100個交易,那么這是一個交易所地址……”雖然很有吸引力,但是基于規則的方法將很快失效,無法再提供有用的信息。下面列出了部分原因:預置知識的完整性:基于規則的分類會假定我們對于如何識別區塊鏈生態中的不同參與者有足夠的知識。這顯然是不正確的假設。持續的變化:區塊鏈解決方案的架構一直都在演變,這對任何嵌入的規則而言都是挑戰。特征屬性的數量:創建一條有兩三個參數的規則很簡單,但是試圖創建一條有幾十個甚至上百個參數的規則就沒那么簡單了。要識別出像交易所或OTC柜臺這樣的地址需要大量的特征。因此我們不能使用預置的規則,我們需要一種可以從區塊鏈數據集中學習模式的機制來自動推斷出有意義的規則讓我們可以標注相關的參與方。從概念上來說,這是一個經典的機器學習問題。從機器學習的觀點,我們應該從兩個主要途徑來考慮應對去匿名化的挑戰:無監督學習:無監督學習聚焦于學習指定數據集中存在的模式并識別相關分組。在區塊鏈數據集的上下文中,可以使用無監督學習模型基于地址的特征將其匹配到不同的分組中并對這些分組進行標注。監督學習:監督學習方法可以利用已有的知識來學習指定數據集中的新的特性。在區塊鏈上下文中,可以使用監督學習方法基于已有的交易所地址數據集訓練一個模型來識別出新的交易所地址。

去匿名化或者給區塊鏈數據集打標簽很少是只用監督學習或者只用非監督學習,更多的情況下需要兩種方法的結合。機器學習模型可以有效地學習區塊鏈生態系統中特定參與者的特征,并利用這些特征來理解其行為。在使用區塊鏈ETL工具將區塊鏈原始數據加載到數據庫或大數據分析平臺后,將標注層引入區塊鏈數據集是進行更有價值的區塊鏈數據分析的一個關鍵挑戰。這些標簽提供了更好的上下文環境,也讓區塊鏈分析模型具有更好的可解讀性。不過盡管我們有機器學習這樣強大的工具,去匿名性依然是分析理解區塊鏈生態系統的道路上一個不可忽視的重大路障。

Tags:區塊鏈加密貨幣ELSCelsius區塊鏈專業好找工作嗎加密貨幣最新消息與新聞Channelscelsius幣最新

Fil
工信部王新哲:加快發展壯大以數據為關鍵要素的數字經濟_區塊鏈

上證報中國證券網訊據工業和信息化部12月12日消息,12月10日,2019第六屆中國國際大數據大會在京召開,工業和信息化部總經濟師王新哲出席并致辭,中國工程院院士鄔賀銓做主旨報告.

1900/1/1 0:00:00
“比特幣殺手”之謎:美女騙倒全世界,中國投資者絕望_比特幣

編者按:本文來自星傳媒STARMEDIA,作者:BBC中文,Odaily星球日報經授權發布。加密數碼幣圈出了件大事:“一幣”全球吸金40億歐元,然后美女“莊主”連同這筆巨款失蹤了.

1900/1/1 0:00:00
Filecoin啟動GPU方案,對礦工有何影響?_FIL

這句話的意思是“下一版的開發測試網devnet幾乎肯定需要一個或多個GPU才能挖礦”。這便是這條突發消息的直接來源.

1900/1/1 0:00:00
區塊鏈技術賦能銀行風險管理研究報告_區塊鏈

要點總結: 1.銀行風險管理是貫穿銀行整個業務流程的重要問題。根據巴塞爾委員會發布的《巴塞爾協議III》,銀行風險可以劃歸為以下幾類:信用風險、市場風險、操作風險、流動性風險、國家風險、聲譽風險.

1900/1/1 0:00:00
市場全線暴跌恐慌情緒攀升,BTC短時并未止跌企穩_BTC

近期,包括上海、東莞、北京、深圳等地,陸續出臺了防范虛擬貨幣非法活動風險提示文件,對虛擬貨幣炒作、非法集資、傳銷等騙局的清理整頓有趨嚴之勢,市場政策面和消息面持續偏空.

1900/1/1 0:00:00
又一重磅利好,海南撒10億基金發展區塊鏈技術_區塊鏈

“獎勵領軍人才100萬,優秀技術應用項目最高500萬資金扶持。”“設立10億元區塊鏈產業基金,吸引社會資金為區塊鏈企業提供天使、股權、股后增值等多層服務.

1900/1/1 0:00:00
ads