以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads

金色深核|誰能建立隱私計算的“分布式數據湖”?_區塊鏈

Author:

Time:1900/1/1 0:00:00

在信息時代裸奔,我們總會被數據挾持、出賣。因為你的數據不屬于你。

時下,是應該聊聊數據和隱私的時候了。

2019年末,我曾把零知識證明、多方計算、可信執行環境等隱私計算技術的代表項目匯聚到一起做了一期極為深度的討論。

那時,在區塊鏈產業分布里已經有了隱私賽道,有少數項目在研究、拓展、嘗試,只是對于隱私、隱私計算以及數據等維度并沒有那么清晰的判斷。

把時間線放的更長一些,從2018年至今,我們其實看到了隱私項目向隱私計算的迭代(兩個技術標簽很早就存在,但行業關注點有了迭代),這一現象代表了一些技術的發展和應用的趨向性。

在對這些項目分析解構,對市場需求進行考證后,筆者認為此時該提出一個有效的觀點。

即:當今的區塊鏈隱私計算項目里,誰想拿下隱私計算第一槍,要率先建立隱私計算的“分布式數據湖”。

原因很簡單:數據存儲在數據庫里并不能直接產生價值,只有經過數據訓練才有價值,也就是數據要有為深度學習、聯邦學習服務的能力,而數據湖是這個路徑里的必然選項,基于去中心化模型里,會出現新的“分布式數據湖”。

本文里,我會為這個名詞開個腦洞,在符合邏輯推演的范圍內為大家闡述一個框架。但這種模型目前并未有非常成熟的案例,如有偏頗,歡迎各位指證。

金色實力派 | 中國氣象局朱定西:區塊鏈技術可以為氣象數據的交換和共享背書:金色財經報道,在今日舉行的金色實力派直播中,針對“您認為如何更好的參與區塊鏈與新基建的浪潮,打開區塊鏈的正確姿勢是什么?后續有哪些發展計劃?”的問題,中國氣象局氣象服務首席朱定西表示,依靠創新的技術變革,在氣象服務機構和氣象服務對象以及行業用戶之間建立起高效、精準、活躍的產業平臺,能夠使我們息息相關的氣象服務煥發新的活力。氣象從業者可以主動擁抱行業發展的新變化,借助社會化觀測和區塊鏈技術結合的核心能力,提高氣象服務精準度,從而提升廣大人民群眾的滿意度。區塊鏈技術可以為氣象數據的交換和共享背書,氣象局可以以開放的姿態,借此技術提高國際氣象合作的效率,也可以在一定程度上突破現有觀測數據的瓶頸,為氣象事業的發展開辟新的道路。毫無疑問,這樣的新技術正在成為氣象行業的新的發展方向。[2020/5/21]

數據湖的概念,來自大數據和機器學習業務。

我們日常一定聽過數據庫,數據庫的形式可大可小,是非常獨立的數據存儲單位,每個數據存儲位置都是一個數據庫,當數據庫之間被打通,形成一個大數據交互結構,就可以理解為數據湖的形象。

筆者在亞馬遜的AWS Lake Formation服務定義里查到了數據湖的名詞定義:

數據湖是一個安全的集中式輔助存儲庫,它以數據原始形式和可用于分析的形式存儲所有數據。利用數據湖,可以分解數據孤島并組合不同類型進行分析,獲得分析結果指導更好的業務決策。

金色晨訊 | 2月10日隔夜重要動態一覽:21:00-7:00關鍵詞:相互寶、浙江大學、青島、中國銀行

1. 相互寶使用區塊鏈處理新型冠狀病索賠;

2. 加密貨幣衍生品交易商:未來幾個月衍生品價格將出現上漲;

3. 董希淼:要加強區塊鏈技術應用的頂層規劃和制度安排;

4. 浙江大學賁圣林:央行數字貨幣將助力全球性普惠金融;

5. 青島五部門將促進區塊鏈保理業務發展;

6. 中國銀行前副行長:開始時很多國家都是設想比照比特幣等研發央行(法定)數字貨幣;

7. 萊特幣創始人:Litecoin Pool現在允許礦工設置任意百分比自愿捐贈給萊特幣基金會;

8. BTC現報10149美元,日內漲幅0.49%,主流幣普漲。[2020/2/10]

所以我們可以理解為,當若干個原始存儲的數據庫連接起來,就是數據湖。但這個數據湖怎么工作呢?

這一段描述可以粗略看到一些工作需求。

“設置和管理數據湖包括加載來自不同來源的數據、監控這些數據流、設置分區、打開加密和管理密鑰、定義轉換作業并監控其操作、將數據重新組織成列格式、配置訪問控制設置、刪除冗余數據重復數據、匹配鏈接記錄、授予對數據集的訪問權限以及隨時間推移審核訪問權限。”

所以數據湖的主要功能是數據的交互,而處理其關鍵問題是加密和數據集的訪問權限。在我們所期待的去中心化數據湖里,似乎也是如此。

金色晨訊 | 嘉楠耘智或沖刺科創板 Facebook稱正研發區塊鏈而非加密貨幣:1.EOS紐約節點:警惕來自“b1”帳戶的交易騙局。

2.USDC審計報告:截至4月30日已發行和未發行的USDC未超過托管的美元余額。

3. Harry Zhou:法院認定Bitfinex 和Tether有超過 50% 的可能從事了“證券欺詐”。

4.嘉楠耘智創始人張楠賡:不排除沖刺科創板。

5.日本金融廳公開三月封閉會議記錄:監管方或考慮要求金融機構只使用可審計的區塊鏈。

6.奧斯卡獲獎紀錄片制片人聯合成立制作公司Icebreaker,計劃通過STO籌集資金。

7. Facebook稱正在瑞士研發區塊鏈技術 而非加密貨幣。

8.全國首個數字資產登記結算平臺在南京上線。

9.俄羅斯最大銀行Sberbank要求客戶提供加密貨幣收入相關信息。[2019/5/19]

去中心化的數據結構,是去中心化的隱私計算的基礎,很簡單,就是數據是分散在生產者處,存在于我們的手機、電腦其他終端設備里。

當然,手機數據大多是有緩存的,有些數據是短時存儲,我們所看到的那些互聯網App收取用戶的數據,都是其所需要的數據,而這些數據有些實時產生,在緩存里,有些存儲在本地存儲里。我們雖然在本地可以操作查看,但平臺也可以隨時拿走數據,因為所有權并非在用戶這里。

金色相對論丨林念龍:礦機公司發展AI是為了避免雞蛋放在一個籃子中:本期金色相對論在討論上,在談論排名靠前的礦機企業都在做AI芯片這一話題時,蜂窩聯合創始人林念龍認為:礦機公司不把雞蛋放一個籃子,避免“百度10多年主要收入只來自于搜索”一樣的尷尬局面。一般來講,AI公司的能力還在生活應用和機器學習上,都是軟件層面;礦機公司在硬件的技能和資金實力上,非常雄厚,是AI公司一般不敢去碰的領域。AI是“軟件”,礦機公司是“硬件”,軟硬結合,未來是互補合作的關系。[2018/6/27]

在去中心化的數據結構里,數據在本地存儲,還需要把所有數據加密,并且你所使用的App無法獲取你的數據,除非你主動向App提供交互,或者允許授權。

這個場景里,我們期待的是:平臺在沒有授權時是拿不走我們的數據的。但這僅代表的是成型的存儲數據。而我們有很多的數據,是需要經過中心化服務器處理的。

例如加入一個社交媒體,我們的用戶名,手機號,郵箱等等數據都是容易暴露的,理想狀態下,他人對我們選擇不公開的數據不可見,而關鍵的是,平臺也要對數據不可見,或者不可用。

這需要平臺具備一些基本的功能,而平臺的功能,一定是其背后開發功能中的體現,這就有關于我們知道的區塊鏈項目了,例如賬戶ID具備隱私功能,信息訪問權限的設定。

金色財經現場報道 Higgs Block 集團 CEO陳慶:加密貨幣面臨很大的發展機會:金色財經現場報道,在2018FINWISE東京紛智峰會上,Higgs Block 集團 CEO陳慶進行以《更大更好》為主題的演講,她指出:加密貨幣正超多大部分的其他貨幣。現實生活中,到2020年,28%的傳統銀行和支付業務將轉向金融科技——這一大類別涵蓋了幾乎所有的金融服務與科技。加密貨幣面臨很大的發展機會,交易所目前面臨達到一定規模和覆蓋面、資金和財務、獲得知名度和認可度、監管問題、建立可持續流入等問題。“加密貨幣交易所聯盟”應該引導并聯手傳統金融打造更大的加密貨幣市場,包括機構、銀行、監管、投資人關系建設和維護。[2018/5/21]

我們看到保護隱私的區塊鏈項目,都會在這方面努力。

不過區塊鏈和加密貨幣有一些天然隱私特性,例如區塊鏈的歸屬權、加密貨幣的無需許可以及地址的匿名性。

只是當數據真的形成一定的體量之后,大部分的業務都與生活息息相關,所以匿名性之后會有kyc,kyc后,數據的隱私和隱私計算,無可厚非的成為最重要組成部分。

互聯網大數據技術早已和云計算融合多年,在傳統云計算里,AI需求的數據湖對數據的控制已經變得很簡單,進展到了SaaS級別。

例如上文的AWS Lake Formation其創建過程很簡單,只需定義數據源,制定要應用的數據訪問和安全策略就行。Lake Formation模塊會幫助使用方從數據庫和對象存儲中收集并按目錄分類數據,將數據移動到新的數據湖里,使用機器學習算法清理和分類數據,并保護對敏感數據的訪問權限。

而對外表象是,使用方建立應用的用戶可以訪問那些描述了可用數據集及其適當用法的集中數據目錄。然后,用戶可以通過所選的分析和機器學習服務,利用這些數據集。

簡而言之,這個邏輯把分布在各處的數據,最終在數據服務上體現了價值,這是去中心化世界里,很多項目想要實現的,如果只是簡單的把數據控制在用戶手里,那用戶仍只是體驗了平臺的服務,而并非將數據可以變現,雖然說數據token化就可能有交易價值,但這種交易價值暴力程度遠不及在人工智能里實現的產業價值。

例如,如果微信去中心化了,我們在微信的行為數據就再也不會直接拿走被利用到廣點通里,你的朋友圈里不會出現“你剛剛和其他人說過的”你想買的物品,也不會被粗暴的推薦某些產品。

區塊鏈項目想實現這樣的愿景,但發展之路可能略有曲折。因為這樣的應用很難實現。

我們看到的區塊鏈項目,除了Defi、Nft這些應用層項目,其他都是基礎設施,而以區塊鏈的基礎設施,性能很難完成互聯網平臺的業務需求。

當隨著區塊鏈以及加密貨幣不斷擴展,網絡中的用戶增加,每個地址的關聯數據也開始增加,所有用戶的數據集中呈現了龐大的規模。這些存在本地的數據,就也組成了龐大的數據集群。

在這基礎之上,能實現數據湖的,并不多。因為實現數據湖,需要單獨的算力、存儲、算法等等。在區塊鏈項目的設計里,這個部分可能需要單獨的一層網絡,或某一個參與網絡建設的角色。

大部分區塊鏈項目并不能建立這樣的功能,因為大部分區塊鏈項目的網絡只有能力維持Defi項目的運行,而缺乏足夠的存儲和計算能力。

除存儲和算力外,在這基礎設施里,需要有去中心化的數據結構,例如以DID為單位的用戶數據,需要有算力和存儲的經濟模型,還需要有安全的代碼和便于開發應用的中間件。

這些都讓隱私計算的項目屈指可數。

當然我們這樣判定的前提,是我們所指的隱私計算,是關于數據的隱私處理。而并非簡單通過合約執行的匿名、混幣、交易隱私等等。

在交易處理分層的概念已經在加密貨幣項目設計里得到共識后,我們期待的是區塊鏈負責數據的權益證明,而其他層控制的算力和存儲,完成隱私計算。

在文章的最后,我們用數據湖的最終命題,去推論出一個加密貨幣隱私項目的設計框架。通過這個框架,可以部分對比如今市面上的隱私計算項目。

首先,區塊鏈為加密貨幣項目提供共識層的總帳本。在這個總帳本里,是所有公開留存的數據證明。

接下來,是如何將項目設計為具備隱私計算能力。

從初代的隱私項目看,主要是增加了匿名性和交易隱私,例如具備混幣合約的隱私幣,其可以將合約當作一種dapp服務,讓代幣進入合約之后的操作無法查詢。這樣的設計,主要是在鏈上部署合約,可能會使用密碼學算法或者零知識證明等標志性技術,以保證交易過程在不可見的情況下正確執行。

而如果是有硬件要求的隱私計算設計,那在前文我們所提到的區塊鏈網絡,其網絡節點搭建,就需要特殊的設備,或者在區塊鏈共識層外,再次搭建一個由特殊設備組成的計算網絡。

例如通過集合具備TEE計算區的硬件設備連接成網,就可以利用TEE保護區塊鏈上的交易執行、合約執行等,TEE是對計算進行的物理保護,有一些獨特的通信方式,讓可信計算區和其他需求點交互。

而如果區塊鏈網絡具備MPC等對計算要求較高的技術部署,就需要搭建區塊鏈網絡的節點設備經過特殊定制,或者在區塊鏈共識層外,建立一個layer2計算、存儲層,將算力和存儲都共享出去,提供數據隱私計算需要的資源。

有趣的是,因為MPC很多情況下還是依靠加密算法,為了更周密的隱私部署,MPC和TEE會在非區塊鏈的可信案例里組合應用比較多,而MPC在區塊鏈項目里,與零知識證明、加密算法融合應用比較多。

當我們確認了有足夠的算力和存儲資源。

一旦需要數據湖,如AWS數據湖模塊一樣,需要建立數據湖,并且定向收集需求點位的數據,匯集后,對數據所有權進行分類,在數據湖里,除了數據所有權外,進行機器學習訓練的訓練方,數據執行方等都需要明確對數據湖的權限,例如訓練方可能具備管理訓練算法的權限,而其對部分數據是可用不可見。

數據最終的價值表現,與數據在訓練等過程中的作用也需要在數據湖的作用中進行評估。而這些輔助的計算都是基本功能,數據在數據湖的進進出出都會在區塊鏈上留下公開的痕跡,以保證所有權的公平。

最后,當技術上完善之后,就是數據變現后的權益分配,需要對數據貢獻進行定義,可能需要通證化的量化工作來實現公平的分配。

以上的參與者,理想狀態下,是很多方。而將這個模型放小,可能只會關于如今具備數據交叉訓練需求的幾方。

因為大部分數據的處理難度也是顯而易見的,例如數據的清洗、篩選、脫敏等等。

但如果這種模型已經成為標配,必然會有一個標配的經濟模型支持,例如這些資源的消耗需要需求者買單。而數據的訓練結果,可能將塑造下一個驚艷的產品。

如果我們只是因為自由選擇區塊鏈網絡,那你也許會因為產品體驗的不自由而離開,但如果你希望可以通過數據塑造價值,那必然要等待你的數據可以因為隱私計算變得有價值,并且這個價值可以回歸于你自己。

那個時候用戶才不會因為數據成為待宰羔羊,因為你可以對不認可的授權者say no,拿好你的個人數據庫。

PS:文章篇幅有限,接下來筆者會繼續完成一些補充文章,例如數據湖中的數據倉,例如權益分配的詳細方案。敬請關注《金色深核》欄目的后續文章。

Tags:區塊鏈加密貨幣APPMPC區塊鏈域名如何注冊加密貨幣未來前景分析HappyLand Reward TokenMPC幣

歐易交易所app下載
?亞洲:央行數字貨幣的沃土_CBD

本文選自 KrASIA,原文標題 Asia is fertile ground for central bank digital currencies.

1900/1/1 0:00:00
Dragonfly 合伙人:MEV 沒那么糟糕 如何與 MEV 共生和進化?_MEV

盡管加密貨幣生態系統普遍認為「代碼即法律」,一切都是公平的游戲,但多數加密系統也依賴于一定程度的社會共識和良好的公民意識,才得以保持良好的整體用戶體驗.

1900/1/1 0:00:00
binanceNFT市場與Virtue Poker合作推出NFT_NFT

近日,全球首個獲得撲克游戲牌照的區塊鏈P2P撲克平臺Virtue Poker與新上線的幣安NFT市場合作,為名人堂和Virtue Poker團隊職業牌手Phil Ivey打造獨一無二NFT.

1900/1/1 0:00:00
Facebook加密貨幣項目公布新計劃 推出重新命名的數字錢包Novi_FACE

據Facebook官網公布,它旗下數字錢包產品已從Calibra更名為Novi,并已開放注冊。作為其子公司Novi Financial的第一款產品,Novi是基于區塊鏈技術打造的全新支付系統,它.

1900/1/1 0:00:00
神秘巨鯨借幣做空 誰是「幫兇」?_BTC

7月8日,加密資產市場再度下跌。在沒有實質性利空爆出的情況下,更多人將目光聚焦在借幣做空的神秘巨鯨上.

1900/1/1 0:00:00
金色觀察 | Nifty’s上線NFT社交媒體 在種子輪籌得1000萬美元_NFT

總部位于邁阿密的加密貨幣風投公司Nifty’s推出了據稱是第一個針對NFT的社交媒體平臺。Niftys.com首個合作伙伴是華納兄弟,將推出一系列即將上映的真人動畫電影《空中大灌籃:新傳奇》角色.

1900/1/1 0:00:00
ads