前言:隱私計算賽道作為當下的風口賽道,無數企業紛紛涌入,搶跑占道。作為一家專注于區塊鏈隱私計算賽道科普入門的垂直媒體,同時也是針對隱私計算興趣者開放的“純天然”、低門檻入口,我們匯總并分類了隱私計算行業內晦澀難懂的名詞,編寫了「隱私計算詞典」板塊,幫助大家理解、學習。?
此篇,我們來了解隱私計算技術架構的第三部分——聯邦學習。
近年來,從無人駕駛汽車,到AlphaGo擊敗頂尖的真人圍棋手等等,AI人工智能在科技領域的發展著實吸引了足夠多人的眼球。
然而,發展至今的AI人工智能仍面臨兩大現實問題:
行業數據分散且收集困難,數據以孤島的形式存在;隱私得不到保障,安全共享數據成為了一道壁壘。針對此,人們提出了一種名為「聯邦學習」的隱私計算技術。
隱私計算公鏈Oasis計劃推出官方NFT平臺:3月30日消息,隱私計算公鏈 Oasis 計劃推出官方 NFT 平臺,并正在邀請更多項目來 Oasis Emerald 鏈上部署。據介紹,該 NFT 平臺具有包容、可訪問的 NFT 體驗,Gas 費極低,并由 Oasis 官方提供技術指導及營銷幫助。[2022/3/30 14:26:21]
聯邦學習,又名聯邦機器學習、聯合學習。它是AI人工智能的一門分支技術,旨在保障大數據交換時的信息安全、數據保護,在合法合規的前提下,有效幫助多行業的數據進行機器學習建模。
隱私保護是聯邦學習最主要的關注點,在實際的應用中,聯邦學習通過將數據的不同特征在加密的狀態下加以聚合,以增強機器學習模型能力,再通過共享數據模型,避開原始數據共享,進而保證了數據的安全性。?
未來區塊鏈與隱私計算高精尖創新中心在京揭牌成立:1月28日,未來區塊鏈與隱私計算高精尖創新中心在京揭牌成立。該中心是北京市教委批準成立的首個新一期北京高校高精尖創新中心,依托北京航空航天大學、北京微芯區塊鏈與邊緣計算研究院設立,多家單位共同建設,是國際首個區塊鏈與隱私計算科技創新平臺,以解決長安鏈發展的技術問題為核心任務。
中心采用“一體兩地、前店后廠”的運行模式。“前店”位于微芯研究院,主要承擔關鍵技術研發、產品開發及實驗驗證工作,“后廠”位于沙河高教園區,利用園區高校資源優勢以及昌平區醫療、能源、先進制造等區塊鏈重點應用領域場景優勢,開展基礎理論研究、關鍵技術攻關和平臺建設,形成未來科學城與中關村科學城的良性互動。(北京日報)[2022/1/29 9:21:39]
利用聯邦學習的特點,即使是不導出企業數據的情況下,也能為三方或多方建立機器學習模型,既充分保護了數據隱私和數據安全,又為客戶提供個性化、有針對性的服務,實現了互惠互利。?
現場 | 王允臻:隱私計算是我到目前為止所了解到的唯一的真正保障數據主權的:在今日隱私計算發展研討會的圓桌討論中,萬向控股CIO王允臻表示,分布式的邏輯,分布式邏輯就要求打通數據孤島。前面有其他的演講者也講的很好,那么數據達不到有行政上的問題,組織關系上的問題,還有更重要的是一個隱私安全保護。就說我現在要讓我的數據被利用,唯一的方法就是把數據開放。你要拿走我的數據,這樣的話你是沒有前途的,怎么來解決這個問題?我所謂的就是美國人說得data sovereignty,就是數據主權,假如說你沒有辦法保證你的數據,你是數據的唯一擁有者的話,談得上什么主權,國家的土地主權不是說這塊土地技術,國家又必須是一個排他性的唯一的,那么這樣一來的話就可以和隱私計算就聯系在一起,因為隱私計算是我到目前為止所了解到的唯一的真正保障數據主權的。[2019/9/17]
同時,我們可以利用不同類別的聯邦學習技術來解決數據異質性問題,突破傳統AI技術的局限性。依照參與建模的數據源分布,聯邦學習可分為橫向聯邦學習、縱向聯邦學習和聯邦遷移學習三類。?
動態 | 隱私計算項目 Enigma 將發布最小化可行產品 已開源核心組件:隱私計算項目 Enigma 表示,其最小化可行產品「Discovery」的發布已經進入最后準備階段,已經在 Github 上開源了該階段核心組件的代碼,其中包括 Enigma 合約和 Enigma 代碼庫、Enigma Core、Enigma P2P。該項目團隊表示,不久將會在測試網上發布 Enigma 協議的最小化可行產品「Discovery 」,該團隊很快將會發布測試套件和開發者環境,讓開發者可以在 Discovery 上創建 DApp。[2019/4/7]
橫向聯邦學習假設收集兩個數據集,這兩個數據集用戶特征重疊多,而用戶重疊少。我們把數據集按照用戶維度切分,取出雙方用戶特征相同,而用戶不完全相同的部分數據作為機器的訓練數據,這種模型稱為橫向聯邦學習。?
例如,兩個不同行政區的銀行,用戶群體分別來自所在行政區,重疊部分少。但是同作為銀行,業務類似,因此數據集收集的用戶特征則大體相同。因此,橫向聯邦學習模型收集的是兩個數據集不完全相同的用戶部分。?
如下圖所示:?
縱向聯邦學習與橫向聯邦學習相反,在兩個數據集用戶重疊多、用戶特征重疊少的情況下,縱向聯邦學習把數據集按照數據特征維度切分,取出雙方用戶相同,而用戶特征不完全相同的部分作為機器訓練數據。?
例如,同一個行政區的銀行和商超,其收集的數據用戶群體大致類似,但銀行和商超收集到的用戶特征基本不同。因此,縱向聯邦學習模型收集的是兩個數據集不完全相同的用戶特征部分。?
如下圖所示:
聯邦遷移學習在用于機器學習的數據集樣本用戶與用戶特征重疊都較少的情況下,通常不對數據進行切分,而是引入聯邦遷移學習,來解決數據不足的問題,從而提升模型的效果。
具體地,可以擴展已有的機器學習方法,使之具有橫向聯邦學習或者縱向聯邦學習的能力。?例如,收集一家位于北京的銀行和一家位于上海的商超的數據,由于受到地域限制,用戶群體交集很小;同時,由于銀行和商超類型的不同,二者收集的數據特征也基本無重合。?
引入聯邦遷移學習,首先可以先讓兩個數據集訓練各自的模型,之后通過加密模型數據,避免在傳輸中泄露隱私。之后,對這些模型進行聯合訓練,最后得出最優的模型,再返回給各個企業。?
如下圖所示:?
多種類別的聯邦學習方式使得機器學習模型更加具有通用性,可以在不同數據結構、不同行業間發揮作用,沒有領域和算法限制,同時具有模型質量無損、保護隱私、確保數據安全的優勢。?
在實際的應用中,類似銷售、金融等行業,由于知識產權、隱私保護和數據安全等因素限制,數據壁壘很難打通。
聯邦學習成為了解決這些問題的關鍵,在不影響數據隱私和安全的情況下,對來自多方的數據進行統一的建模,進行機器學習模型的訓練,這些企業之間就能更好地進行數據協作。?
可以說,聯邦學習為構建跨行業、跨地域的大數據和人工智能生態圈提供了良好的技術支持。?考慮到在整個訓練過程中,進行模型更新的通信仍然可以向第三方或中央服務器顯示敏感信息,因此聯邦學習技術廣泛地與安全多方計算、TEE或者區塊鏈等技術結合應用,來增強聯邦學習的隱私性和去信任。
但目前已有的方法通常以降低模型性能或系統效率為代價提供隱私,因此,如何在理論和經驗上理解和平衡這些權衡,將是實現聯邦學習技術廣泛應用落地的一個相當大的挑戰。
原文:北青網 和著名歌手林俊杰做鄰居,在現實中很難,在元宇宙中卻容易得多。11月23日,林俊杰在推特上展示了他購買的三個虛擬地塊,共花費約12.3萬美元.
1900/1/1 0:00:00“你來到了這里,其他人圍在你身邊,但他們不理解你,你也不理解他們,然而人們還是要說很多毫無意義的廢話。為了活下去,你只能每天從早到晚不停地做這種愚蠢又沒有意義的活計.
1900/1/1 0:00:00據CNBC12月17日消息,Meta加密貨幣項目高管MeronColbeci近日已離開Meta,加入總部位于英國的數字支付公司Checkout.com,后者是歐洲最大的私人控股金融科技公司之一.
1900/1/1 0:00:00阿迪達斯毫不猶豫地開始動手,在最近幾周剛剛向這個領域介紹自己之后,本周發布了他們的第一個NFT;政務舞臺現在已經看到了NFT滲透;一家游戲工作室看到了NFT的巨大阻力,以至于他們完全改變了方向.
1900/1/1 0:00:0012月,NFT藝術品市場再一次讓人矚目。12月8日,NFT市場NiftyGateway官方宣布,知名NFT數字藝術家Pak的實驗性NFT項目Merge售出了價值近9200萬美元的mass代幣,再.
1900/1/1 0:00:00據CoinDesk12月17日消息,根據Chainalysis的一份報告,截止2021年,加密貨幣投資者因“RugPull”損失了超過28億美元.
1900/1/1 0:00:00