零知識證明技術應用越來越廣,隱私證明,計算證明,共識證明等等。在尋找更多更好的應用場景的同時,很多人逐步發現零知識證明證明性能是個瓶頸。Trapdoor Tech 團隊從 2019 年開始深入研究零知識證明技術,并一直探索高效的零知識證明加速方案。GPU 或者 FPGA 是目前市面上比較常見的加速平臺。本文從 MSM 的計算入手,分析 FPGA 和 GPU 加速零知識證明計算的優缺點。
ZKP 是擁有未來廣泛前景的技術。越來越多的應用開始采用零知識證明技術。但 ZKP 算法比較多,各種項目使用不同的 ZKP 算法。同時,ZKP 證明的計算性能比較差。本文詳細分析了 MSM 算法,橢圓曲線點加算法,蒙哥馬利乘法算法等等,并對比了 GPU 和 FPGA 在 BLS 12 _ 381 曲線點加的性能差別。總的來說,在 ZKP 證明計算方面,短期 GPU 優勢比較明顯,Throughput 高,性價比高,具有可編程性等等。FPGA 相對來說,功耗有一定的優勢。長期看,有可能出現適合 ZKP 計算的 FPGA 芯片,也可能為 ZKP 定制的 ASIC 芯片。
ZKP 是個零知識證明技術的統稱(Zero Knowledge Proof)。主要由兩種分類:zk-SNARK 以及 zk-STARK。zk-SNARK 目前常見的算法是 Groth 16 ,PLONK,PLOOKUP,Marlin 和 Halo/Halo 2 。zk-SNARK 算法的迭代主要是沿著兩條方向: 1/ 是否需要 trusted setup 2/ 電路結構的性能。zk-STARK 算法的優勢是毋需 trusted setup,但是驗證計算量是對數線性的。
Binance全倉、逐倉杠桿新增FDUSD作為可借資產:8月9日消息,據官方公告,Binance 全倉、逐倉杠桿新增 FDUSD 作為可借資產,并在全倉、逐倉杠桿開放以下交易對:
新全倉杠桿交易對:BTC/FDUSD、ETH/FDUSD、FDUSD/USDT、YGG/BTC;
新逐倉杠桿交易對:BTC/FDUSD、ETH/FDUSD、FDUSD/USDT、OP/BTC。[2023/8/9 21:33:55]
就 zk-SNARK/zk-STARK 算法的應用來看,不同項目使用的零知識證明算法相對分散。zk-SNARK 算法應用中,因為 PLONK/Halo 2 算法是 universal(無需 trusted setup),應用可能越來越多。
以 PLONK 算法為例,剖析一下 PLONK 證明的計算量。
PLONK 證明部分的計算量由四部分組成:
1/ MSM - Multiple Scalar Multiplication。MSM 經常用來計算多項式承諾。
2/ NTT 計算 - 多項式在點值和系數表示之間變換。
美國眾議員:加密貨幣會對美國產生不利影響:金色財經報道,美國眾議員Sherman:加密貨幣會對美國產生不利影響。[2023/6/15 21:37:46]
3/ Polynomial 計算 - 多項式加減乘除。多項式求值(Evaluation)等等。
4/ Circuit Synthesize - 電路綜合。這部分的計算和電路的規模 / 復雜度有關。
Circuit Synthesize 部分的計算量一般來說判斷和循環邏輯比較多,并行度比較低,更適合 CPU 計算。通常來講,零知識證明加速一般指的是前三部分的計算加速。其中,MSM 的計算量相對來說最大,NTT 次之。
MSM(Multiple Scalar Multiplication)指的是給定一系列的橢圓曲線上的點和標量,計算出這些點加的結果對應的點。
比如說,給定一個橢圓曲線上的一系列的點:
Given a fixed set of Elliptic curve points from one specified curve:
[G_ 1, G_ 2, G_ 3, ..., G_n]
以及隨機的系數:
and a randomly sampled finite field elements from specified scalar field:
Alpha Homora將在未來18個月賠償資金滯留在Iron Bank的用戶:5月12日消息,多鏈借貸和收益平臺 Alpha Homora 發布第十封公開信,稱歷時 2.5 個月 Iron Bank 談判后,現用戶投票決定停止談判,Alpha Homora 將為資金滯留在 Iron Bank 的用戶創建 Goodwill Fund,該基金由兩部分組成:3000 萬枚 ALPHA 預留給 18 個月以上的儲戶,從 5 月 17 日開始,每月 17 日釋放;未來 50% 協議費用將分配給存款人,為期 18 個月。Goodwill Fund 的合格存款人已可查看他們將在 18 個月內收到多少 ALPHA 代幣。
此前消息,Alpha Homora 與以太坊上借貸平臺 Iron Bank 發生壞賬糾紛雙方曾歷時 2.5 個月談判已解決該問題。[2023/5/12 14:59:49]
[s_ 1, s_ 2, s_ 3, ..., s_n]
MSM is the calculation to get the Elliptic curve point Q:
Q = \sum_{i= 1 }^{n}s_i*G_i
行業普遍采用 Pippenger 算法對 MSM 計算進行優化。深入看看 Pippenger 算法的過程的示意圖:
PEPE 24小時漲幅超100%,幣價創歷史新高:金色財經報道,行情數據顯示,Meme幣Pepe(PEPE)過去24小時漲幅為102.8%,現報價0.000002223美元,幣價創歷史新高。行情波動較大,請做好風險控制。
此外,據CoinGecko數據顯示,其收錄的Meme類別代幣總市值目前為19,286,086,067美元,24小時交易額為1,288,089,101美元。[2023/5/5 14:43:58]
Pippenger 算法的計算過程分成兩步:
1/ Scalar 切分為 Windows。如果 Scalar 是 256 bits,并且一個 Window 是 8 bits,則所有的 Scalar 切分為 256/8 = 32 個 Window。每一層的 Window,采用一個「Buckets」臨時存放中間結果。GW_x 就是一層上的累加結果的點。計算 GW_x 也比較簡單,依次遍歷一層中的每個 Scalar,根據 Scalar 這層的值作為 Index,將對應的 G_x 加到相應的 Buckets 的位上。其實原理也比較簡單,如果兩個點加的系數相同,則先將兩個點相加后再做一次 Scalar 加,而不需要兩個點做兩次 Scalar 加后再累加。
Band Protocol已下架FTT并將其從BandChain中刪除:11月14日消息,跨鏈預言機Band Protocol在推特上表示,Band Protocol監控資產價格以確保它們符合Band標準。由于最近發生的事件和當前的市場情況,我們已將FTT下架并將其從BandChain中刪除,以保護我們的客戶和終端用戶。
此前11月10日消息,Band Protocol已從數據源中刪除FTX。[2022/11/14 13:02:52]
2/ 每個 Window 計算出來的點,再通過 double-add 的方式進行累加,從而得到最后的結果。
Pippenger 算法也有很多變形優化算法。不管怎么說,MSM 算法的底層計算就是橢圓曲線上的點加。不同的優化算法,對應不同的點加個數。
你可以從這個網站看看具有「short Weierstrass」形式的橢圓曲線上點加的各種算法。
http://www.hyperelliptic.org/EFD/g 1 p/auto-shortw-jacobian-0.html#addition-madd-2007-bl
假設兩個點的 Projective 坐標分別為(x 1, y 1, z 1) 和 (x 2, y 2, z 2) ,則通過如下的計算公式可以計算出點加的結果 (x 3, y 3, z 3)。
詳細給出計算過程的原因是想表明整個計算過程絕大部分是整數運算。整數的位寬取決于橢圓曲線的參數。給出一些常見的橢圓曲線的位寬:
BN 256 - 256 bits
BLS 12 _ 381 - 381 bits
BLS 12 _ 377 - 377 bits
特別注意的是,這些整數運算是在模域上的運算。模加 / 模減相對來說簡單,重點看看模乘的原理和實現。
給定模域上的兩個值:x 和 y。模乘計算指的是 x*y mod p。注意這些整數的位寬是橢圓曲線的位寬。模乘的經典算法是蒙哥馬利乘法(Montgomery Muliplication)。在進行蒙哥馬利乘法之前,被乘數需要轉化為蒙哥馬利表示:
蒙哥馬利乘法計算公式如下:
蒙哥馬利乘法實現算法又有很多:CIOS (Coarsely Integrated Operand Scanning),FIOS(Finely Integrated Operand Scanning),以及 FIPS(Finely Integrated Product Scanning)等等。本文不深入介紹各種算法實現的細節,感興趣的讀者可以自行研究。
為了對比 FPGA 以及 GPU 的本身的性能差別,選擇最基本的算法實現方法:
簡單的說,模乘算法可以進一步分成兩種計算:大數乘法和大數加法。理解了 MSM 的計算邏輯的基礎上,可以選擇模乘的性能(Throughput)來對比 FPGA 和 GPU 的性能。
在這樣的 FPGA 設計下,可以估算出整個 VU 9 P 能提供的在 BLS 12 _ 381 橢圓曲線點加 Throughput。一個點加(add_mix 方式)大約需要 12 個模乘。FPGA 的系統時鐘為 450 M。
在同樣的模乘 / 模加算法下,采用同樣的點加算法,Nvidia 3090 的點加 Troughput(考慮到數據傳輸因素)超過 500 M/s。當然,整個計算涉及到多種算法,可能存在某些算法適合 FPGA,有些算法適合 GPU。采用一樣的算法對比的原因,想對比 FPGA 和 GPU 的核心計算能力。
基于上述的結果,總結一下 GPU 和 FPGA 在 ZKP 證明性能方面的比較:
越來越多的應用開始采用零知識證明技術。但 ZKP 算法比較多,各種項目使用不同的 ZKP 算法。從我們的實踐工程經驗來看,FPGA 是個選項,但是目前 GPU 是個性價比高選項。FPGA 偏好確定性計算,有 latency 以及功耗的優勢。GPU 可編程性高,有相對成熟的高性能計算的框架,開發迭代周期短,偏好需要 throughput 場景。
IOSG Ventures
企業專欄
閱讀更多
金色財經
SevenUp DAO
金色圖覽
LK Venture
金色薦讀
區塊律動BlockBeats
引言: 像《黑暗森林》這樣的全鏈游戲已經證明,你可以把游戲邏輯都放在鏈上,且由于其具有無許可的互操作性,鼓勵了社區創造新工具、聯盟和 DAO 等等.
1900/1/1 0:00:00編譯:星球日報 接連兩日,美國證券交易委員會(SEC)相繼對 Binance、Coinbase 等兩大頭部交易所提起訴訟,震驚了 Crypto 乃至整個金融行業.
1900/1/1 0:00:00作者:Binance Research and Binance V 機構加密前景調查基于一項全球調查,來自 208 名幣安機構客戶和 VIP 用戶的回復.
1900/1/1 0:00:00▌SEC對幣安和趙長鵬提出13項指控,包括客戶資金處理不當等美國證券交易委員會(SEC)對幣安和趙長鵬提出 13 項指控,包括客戶資金處理不當以及對監管機構和投資者謊報了其運營情況等.
1900/1/1 0:00:00引言 1月10日,全國法院金融審判工作會議以視頻形式召開,會議結束后,法院內部形成了《全國法院金融審判工作會議紀要(征求意見稿)》卻一直沒有公開.
1900/1/1 0:00:00首先,復習一下“古典”的區塊鏈公鏈構造知識:拜占庭問題、雙花攻擊和以太坊的痛點。在傳統互聯網中,當 A 付錢給 B 時,發生了兩件事情: 1、A.
1900/1/1 0:00:00