我們要感謝 Polygon Zero 團隊、Consensys gnark 項目、Pado Labs 和 Delphinus Lab 團隊對本篇文章的寶貴評論和反饋。
零知識證明開發框架評測平臺
「萬神殿 Patheon」
過去幾個月,我們投入了大量時間和精力,開發了利用 zk-SNARK 簡潔證明構建的前沿基礎設施。這個次世代創新平臺使開發者能夠構建前所未有的區塊鏈應用新范例。
在開發工作中,我們測試并使用了多種零知識證明 (ZKP) 開發框架。雖然這段旅程收獲頗豐,但我們也確實意識到,當新的開發者試圖找到最適合其特定用例和性能要求的框架時,多種多樣的 ZKP 框架通常會給他們帶來挑戰。考慮到這一痛點,我們認為需要一個能夠提供全面性能測試結果的社區評估平臺,這將極大地促進這些新應用的開發。
為了滿足這一需求,我們推出了零知識證明開發框架評測平臺「萬神殿 Patheon」 這一公益社區倡議。倡議的第一步將鼓勵社區分享各種 ZKP 框架的可復現性能測試結果。我們的最終目標是共同協作創建并維護一個廣受認可的測試平臺,評估低級電路開發框架、高級 zkVM 和編譯器,甚至硬件加速提供商。我們希望這一舉措能夠讓開發者們在選用框架時能有更多性能比較的參考,從而加快 ZKP 的推廣。同時,我們希望通過提供一組普遍可參考的性能測試結果,促進 ZKP 框架本身的升級和迭代。我們將大力投入這項計劃,并邀請所有志同道合的社區成員加入我們,共同為這項工作做出貢獻!
第一步:使用 SHA-256 對電路框架進行性能測試
在這篇文章中,我們邁出了構建 ZKP Patheon 的第一步,在一系列低級電路開發框架中使用 SHA-256 提供一組可復現的性能測試結果。雖然我們承認其他性能測試粒度和原語或許也是可行的,但我們選擇 SHA-256 是因為它適用于廣泛的 ZKP 用例,包括區塊鏈系統、數字簽名、zkDID 等。另外值得一提的是,我們在自己的系統中也使用了 SHA-256,所以這對我們來說也很方便!?
DeFi資產管理平臺Valio計劃于8月7日公開發布:金色財經報道,DeFi資產管理平臺Valio計劃于8月7日公開發布,Valio利用加密貨幣透明度和自我托管的固有優勢,定位為“連接交易者與資本的人才發現市場”,著手從潛在投資者和資產管理者的角度解決問題。該平臺上的投資者可以在以去信任的方式將資金分配給交易員,而交易者可以訪問LayerZero支持的區塊鏈,以制定靈活的策略,其中包括長尾加密資產、衍生品以及dapp。首次推出門控后,白名單經理將可以通過Valio的金庫系統通過Arbitrum上的GMX和Optimism上的0x進行交易。用戶將通過 LayerZero 的跨鏈消息協議管理自己的頭寸。[2023/7/25 15:56:05]
我們的性能測試評估了 SHA-256 在各種 zk-SNARK 和 zk-STARK 電路開發框架上的性能。通過比較,我們力求為開發者提供關于每個框架的效率和實用性的見解。我們的目標是,希望本次性能測試結果能夠為開發者在選擇最佳框架時提供參考,使之做出明智的決定。
證明系統
近年來,我們觀察到零知識證明系統激增。跟上該領域所有激動人心的進步是具有挑戰性的,我們根據成熟度和開發者采用情況精心挑選了以下證明系統作為測試對象。我們的目標是提供不同前端/后端組合的代表性樣本。
Circom + snarkjs / rapidsnark: Circom 是一種流行的 DSL,用于編寫電路和生成 R1CS 約束,而 snarkjs 能夠為 Circom 生成 Groth16 或 Plonk 證明。Rapidsnark 也是 Circom 的證明器,它生成 Groth16 證明,并且由于使用了 ADX 擴展,它通常比 snarkjs 快得多,并盡可能并行化證明生成。
gnark: gnark 是來自 Consensys 的綜合 Golang 框架,支持 Groth16、Plonk 和許多更高級的功能。
Arkworks: Arkworks 是一個用于 zk-SNARKs 的綜合 Rust 框架。
交易所的比特幣余額創4年新低:金色財經報道,據Glassnode數據顯示,交易所的比特幣余額剛剛達到2,246,301.789枚BTC,創近4年新低。[2023/2/9 11:57:26]
Halo2 (KZG): Halo2 是 Zcash 與 Plonk 的 zk-SNARK 實現。它配備了高度靈活的 Plonkish 算術,支持許多有用的原語,例如自定義網關和查找表。我們使用具有以太坊基金會和 Scroll 支持的 KZG 的 Halo2 分叉。
Plonky2: Plonky2 是基于來自 Polygon Zero 的 PLONK 和 FRI 技術的 SNARK 實現。Plonky2 使用小的 Goldilocks 字段并支持高效的遞歸。在我們的性能測試中,我們以 100 位推測的安全性為目標,并使用為性能測試工作產生最佳證明時間的參數。具體來說,我們使用了 28 Merkle 查詢、8 的放大系數和 16 位工作量證明挑戰。此外,我們設置 num_of_wires = 60 和 num_routed_wires = 60。
Starky: Starky 是 Polygon Zero 的高性能 STARK 框架。在我們的性能測試中,我們以 100 位推測的安全性為目標,并使用產生最佳證明時間的參數。具體來說,我們使用了 90 Merkle 查詢、2 倍放大系數和 10 位工作量證明挑戰。
下表總結了上述框架以及我們性能測試中使用的相關配置。這個列表絕不是詳盡的,我們還將在未來研究許多最先進的框架/技術(例如,Nova、GKR、Hyperplonk)。
請注意,這些性能測試結果僅適用于電路開發框架。我們計劃在未來發布一篇單獨的文章,對不同的 zkVM(例如,Scroll、Polygon zkEVM、Consensys zkEVM、zkSync、Risc Zero、zkWasm)和 IR 編譯器框架(例如,Noir、zkLLVM)進行性能測試。
數據:過去五個月,Polygon網絡唯一地址數增加4286萬個:11月8日消息,PolygonScan數據顯示,從2022年6月7日至11月7日,Polygon網絡唯一地址數增加42,869,034個,五個月增長了約30%,平均每天新增超過28萬個。(finbold)[2022/11/8 12:33:14]
性能評測方法論
為了對這些不同的證明系統進行性能測試,我們計算了 N 字節數據的 SHA-256 哈希值,其中我們對 N = 64、128、...、64K 進行了實驗(Starky 是一個例外,其中電路重復 SHA-256 固定 64 字節輸入的計算,但保持相同的消息塊總數)。可以在此存儲庫(https://github.com/celer-network/zk-benchmark)中找到性能代碼和 SHA-256 電路配置。
此外,我們使用以下性能指標對每個系統進行了性能測試:
證明生成時間(包括見證生成時間)
證明生成期間的內存使用峰值
證明生成期間的平均 CPU 使用率百分比。(該指標反映了證明生成過程中的并行化程度)
請注意,我們正在對證明大小和證明驗證成本做一些“隨意”的假設,因為這些方面可以通過在上鏈之前與 Groth16 或 KZG 組合來減輕。
機器
我們在兩臺不同的機器上進行了性能測試:
Linux 服務器:20 核 @2.3 GHz,384GB 內存
Macbook M1 Pro:10 核 @3.2Ghz,16GB 內存
Linux 服務器用于模擬 CPU 核數多、內存充裕的場景。而通常用于研發的 Macbook M1 Pro 擁有更強大的 CPU,但內核較少。
我們啟用了可選的多線程,但我們沒有在此性能測試中使用 GPU 加速。我們計劃在未來進行GPU 性能測試。
性能評測結果
ENS 24小時交易額增幅達161%:8月21日消息,OpenSea數據顯示,以太坊域名服務(ENS)24小時交易額為335 ETH,位列OpenSea第六,24小時交易額增幅達161%。[2022/8/21 12:38:07]
約束數量
在我們繼續討論詳細的性能測試結果之前,首先通過查看每個證明系統中的約束數量來了解 SHA-256 的復雜性是很有用的。重要的是要注意不能直接比較不同算術方案中的約束數量。
下面的結果對應 64KB 的原像尺寸。雖然結果可能因其他原像尺寸而異,但它們可以粗略地線性縮放。
Circom、gnark、Arkworks 都使用相同的 R1CS 算法,計算 64KB SHA-256 的 R1CS 約束數量大致在 30M 到 45M 之間。Circom、gnark 和 Arkworks 之間的差異可能是由于配置差異造成的。
Halo2 和 Plonky2 都使用 Plonkish 算術,其中行數范圍從 2^22 到 2^23。由于使用查找表,Halo2 的 SHA-256 實現效率比 Plonky2 的高得多。
Starky 使用 AIR 算法,其中執行跟蹤表需要 2^16 個轉換步驟。
證明生成時間
[圖 1] 使用 Linux 服務器測試了 SHA-256 的每個框架在各種原圖像尺寸上的證明生成時間。我們可以得到以下發現:
對于 SHA-256,Groth16 框架(rapidsnark、gnark 和 Arkworks)生成證明的速度比 Plonk 框架(Halo2 和 Plonky2)快。這是因為 SHA-256 主要由位運算組成,其中線值為 0 或 1。對于 Groth16,這減少了從橢圓曲線標量乘法到橢圓曲線點加法的大部分計算。但是,連線值并不直接用于 Plonk 的計算,因此 SHA-256 中的特殊連線結構不會減少 Plonk 框架中所需的計算量。
Solidity發布v0.8.14版本,修復兩個重要漏洞:5月19日消息,據官方推特,以太坊智能合約編程語言Solidity發布v0.8.14版本。本次更新修復了兩個重要漏洞。第一個漏洞與直接來自calldata的ABI編碼嵌套數組有關。第二個漏洞是在某些繼承結構中觸發的,可能導致存儲器指標被解釋為calldata指標。此外,該版本還包括幾個小漏洞修復和改進。[2022/5/19 3:28:23]
在所有 Groth16 框架中,gnark 和 rapidsnark 比 Arkworks 和 snarkjs 快 5 到 10 倍。這要歸功于它們利用多個內核并行化生成證明的卓越能力。Gnark 比 rapidsnark 快 25%。
對于 Plonk 框架,當使用 >= 4KB 的較大原像尺寸時,Plonky2 的 SHA-256 比 Halo2 的慢 50%。這是因為 Halo2 的實現主要使用查找表來加速按位運算,導致行數比 Plonky2 少 2 倍。但是,如果我們比較具有相同行數的 Plonky2 和 Halo2(例如,Halo2 中超過 2KB 的 SHA-256 與 Plonky2 中超過 4KB 的 SHA-256),Plonky2 比 Halo2 快 50%。如果我們在 Plonky2 中使用查找表實現 SHA-256,我們應該期望 Plonky2 比 Halo2 更快,盡管 Plonky2 的證明尺寸更大。
另一方面,當輸入原像尺寸較小(<=512 字節)時,由于查找表的固定設置成本占大部分約束,Halo2 比 Plonky2(和其他框架)慢。然而,隨著原像的增加,Halo2 的性能變得更具競爭力,對于高達 2KB 的原像大小,其證明生成時間保持不變,如圖所示,其幾乎呈線性擴展。
正如預期的那樣,Starky 的證明生成時間比任何 SNARK 框架都短得多 (5倍-50倍),但這是以更大的證明大小為代價的。
另外需要注意的是,即使電路大小與原像大小成線性關系,由于 O(nlogn) FFT,對于 SNARKs 的證明生成也是呈超線性增長的(盡管由于對數刻度,這一現象在圖表上并不明顯)。
我們還在 Macbook M1 Pro 上進行了證明生成時間性能測試,如 [圖 2] 所示。但是,需要注意的是,由于缺乏對 arm64 架構的支持,rapidsnark 未包含在該性能測試中。為了在 arm64 上使用 snarkjs,我們必須使用 webassembly 生成見證,這比 Linux 服務器上使用的 C++ 見證生成要慢。
在 Macbook M1 Pro 上運行性能測試時還有幾個額外的觀察結果:
除了 Starky 之外,所有 SNARK 框架在原像尺寸變大時都會遇到內存不足 (OOM) 錯誤或使用交換內存(導致證明時間變慢)現象。具體來說,Groth16 框架(snarkjs、gnark、Arkworks)在原像尺寸>= 8KB 時就開始使用交換內存,而 gnark 在原像尺寸>= 64KB 時出現內存不足。當原像尺寸>= 32KB 時,Halo2 遇到了內存限制。當原像尺寸>= 8KB 時,Plonky2 開始使用交換內存。
基于 FRI 的框架(Starky 和 Plonky2)在 Macbook M1 Pro 上比在 Linux 服務器上快大約 60%,而其他框架在兩臺機器上面的證明時間相似。因此即使在 Plonky2 中沒有使用查找表,它在 Macbook M1 Pro 上實現了與 Halo2 幾乎相同的證明時間。主要原因是 Macbook M1 Pro 擁有更強大的 CPU,但內核更少。FRI 主要進行哈希運算,對 CPU 時鐘周期比較敏感,但并行性不如 KZG 或 Groth16。
內存使用峰值
[圖 3] 和 [圖 4] 分別顯示了在 Linux Server 和 Macbook M1 Pro 上生成證明期間的內存使用峰值。根據這些性能測試結果可以得出以下觀察結果:
在所有 SNARK 框架中,rapidsnark 是內存效率最高的。我們還看到,由于查找表的固定設置成本,當原像尺寸較小時,Halo2 使用更多內存,但當原像尺寸較大時,整體消耗的內存較少。
Starky 的內存效率比 SNARK 框架高 10 倍以上。部分原因是它使用了更少的行。
應該注意的是,由于使用交換內存,原像尺寸變大,因此 Macbook M1 Pro 上的內存使用量峰值保持相對平穩。
CPU 利用率
我們通過測量 SHA-256 在 4KB 原像輸入的證明生成期間的平均 CPU 利用率來評估每個證明系統的并行化程度。下表顯示了 Linux Server(20 核)和 Macbook M1 Pro(10 核)上的平均 CPU 利用率(括號中為每個內核的平均利用率 ) 。
主要觀察結果如下:
Gnark 和 rapidsnark 在 Linux 服務器上表現出最高的 CPU 利用率,表明它們能夠有效地使用多核且并行化生成證明。Halo2 也展現了良好的并行化性能。
大多數框架在 Linux 服務器上的 CPU 利用率是在 Macbook Pro M1 的 2 倍,只有 snarkjs 例外。
盡管最初預計基于 FRI 的框架(Plonky2 和 Starky)可能難以有效地使用多核,但它們在我們的性能測試中的表現并不比某些 Groth16 或 KZG 框架差。在具有更多內核(例如 100 個內核)的機器上,CPU 利用率是否會有差異還有待觀察。
結論及未來研究
這篇文章全面比較了 SHA-256 在各種 zk-SNARK 和 zk-STARK 開發框架上的性能測試結果。通過比較,我們深入了解了每種框架的效率和實用性,以期可以幫助需要為SHA-256 操作生成簡潔證明的開發者。我們發現 Groth16 框架(例如 rapidsnark、gnark)在生成證明方面比 Plonk 框架(例如 Halo2、Plonky2)更快。Plonkish 算術化中的查找表在使用較大的原像尺寸時顯著減少了 SHA-256 的約束和證明時間。此外,gnark 和 rapidsnark 展示了利用多核以并行化運作的出色能力。另一方面,Starky 的證明生成時間要短得多,但代價是證明大小要大得多。在內存效率方面,rapidsnark 和 Starky 優于其他框架。
金色財經 善歐巴
金色早8點
Odaily星球日報
歐科云鏈
Arcane Labs
深潮TechFlow
MarsBit
BTCStudy
澎湃新聞
文/Miles Deutscher,加密貨幣分析師;譯/金色財經xiaozou要在加密貨幣領域收獲最大收益,你需要將自己置于最強大的敘事中。本文所盤點的趨勢中有些仍然有可能產生50倍的機會.
1900/1/1 0:00:00來源:Coinbase 編譯:比推BitpushNews Mary Liu今天,我們很高興地宣布推出 Base 的測試網,這是一個以太坊第 2 層 (L2) 網絡.
1900/1/1 0:00:00文:尚治、徐鵬 清華大學互聯網產業研究院隨著互聯網技術的興起與迭代,過去幾十年里,創作者經濟作為一種全新經濟形態萌芽并迅速發展.
1900/1/1 0:00:00比特幣 NFT 的崛起,是 NFT 生態目前最大的故事之一。然而,這一早期場景可能相當混亂。這篇由 Bankless 撰寫的教戰指南將指點你如何用簡單、直接的方式鑄造自己的比特幣 NFT.
1900/1/1 0:00:00DeFi數據 1、DeFi代幣總市值:518.55億美元 DeFi總市值及前十代幣 數據來源:coingecko2、過去24小時去中心化交易所的交易量26.
1900/1/1 0:00:001.穩定幣”野貓“時代:DeFi協議紛紛發行穩定幣會產生什么影響DeFi協議正在行動。隨著基于費用的商業模式的回報率下降和鏈上活動的枯竭,藍籌DeFi協議正在尋求可替代的收入來源,以強化協議并實.
1900/1/1 0:00:00