導語
在智能合約世界中,“以太坊虛擬機(EVM)”及其算法和數據結構是首要原則。我們創建的智能合約就是建立在這個基礎之上的。不管是想要成為一名出色的 Solidity 智能合約開發人員還是安全人員都必須對 EVM 有深入的了解。
此系列我們將引介翻譯 noxx 的文章(https://noxx.substack.com/),深入探討 EVM 的基礎知識。
基礎知識:Solidity → 字節碼 → 操作碼
在閱讀本篇文章之前,你需要了解一些智能合約相關基礎知識以及如何將智能合約代碼部署到以太坊鏈上。正如我們所知,智能合約在部署到以太坊網絡之前需要先將 Solidity 代碼編譯成字節碼,EVM 會根據編譯后的字節碼執行相應的操作。本篇重點介紹編譯后的字節碼以及其如何被 EVM 執行的。
智能合約被部署后編譯生成的字節碼代表了整個合約的內容,其中存在多個可調用的函數。那么 EVM 是如何知道不同函數所對應的字節碼是哪個呢?下面我們將通過一個 Solidity 智能合約及其字節碼和操作碼來向大家演示 EVM 在執行代碼時是如何在字節碼中選擇對應的函數的。
1_Storage.sol Breakdown
我們使用在線 Solidity IDE 工具 Remix 來編譯 Storage 合約。
此合約中存在兩個函數 store() 和 retrieve(),在進行函數調用時 EVM 需要判斷我們調用的是哪個函數。我們可以通過 remix 看到整個合約編譯后的字節碼。
跨鏈應用構建平臺Hyperlane在PolygonzkEVM上線:5月21日消息,跨鏈應用構建平臺 Hyperlane 現已在 Polygon zkEVM 上線,為 Polygon zkEVM 開發人員和用戶提供鏈間應用可組合性和任何資產的無許可橋接等功能。[2023/5/21 15:16:33]
下面這段字節碼是我們需要重點關注的,這段就是 EVM 判斷被調用函數的選擇器。與其對應的是 EVM 操作碼及輸入值。
我們可以通過 Ethervm.io 來查看 EVM 操作碼列表。一個操作碼長度為 1 個字節(byte),這使得它可以存在 256 種不同的操作碼。但 EVM 僅使用其中的 140 個操作碼。
下面是我們將上述字節碼解析成與其對應的操作碼。這些操作碼會由 EVM 在調用棧上按順序執行。
智能合約函數調用
在深入研究操作碼之前,我們需要快速了解如何調用合約中的函數。調用智能合約中的函數有以下方式:
abi.encode(...) returns (bytes):計算參數的 ABI 編碼。
abi.encodePacked(...) returns (bytes):計算參數的緊密打包編碼。
abi. encodeWithSelector(bytes4 selector, ...) returns (bytes):計算函數選擇器和參數的 ABI 編碼。
Polygon zkEVM過去24小時跨鏈用戶量超2500人:金色財經報道,據DuneAnalytics數據,Polygon zkEVM上線近24小時以來,已有超過2,500名用戶完成超過2,700筆、88萬美元的跨鏈交易量,當前Polygon TVL約88.4萬美元。[2023/3/28 13:31:28]
abi.encodeWithSignature(string signature, ...) returns (bytes):等價于?abi.encodeWithSelector(bytes4(keccak256(signature), ...)。
abi.encodeCall(function functionPointer, (...)) returns (bytes memory):使用 tuple 類型參數 ABI 編碼調用 functionPointer()。執行完整的類型檢查,確保類型匹配函數簽名。結果和?abi.encodeWithSelector(functionPointer.selector, (...)) 一致。
這里我們以第四種為例,調用 store() 并傳入參數 10:
下面是通過?abi.encodeWithSignature (" store (uint256)",10)?編碼后的內容:
V神:以太坊不需要為Layer 1使用單一的ZK-EVM實現進行標準化:金色財經報道,以太坊創始人Vitalik Buterin發文解釋了“不同類型的ZK-EVM和類似ZK-EVM的項目,以及它們之間的權衡”。V神例舉了描述了多個EVM等價的不同“類型”的分類,以及嘗試實現每種類型的好處和成本。
V神總結稱,就我個人而言,我希望隨著時間的推移,通過ZK-EVM的改進和以太坊本身的改進相結合,使其對ZK-SNARK更加友好,一切都將成為Type1。在這樣的未來,我們將有多個ZK-EVM實現,它們既可以用于ZK匯總,也可以用于驗證以太坊鏈本身。
從理論上講,以太坊不需要為Layer1使用單一的ZK-EVM實現進行標準化;不同的客戶可以使用不同的證明,因此我們繼續從代碼冗余中受益。但是,要實現這樣的未來,還需要相當長的時間。與此同時,我們將在擴展以太坊和基于以太坊的ZK-rollup的不同路徑中看到許多創新。[2022/8/4 12:02:16]
這段數據就是編碼后的函數簽名。
我們可以使用在線工具(“https://emn178.github.io/online-tools/keccak_256.html”)來查看?store(uint256) 和?retrieve() 哈希后的結果。
也可以通過以太坊函數簽名數據庫(https://www.4byte.directory/signatures/)進行反查。
Terra計劃出資800萬美元獎勵在Evmos為UST提供流動性的項目:5月7日消息,Terra社區通過一項提案,將分配共價值800萬美元的UST,用于獎勵在Evmos網絡上為UST提供流動性的協議,包括Diffusion Finance、Exswap、Saddle Finance、Kinesis、Midas Capital、Coslend和Cronus Finance。
據悉,激勵措施將持續 2 個月,每個協議為獲得更高UST TVL時可以得到更多獎勵。例如,一個項目將獲得一個基本金額的激勵措施,以將流動性推向他們的資金池。如果其UST TVL達到一定門檻,社區將給予他們額外的獎勵,以繼續增加流動性。如果未達到一定等級,獎勵將退回社區池。[2022/5/7 2:57:46]
再回到上面的那組函數簽名數據,其中前 4 個字節對應的是 store(uint256)。而剩余的 32 個字節則對應的是一個十六進制的值 “a”,也就是我們調用函數時傳入的 uint256 類型的 10。
這里我們可以得到一個結論,通過?abi.encodeWithSignature()?編碼后得到的數據,共 36 個字節。這 36 個字節的數據就是函數簽名,其中前 4 個字節為函數選擇器,它將指引 EVM 去選擇我們調用的目標函數,后 32 個字節的數據則是我們調用函數時傳入的參數。
操作碼和調用棧
這里相信大家已經大致了解了智能合約中函數調用的原理了,下面我們將通過解讀每個操作碼的作用及其對棧調用的影響。如果你不熟悉棧數據結構的工作原理,可以觀看此視頻來快速入門:https://www.youtube.com/watch?v=FNZ5o9S9prU
Celer推出的跨鏈支付網絡cBridge宣布支持Clover EVM兼容鏈:3月12日,據官方消息,由Celer Network推出的跨鏈支付網絡cBridge宣布已集成Clover新推出的EVM兼容鏈。用戶現可通過cBridge在以太坊與Clover之間進行USDT、USDC、DAI、WETH、WBTC跨鏈轉賬。[2022/3/12 13:52:58]
我們將得到的字節碼分解成相對應的操作碼后依次開始分析。
?PUSH1 操作,將一個?1 字節的值壓入棧,它會告訴 EVM 將下一個數據字節 0x00(也是十進制的 0)?壓入棧中。
接下來是 CALLDATALOAD,其作用是從消息數據中讀取 32 個字節的值,其中使用 “輸入” 值作為偏移量將 calldata 加載到棧中。棧項大小為 32 字節,但是當前我們的 calldata 有 36 個字節。推送的值是 msg.data[i:i+32] 其中 “i” 就是這個輸入值。此操作確保只有 32 個字節被推送到棧,同時也能保證我們能夠訪問 calldata 中的任何部分。
當前輸入值為 0 也就是沒有偏移量(從棧中彈出的值是前一個 PUSH1 的值 0),因此 calldata 的前 32 個字節會被推送到調用棧。
還記得之前所獲取到的函數簽名嗎?如果要傳入這 36 個字節,這就意味著后面的 4 個字節“0000000a”將會丟失。如果想訪問這個 uint256 類型的參數,需要設置 4 的偏移量來省略函數簽名,這樣就可以保證參數的完整性。
第二次進行 PUSH1 的操作將傳入十六進制的數據 0xe0,也就是十進制的 224。我們上面提到過,函數簽名是 4 個字節也就是 32 位。我們加載的 calldata 是 32 個字節也就是 256 位,而 256 - 32 =224 正好滿足。
SHR,是向右移位指令。它從棧中獲取第一項 224 表示要位移的位數,從棧中獲取第二項?(0x6057361d0…00)?表示需要移位的內容。在這個操作之后調用棧上有了 4 個字節的函數選擇器。
如果對于位移的工作原理不熟悉的小伙伴,可以查看這個視頻了解:https://www.youtube.com/watch?v=fDKUq38H2jk&t=176s
接下來的操作碼, DUP1,它用來獲取并復制棧頂部的值。
PUSH4 將?retrieve() (0x2e64cec1) 的 4 個字節函數簽名推入調用棧。
如果你好奇是這個值是如何獲得的,那是因為 solidity 代碼被編譯成字節碼中。編譯器可以從字節碼中獲取所有函數名稱和參數類型的信息。
EQ 用于判斷從棧中彈出的 2 個值,在當前事例中為 0x2e64cec1 和 0x6057361d 并檢查它們是否相等。如果相等,則將 1 推回棧,如果不相等則為 0。
PUSH2 將 2 字節的十六進制數據 0x003b,十進制值為 59,推送到調用棧中。
調用棧中有一個叫做程序計數器的東西,它會指定下一個執行命令在字節碼中的位置。這里的 59,是通過 retrieve()?字節碼的開始位置所得到的。
JUMPI 代表“如果條件為真,則跳轉”,它從棧中彈出 2 個值作為輸入,第一個 59 表示的是跳轉位置,第二個 0 是是否應該執行此跳轉條件的布爾值。其中 1 為真,0 為假。
如果條件為真,程序計數器將被更新,執行將跳轉到該位置。但我們的例子中條件為假的,程序計數器沒有改變并且繼續執行。
再次進行DUP1。
PUSH4 將 store(uint256) (0x6057361d)?的 4 字節函數簽名推送到調用棧上。
再次進行 EQ,但這次結果為真,因為函數簽名相同。
PUSH2 推送 2 個字節的十六進制數據?0x0059 也就是十進制的 89, 到 store(uint256) 字節碼的程序計數器位置。
執行 JUMPI,此次 bool 值為真,執行跳轉。因此會將程序計數器更新為 89,這會將執行移動到字節碼的不同部分。在這個位置,會有一個 JUMPDEST 操作碼,如果沒有這個操作碼在這里的話,JUMPI 操作就會失敗。
有了它,在執行此操作碼后,將被帶到 store(uint256)?對應的字節碼的位置,并且函數的執行將繼續。雖然這個合約只有 2 個函數,但基礎原理都是相同的。
通過上面的例子我們知道了 EVM 是如何根據合約函數調用來確定它需要執行的函數字節碼的位置。簡單來說就是由合約中每個函數及其跳轉位置所組成的一組簡單的“if 語句”。
EVM Playground
這是一個 EVM Playground(https://www.evm.codes/playground)測試平臺,在平臺上我們可以設置剛剛運行的字節碼。就能夠通過交互方式來查看棧的變化,并且傳入 JUMPDEST(注:可能跳轉的目標元數據),可以看到 JUMPI 之后會發生什么。
敬請期待《EVM 深入探討-Part 2》,讓我們共同探索合約內存是什么以及它在 EVM 下的工作方式。
慢霧科技
個人專欄
閱讀更多
金色早8點
Bress
鏈捕手
財經法學
PANews
成都鏈安
Odaily星球日報
截至目前,韓國政府已經出臺了一系列有關新技術的傾斜政策,而5G和XR是這些政策中的核心。隨著元宇宙概念的深入人心,韓國政府不斷調整他們的施政方向.
1900/1/1 0:00:00原文標題:《DeFi?聚合池》(DeFi Pooling)撰文:Louis Guthmann編譯:StarkNet 中文社區DeFi 的初始價值觀是關于金融包容性和開放性.
1900/1/1 0:00:00金色財經報道,8月19日消息,推特用戶Crypto-Gucci.eth發布推文稱,在最新的以太坊核心開發者會議上,已確定以太坊合并的主網TTD為58750000000000000000000.
1900/1/1 0:00:00針對虛擬幣“挖礦”專項整治仍在有序進行中,12月份以來,海南、陜西、云南、浙江等地相繼出臺相關政策或披露專項整治情況.
1900/1/1 0:00:00如果說新公鏈 Aptos、Sui 以及 Linera 是 Meta Diem 項目的軀殼繼承者們,那么 Lightspark 便是 Diem 唯一的靈魂繼承者.
1900/1/1 0:00:00閃閃發光的不一定都是金子。理性對待 DAO,避免陷入DAO的效率陷阱和漏洞。 DAO 效率低下背景 DAO 通過激勵用戶參與活動,以促進其商業目標;同時它使個人能夠一起工作,最大限度地減少信任,
1900/1/1 0:00:00