華為:追逐Web3時代的摩爾定律
一個行業的基礎設施如果能保持摩爾定律的發展,會對整個產業繁榮起到非常關鍵的作用。華為雲首席技術規劃師余洲指出,Web3作為一個分散式的全球電腦,其基礎設施能按摩爾定律發展,是保證上層應用可以繁榮發展的重要因素。
GPU以摩爾定律持續發展
對於電腦系統而言,最重要的一個定律是摩爾定律 (Moore’s law),集成電路上可容納的元器件數目,每隔18至24個月便會增加一倍,性能也將提升一倍。
在過去幾年,隨著半導體工藝技術的發展變緩,在通用CPU (中央處理器) 的領域上,摩爾定律被認為失效。但在GPU (圖形處理器) 領域,摩爾定律仍然快速發展,這得益於人工智能和GPU相結合、在晶片上針對人工智能的加速方向,以及從整個AI系統方向,也包括AI演算法方向共同的努力,促成了在GPU領域摩爾定律仍然持續發展。
以太坊擴容需求急切
隨著以太坊 (Ethereum) 使用人數增加,區塊鏈已經達到一定的容量限制。擴容是當前重要的工作。今年三月,L2 Rollup的流量首次超過L1,今年五月,ZK交易的流量也取得非常大的突破。比較Web3的L1與L2與傳統電腦,正好就是CPU和GPU的關係。
CPU是一個非常好生態的處理器,但處理器的運算速度相對較慢,但GPU相對來說針對新型的AI負載有非常強的性能,兩者配合在一起完整構成如今的電腦世界。
三大方向追上摩爾定律需求
Web3同理,L1是整個的基石,L2為L1提供了更強性能的擴展性,華為認為,為了保持web3基礎設施,摩爾定律需要從三個方向上發力,第一個是硬件,第二個是系統,第三個是演算法。在硬件方面,以ZK-SNARK (Zero Knowledge Succinct Non-interactive Argument of Knowledge,不透露相關情報、簡潔及無互動的技術) 為例,整個處理過程包含電路的生成、編譯、Set-up以及生成證明。其中生成證明較消耗時間,我們測試兩個ZK的庫:Halo2和Bellperson,發現分別在零知識證明的過程中,有兩個演算法消耗了較多時間,分別是NTT與MSM。
從NTT來看,它實際上是在有限域中的快速傅立葉轉換 (Fourier Transformation),在同一個stage中運算是非常容易並行開展,但在stage之間需要進行數據的換入換出。對NTT這種運算任務,對訪存的要求是非常高的。
至於MSM是多標量的乘法,完成了一個標量和橢圓曲線上的點進行點乘的工作,同時進行相加,橢圓曲線的運算是非常消耗運算力的。
綜合NTT和MSM,我們可以看到,隨著計算任務及複雜度的增加,MSM需要更多的運算力,那對於記憶體頻寬而言,NTT和MSM表現卻跟運算力的需求相反,NTT需要更強的記憶體頻寬。
在系統方面,除去硬件本身,單一顆晶片總有處理能力的上限,當單一晶片無法滿足整個ZK性能時,需利用分散式系統,從而可以多晶片協同,通過一根高速匯流排連接在一起,來滿足最終需要。
對於像Halo2、BellPerson這種不同ZK庫的實現,NTT演算法和MSM演算法的比例是不同的。在分散式實現中可以比較靈活的根據真正ZK實現,把對應的演算法映射到分散式系統的不同節點上,進一步通過資源的更好調度和平衡,來實現更佳性能。
目前在研究一種新型的數據中心內部的匯流排技術,這種技術最大的不同,是採用記憶體語義進行通信。通過這種記憶體語義的匯流排,可以把多個加速器連接在一起,形成一個虛擬的共用記憶體池,可以做更緊密的、更細顆粒度的通信,也可以更容易支援新型加速演算法。
在算法方面,在ZK的實現過程中,在電路領域有比較多的優化,比如ZK-friendly加密學原理,以及通過查閱數據表的方式來減少大量的無謂操作。或者可以定制專用鏈路來提高ZK處理能力;
另一個是演算法的優化,綜觀過去十年在ZK領域的演算法發展,性能提升有上百倍。所以從硬件、系統和算法領域都可以有大量的發展空間去支撐在web3基礎設施上的優化。
Web3帶來儲存技術革新
對於儲存,因為每一代的運算架構均伴隨著相應的儲存,就像最早的大型機帶來了集中式儲存架構,雲運算帶來了分散式的儲存架構,如今AI運算帶來vector相關的儲存技術和記憶體儲存技術,那麼web3必然也伴隨著運算,也有對應的儲存架構出現。
我們認為ZK的技術可以有效加持儲存性能的提升,我們可以比作L1是CPU,L2是GPU,那web3的儲存就像是今天的SSD。
總結:強化Web3硬件基建 促進行業發展
總之,華為雲會基於ZK所優化的晶片作為最終的基礎,通過系統的網絡技術和匯流排技術連接成web3硬件的基礎設施。基於這個基礎設施,可以通過API或者Serverless的形式提供雲服務,助力web3應用的繁榮及行業發展。