gigahorse-toolchain

gigahorse-toolchain

开源智能合约反编译和分析框架

Gigahorse是一个开源的以太坊智能合约反编译和分析工具链。它将低级EVM代码转换为类似LLVM IR的高级三地址表示。该工具提供多种上下文敏感性配置,支持函数内联,可与各类客户端分析工具集成。Gigahorse为智能合约研究和安全分析奠定了基础,已在多个学术项目和实时分析平台中得到应用。

GigahorseEVM智能合约反编译静态分析Github开源项目

注意:由于此代码库包含子模块,因此在克隆时需要使用 --recursive 标志,例如:git clone git@github.com:nevillegrech/gigahorse-toolchain.git --recursive

Gigahorse 二进制提升器和工具链 推文

一个从低级 EVM 代码到高级基于函数的三地址表示的二进制提升器(及相关框架),类似于 LLVM IR 或 Jimple。

快速入门

从本地克隆运行/安装 Gigahorse(需要 souffle

首先确保你的系统上安装了以下内容:

  • Boost 库(可以在 Debian 上使用 apt install libboost-all-dev 安装)

  • Python 3.8(参考标准文档)

  • Souffle 2.3 或 2.4(我们仅使用发布版本进行测试,较新的开发版本可能可用但未经我们测试。参考 Souffle 文档。最简单的安装方法是使用 https://github.com/souffle-lang/souffle/releases/tag/2.3 的发布版本)

现在安装 Souffle 自定义函数:

cd souffle-addon && make            # 构建所有内容,将 libfunctors.so 设置为 libsoufflenum.so 的链接

现在你应该可以运行 Gigahorse 了。

通过 docker 安装 Gigahorse

或者,你可以使用我们预构建的 docker 镜像,按照以下说明使用 Gigahorse:

  1. 对于 amd64:

    curl -s -L https://raw.githubusercontent.com/nevillegrech/gigahorse-toolchain/master/scripts/docker/install/install_amd64 | bash
    

    对于 arm64/m1(未积极测试):

    curl -s -L https://raw.githubusercontent.com/nevillegrech/gigahorse-toolchain/master/scripts/docker/install/install_arm64 | bash
    
  2. 然后 source ~/.bashrc

  3. 使用 gigahorse --help 检查 gigahorse 是否可用

运行 Gigahorse

gigahorse.py 脚本可以单独在一个合约上运行,也可以在指定目录中的一系列合约字节码文件上运行。它将对每个合约运行 logic/main.dl 中实现的二进制提升器,然后可选地运行用户使用 -C 标志指定的任何其他客户端分析。

默认管道首先尝试使用事务性上下文敏感配置反编译合约。如果超时,它会使用可扩展回退配置(使用混合精确上下文敏感算法,针对可扩展性进行调优)进行第二次尝试。此外,如果默认配置成功但产生不精确的输出,则使用精确回退配置(当前与 --early_cloning 配置相同)尝试消除这种不精确性。如果需要,可以使用 --disable_scalable_fallback--disable_precise_fallback 标志分别禁用这两种回退配置。

Gigahorse 管道还包括几轮小函数内联,以帮助后续客户端库获得更高级的推断。可以使用 --disable_inline 禁用内联功能。

每个合约的预期文件格式为 .hex 格式。

示例(单个合约):

./gigahorse.py examples/long_running.hex

(对于某些 Souffle 版本,在首次编译期间,你会收到关于 libsoufflenum.so 动态库的错误消息。你可以忽略这个,重新运行后 gigahorse.py 应该可以正常工作。)

分析时间过长的合约将在可配置的超时后被跳过。

反编译结果放置在 .temp 目录中,而有关执行的元数据(如指标)放置在 results.json 文件中,以三元组列表的形式:

[文件名, 属性, 标志]

这里,属性 是文件名中检测到的合约问题列表, datalog 文件中任何非空的输出关系的关系名称都将放在这个列表中。 标志 是一个表示辅助或异常信息的列表。它可能包括 "ERROR""TIMEOUT",这些是不言自明的。

使用 gigahorse.py --help 获取调用说明。

示例(带客户端分析):

./gigahorse.py  -j <作业数> -C clients/visualizeout.py <合约>

(跟在"-C"标志后面的客户端可以是以逗号分隔的列表,不含空格,包含可通过路径访问或完全限定的文件名。)

Gigahorse 还可以在"批量分析"模式下使用,方法是将 <contracts> 替换为装满合约的目录。

有关调整 Gigahorse 框架的其他说明,请参阅 Advanced.md

提升后 IR 的文本表示

客户端分析工具 clients/visualizeout.py 可用于提供 Gigahorse 生成的 IR 的美化打印文本表示。 美化打印的文本文件命名为 contract.tac,将放置在每个分析合约的 out/ 文件夹中。 例如,./gigahorse.py -C clients/visualizeout.py examples/long_running.hex 的输出将被放置在 .temp/long_running/out/contract.tac 中。

contract.tac 中可视化的块看起来像这样:

    Begin block 0x3e
    prev=[0xb], succ=[0x10ee, 0x49]
    =================================
    0x3f: v3f(0xf42fdfb) = CONST 
    0x44: v44 = EQ v3f(0xf42fdfb), v32
    0x10c7: v10c7(0x10ee) = CONST 
    0x10c8: JUMPI v10c7(0x10ee), v44

请注意,美化打印的变量标识符与底层 datalog 事实中的标识符不对应。

编写客户端分析

客户端分析可以用任何语言编写,通过读取反编译步骤(main.dl)写入的关系文件。然而,该框架为用 Datalog 编写的客户端提供了优先处理。Gigahorse 框架最著名的客户端分析示例是 MadMax。它使用了 clientlib 下的几个"分析客户端库"。这些库包括可定制的数据流分析、内存建模、数据结构重构等。

反编译字节码的客户端分析常用模板是创建包含 clientlib/decompiler_imports.dl 的 souffle datalog 文件,例如:

#include "clientlib/decompiler_imports.dl"

.output ...

Gigahorse 的用途

Gigahorse 工具链最初发表为:

  • Grech, N., Brent, L., Scholz, B., Smaragdakis, Y. (2019),Gigahorse:智能合约的全面、声明式反编译。第 41 届 ACM/IEEE 国际软件工程会议。

原始发布后 Gigahorse 的几项新发展已发表为:

  • Grech, N., Lagouvardos, S., Tsatiris, I., Smaragdakis, Y. (2022),Elipmoc:以太坊智能合约的高级反编译 ACM 编程语言论文集(OOPSLA)。

此外,其他研究工具也在 Gigahorse 的基础上开发,包括:

  • Grech, N., Kong, M., Jurisevic, A., Brent, L., Scholz, B., Smaragdakis, Y. (2018),MadMax:在以太坊智能合约中应对 Out-of-Gas 情况。ACM 编程语言论文集(OOPSLA)。

  • Brent, L., Grech, N., Lagouvardos, S., Scholz, B., Smaragdakis, Y. (2020),Ethainter:复合漏洞的智能合约安全分析器。 第 41 届 ACM SIGPLAN 编程语言设计与实现会议。

  • Lagouvardos, S., Grech, N., Tsatiris, I., Smaragdakis, Y. (2020) 以太坊"内存"的精确静态建模。ACM 编程语言论文集(OOPSLA)。

  • Grech, N., Kong, M., Jurisevic, A., Brent, L., Scholz, B., Smaragdakis, Y. (2020),分析智能合约的 Out-of-Gas 世界。ACM 通讯。

  • Smaragdakis, Y., Grech, N., Lagouvardos, S., Triantafyllou, K., Tsatiris, I. (2021),符号值流静态分析:以太坊智能合约的深度、精确、完整建模。ACM 编程语言论文集(OOPSLA)。

Gigahorse 框架还支撑着 contract-library.com 的实时反编译器和分析工具。

编辑推荐精选

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

下拉加载更多