Polygeist

Polygeist

优化C/C++代码性能与可移植性的MLIR编译框架

Polygeist是一个先进的编译框架,将C/C++代码转换为MLIR的多面体表示。它实现了自动代码优化、并行化和GPU转译,有效提升代码性能和可移植性。该项目集成了CUDA和ROCm后端,并与LLVM、MLIR和Clang紧密结合,为开发人员提供了强大的工具链以优化现有代码。Polygeist主要应用于高性能计算、自动并行化和跨平台开发领域。

PolygeistMLIRLLVM编译器GPU优化Github开源项目

构建说明

要求

  • 可用的C和C++工具链(编译器、链接器)
  • cmake
  • make或ninja

1. 克隆Polygeist

git clone --recursive https://github.com/llvm/Polygeist cd Polygeist

2. 安装LLVM、MLIR、Clang和Polygeist

选项1:使用预构建的LLVM、MLIR和Clang

Polygeist可以通过提供预构建的MLIR和Clang工具链的路径来构建。

1. 构建LLVM、MLIR和Clang:

mkdir llvm-project/build cd llvm-project/build cmake -G Ninja ../llvm \ -DLLVM_ENABLE_PROJECTS="mlir;clang" \ -DLLVM_TARGETS_TO_BUILD="host" \ -DLLVM_ENABLE_ASSERTIONS=ON \ -DCMAKE_BUILD_TYPE=DEBUG ninja ninja check-mlir

要启用CUDA编译,请添加-DMLIR_ENABLE_CUDA_RUNNER=1并从cmake参数中移除-DLLVM_TARGETS_TO_BUILD="host"。(您可能需要指定CUDACXXCUDA_PATH和/或-DCMAKE_CUDA_COMPILER

要启用ROCM后端,请添加-DMLIR_ENABLE_ROCM_RUNNER=1并从cmake参数中移除-DLLVM_TARGETS_TO_BUILD="host"。(您可能需要指定-DHIP_CLANG_INCLUDE_PATH和/或ROCM_PATH

对于启用ISL的polymer,必须将polly添加到LLVM_ENABLE_PROJECTS变量中。

为了加快编译速度,我们建议使用-DLLVM_USE_LINKER=lld

2. 构建Polygeist:

mkdir build cd build cmake -G Ninja .. \ -DMLIR_DIR=$PWD/../llvm-project/build/lib/cmake/mlir \ -DCLANG_DIR=$PWD/../llvm-project/build/lib/cmake/clang \ -DLLVM_TARGETS_TO_BUILD="host" \ -DLLVM_ENABLE_ASSERTIONS=ON \ -DCMAKE_BUILD_TYPE=DEBUG ninja ninja check-polygeist-opt && ninja check-cgeist

为了加快编译速度,我们建议使用-DPOLYGEIST_USE_LINKER=lld

GPU后端

要启用CUDA后端,请添加-DPOLYGEIST_ENABLE_CUDA=1

要启用ROCM后端,请添加-DPOLYGEIST_ENABLE_ROCM=1

Polymer

要启用polymer,请添加-DPOLYGEIST_ENABLE_POLYMER=1

可以构建两种polymer配置 - 一种使用Pluto,另一种使用ISL。

Pluto

添加-DPOLYGEIST_POLYMER_ENABLE_PLUTO=1 这将导致cmake调用拉取并构建polymer的依赖项。要指定依赖项的自定义目录,请指定-DPOLYMER_DEP_DIR=<绝对路径>。依赖项将使用tools/polymer/build_polymer_deps.sh进行构建。

要运行polymer pluto测试,请使用ninja check-polymer

ISL

添加-DPOLYGEIST_POLYMER_ENABLE_ISL=1 这需要一个启用了polly作为子项目的llvm-project构建。

选项2:使用统一的LLVM、MLIR、Clang和Polygeist构建

Polygeist也可以作为外部LLVM项目使用LLVM_EXTERNAL_PROJECTS进行构建。

  1. 构建LLVM、MLIR、Clang和Polygeist:
mkdir build cd build cmake -G Ninja ../llvm-project/llvm \ -DLLVM_ENABLE_PROJECTS="clang;mlir" \ -DLLVM_EXTERNAL_PROJECTS="polygeist" \ -DLLVM_EXTERNAL_POLYGEIST_SOURCE_DIR=.. \ -DLLVM_TARGETS_TO_BUILD="host" \ -DLLVM_ENABLE_ASSERTIONS=ON \ -DCMAKE_BUILD_TYPE=DEBUG ninja ninja check-polygeist-opt && ninja check-cgeist

ninja check-polygeist-opt运行Polygeist/test/polygeist-opt中的测试 ninja check-cgeist运行Polygeist/tools/cgeist/Test中的测试

引用Polygeist

如果您使用Polygeist,请考虑引用以下相关出版物:

@inproceedings{polygeistPACT, title = {Polygeist: Raising C to Polyhedral MLIR}, author = {Moses, William S. and Chelini, Lorenzo and Zhao, Ruizhe and Zinenko, Oleksandr}, booktitle = {Proceedings of the ACM International Conference on Parallel Architectures and Compilation Techniques}, numpages = {12}, location = {Virtual Event}, series = {PACT '21}, publisher = {Association for Computing Machinery}, year = {2021}, address = {New York, NY, USA}, keywords = {Polygeist, MLIR, Polyhedral, LLVM, Compiler, C++, Pluto, Polly, OpenScop, Parallel, OpenMP, Affine, Raising, Transformation, Splitting, Automatic-Parallelization, Reduction, Polybench}, } @inproceedings{10.1145/3572848.3577475, author = {Moses, William S. and Ivanov, Ivan R. and Domke, Jens and Endo, Toshio and Doerfert, Johannes and Zinenko, Oleksandr}, title = {High-Performance GPU-to-CPU Transpilation and Optimization via High-Level Parallel Constructs}, year = {2023}, isbn = {9798400700156}, publisher = {Association for Computing Machinery}, address = {New York, NY, USA}, url = {https://doi.org/10.1145/3572848.3577475}, doi = {10.1145/3572848.3577475}, booktitle = {Proceedings of the 28th ACM SIGPLAN Annual Symposium on Principles and Practice of Parallel Programming}, pages = {119–134}, numpages = {16}, keywords = {MLIR, polygeist, CUDA, barrier synchronization}, location = {Montreal, QC, Canada}, series = {PPoPP '23} } @inproceedings{10444828, author = {Ivanov, Ivan R. and Zinenko, Oleksandr and Domke, Jens and Endo, Toshio and Moses, William S.}, booktitle = {2024 IEEE/ACM International Symposium on Code Generation and Optimization (CGO)}, title = {Retargeting and Respecializing GPU Workloads for Performance Portability}, year = {2024}, volume = {}, issn = {}, pages = {119-132}, doi = {10.1109/CGO57630.2024.10444828}, url = {https://doi.ieeecomputersociety.org/10.1109/CGO57630.2024.10444828}, publisher = {IEEE Computer Society}, address = {Los Alamitos, CA, USA}, month = {mar} }

编辑推荐精选

博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

热门AI工具AI办公办公工具智能排版AI生成PPT博思AIPPT海量精品模板AI创作
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

下拉加载更多