Likwid是一套简单易用的命令行应用程序和库,专为注重性能的程序员设计。它适用于运行Linux操作系统的Intel、AMD、ARMv8和POWER9处理器。此外还支持Nvidia和AMD GPU。虽然也支持ARMv7和POWER8/9,但目前我们没有测试机器来对它们进行适当测试。
它包括以下组件:
更多信息请查看Wiki或通过Matrix聊天LIKWID General联系我们。
Intel
AMD
ARM
POWER (实验性)
Nvidia GPU
AMD GPU
您可以在以下地址获取LIKWID的发布版本: http://ftp.fau.de/pub/likwid/
有关构建和安装的提示,请参阅INSTALL文件或查看wiki中的构建说明页面 https://github.com/RRZE-HPC/likwid/wiki/Build
快速安装方法:
VERSION=stable wget http://ftp.fau.de/pub/likwid/likwid-$VERSION.tar.gz tar -xaf likwid-$VERSION.tar.gz cd likwid-* vi config.mk # 配置构建,例如更改安装前缀和架构标志 make sudo make install # 需要sudo权限以正确权限安装访问守护程序
config.mk
中的COMPILER
标志更改为GCCARMv8
或ARMCLANG
(实验性)。
对于POWER构建,需要将config.mk
中的COMPILER
标志更改为GCCPOWER
或XLC
(实验性)。
要支持Nvidia GPU,请在config.mk
中将NVIDIA_INTERFACE
设置为true
,并根据需要调整构建时变量。
要支持AMD GPU,请在config.mk
中将ROCM_INTERFACE
设置为true
,并根据需要调整构建时变量。+--------------------------------+------------+ | 指标 | 硬件线程 0 | +--------------------------------+------------+ | 运行时间 (RDTSC) [秒] | 0.0022 | | 非停顿运行时间 [秒] | 0.0001 | | 时钟 [MHz] | 1613.6392 | | 每指令周期数 (CPI) | 1.4019 | | L2D 加载带宽 [MBytes/秒] | 197.8326 | | L2D 加载数据量 [GBytes] | 0.0004 | | L2D 驱逐带宽 [MBytes/秒] | 54.5745 | | L2D 驱逐数据量 [GBytes] | 0.0001 | | L2 带宽 [MBytes/秒] | 528.0381 | | L2 数据量 [GBytes] | 0.0011 | +--------------------------------+------------+ </pre>
</details> <details> <summary><code>likwid-pin</code></summary> <pre> $ likwid-pin -c 0,1,2 ./a.out [pthread 包装器] [pthread 包装器] 主线程 -> 0 [pthread 包装器] 固定掩码:0->1 1->2 [pthread 包装器] 跳过掩码:0x0 线程ID 140566548539136 -> 硬件线程 1 - 成功 线程ID 140566540146432 -> 硬件线程 2 - 成功 请求的线程数 = 3 线程 0 在处理器 0 上运行 .... 线程 1 在处理器 1 上运行 .... 线程 2 在处理器 2 上运行 .... [...] </pre> </details> <details> <summary><code>likwid-bench</code></summary> <pre> $ likwid-bench -t triad_avx -W N:2GB:3 警告:将向量长度调整为循环步长16和线程数3的倍数,从62500000个元素(500000000字节)调整为62499984个元素(499999872字节) 分配:进程在硬件线程0(域N)上运行 - 向量长度62499984/499999872 偏移量0 对齐512 分配:进程在硬件线程0(域N)上运行 - 向量长度62499984/499999872 偏移量0 对齐512 分配:进程在硬件线程0(域N)上运行 - 向量长度62499984/499999872 偏移量0 对齐512 分配:进程在硬件线程0(域N)上运行 - 向量长度62499984/499999872 偏移量0 对齐512 初始化:域中的每个线程初始化自己的流块 -------------------------------------------------------------------------------- LIKWID微基准测试 测试:triad_avx -------------------------------------------------------------------------------- 使用1个工作组 使用3个线程 -------------------------------------------------------------------------------- 在没有Marker API的情况下运行。在命令行中使用-m激活Marker API。 -------------------------------------------------------------------------------- 组:0 线程1 全局线程1在硬件线程4上运行 - 向量长度20833328 偏移量20833328 组:0 线程0 全局线程0在硬件线程0上运行 - 向量长度20833328 偏移量0 组:0 线程2 全局线程2在硬件线程1上运行 - 向量长度20833328 偏移量41666656 -------------------------------------------------------------------------------- 周期: 22977763263 CPU时钟: 4007946861 周期时钟: 4007946861 时间: 5.733051e+00 秒 迭代次数: 96 每线程迭代次数: 32 内部循环执行次数: 1302083 大小(字节): 1999999488 每线程大小: 666666496 浮点运算次数: 3999998976 MFlops/s: 697.71 数据量(字节): 63999983616 MByte/s: 11163.34 每次更新的周期数: 11.488885 每缓存行的周期数: 91.911077 每次更新的加载次数: 3 每次更新的存储次数: 1 每元素加载字节数: 24 每元素存储字节数: 8 加载/存储比率: 3.00 指令数: 2374999408 微操作数: 3749999040 -------------------------------------------------------------------------------- </pre> </details> <details> <summary><code>likwid-mpirun</code></summary> <pre> $ likwid-mpirun -mpi slurm -np 4 -t 2 ./a.out MPI已启动 等级为0的进程在节点f0846.nhr.fau.de的核心0上运行 等级为2的进程在节点f0859.nhr.fau.de的核心0上运行 等级为3的进程在节点f0859.nhr.fau.de的核心36上运行 等级为1的进程在节点f0846.nhr.fau.de的核心36上运行 进入OpenMP并行区域 启动OpenMP线程 等级0线程0在节点f0846.nhr.fau.de的核心0上运行 等级0线程1在节点f0846.nhr.fau.de的核心1上运行 等级1线程0在节点f0846.nhr.fau.de的核心36上运行 等级1线程1在节点f0846.nhr.fau.de的核心37上运行 等级2线程0在节点f0859.nhr.fau.de的核心0上运行 等级2线程1在节点f0859.nhr.fau.de的核心1上运行 等级3线程0在节点f0859.nhr.fau.de的核心36上运行 等级3线程1在节点f0859.nhr.fau.de的核心37上运行 </pre> </details> <details> <summary><code>likwid-powermeter</code></summary> <pre> $ likwid-powermeter -------------------------------------------------------------------------------- CPU名称: Intel(R) Core(TM) i7-6700K CPU @ 4.00GHz CPU类型: Intel Skylake处理器 CPU时钟: 4.01 GHz -------------------------------------------------------------------------------- -------------------------------------------------------------------------------- 运行时间:2.00019秒 在CPU 0上测量插座0 PKG域: 能耗:7.47705焦耳 功耗:3.73817瓦特 PP0域: 能耗:5.42047焦耳 功耗:2.70998瓦特 PP1域: 能耗:0.0872803焦耳 功耗:0.043636瓦特 DRAM域: 能耗:1.02612焦耳 功耗:0.513013瓦特 PLATFORM域: 能耗:0焦耳 功耗:0瓦特 -------------------------------------------------------------------------------- </pre> </details> <details> <summary><code>likwid-features</code></summary> <pre> $ likwid-features -c 0 -l 特性 硬件线程0 硬件预取器 开启 缓存行预取器 开启 DCU预取器 开启 IP预取器 开启 快速字符串 开启 热控制 开启 性能监控 开启 FERR多路复用 关闭 分支跟踪存储 开启 XTPR消息 关闭 PEBS 开启 变速步进 开启 监控 开启 变速步进锁定 关闭 CPUID最大值 关闭 XD位 开启 动态加速 关闭 睿频模式 开启 TM2 关闭 </pre> </details>有关工具使用的详细文档,请查看使用doxygen构建的html文档。执行
make docs
或在安装后查看man页面。
GitHub页面上还有一个wiki: https://github.com/rrze-likwid/likwid/wiki
如果您有问题或建议,请在likwid邮件列表上告诉我: http://groups.google.com/group/likwid-users
或者如果是bug,请在以下位置添加问题: https://github.com/rrze-likwid/likwid/issues 你也可以通过Matrix与我们聊天:
pip install pylikwid
] add LIKWID
我们在用户邮件列表中发起了一项调查,以了解谁在使用LIKWID以及如何使用。 此外,我们也想知道你是否觉得LIKWID缺少某些功能,或者在使用LIKWID时有什么让你感到不便的地方。 调查链接: https://groups.google.com/forum/#!topic/likwid-users/F7TDho3k7ps
LIKWID的开发得到了德国联邦教育与研究部(BMBF)在FEPA项目下的资助,资助号为01IH13009。自2017年起,开发工作继续得到BMBF在SeASiTe项目下的资助,资助号为01IH16012A。2022年,EE-HPC项目在GreenHPC资助计划下获得BMBF的资助。
<div align=center><img src="https://yellow-cdn.veclightyear.com/835a84d5/dd98867e-b30d-4ec1-9295-61e7800963ad.png" alt="BMBF标志" width="150"/></div>AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI小说写作助手,一站式润色、改写、扩写
蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。
全能AI智能助手,随时解答生活与工作的多样问题
问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。
实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。
深度推理能力全新升级,全面对标OpenAI o1
科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。
一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型
Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大 语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。
AI助力,做PPT更简单!
咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。
选题、配图、成文,一站式创作,让内容运营更高效
讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。
专业的AI公文写作平台,公文写作神器
AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号