
随着边缘计算和人工智能的快速发展,如何在嵌入式设备上高效运行深度学习模型成为一个重要课题。近日,GitHub 上的 rknn-cpp-Multithreading 项目为我们展示了一种在 RK3588/RK3588s 芯片上运行 YOLOv5s 模型的高效方案。该项目通过多线程优化,成功将 YOLOv5s 的推理速度提升至约 142 FPS,展现了令人印象深刻的性能。让我们一起来深入了解这个项目的特点和实现细节。
rknn-cpp-Multithreading 是一个基于 C++ 实现的 YOLOv5s 推理框架,专门针对搭载 RK3588/RK3588s 芯片的设备进行了优化。该项目的主要特点包括:

项目的核心技术实现包括以下几个方面:
多线程优化: 项目使用了 dpool 线程池库来实现异步操作 RKNN 模型。这种方式可以充分利用 RK3588/RK3588s 的多核 NPU,显著提高推理吞吐量。
模型优化: 项目采用了 ReLU 版本的 YOLOv5s 模型,相比原始使用 SiLU 激活函数的版本,ReLU 版本在 RK3588 上有更好的性能表现。
RKNN SDK 集成: 项目基于 Rockchip 官方的 RKNPU2 SDK 进行开发,充分利用了 RK3588 的硬件加速能力。
性能调优: 项目提供了 performance.sh 脚本,可以对 CPU 和 NPU 进行频率锁定,以获得稳定且最佳的性能表现。
要使用 rknn-cpp-Multithreading 项目,需要按照以下步骤操作:
build-linux_RK3588.sh 脚本进行编译performance.sh 脚本进行性能优化./rknn_yolov5_demo <模型路径> <视频路径/摄像头序号>
项目作者进行了详细的性能测试,以下是在不同线程数下 YOLOv5s-ReLU 模型的推理速度(FPS):
| 线程数 | 1 | 2 | 3 | 4 | 5 | 6 | 9 | 12 |
|---|---|---|---|---|---|---|---|---|
| FPS | 41.6 | 71.6 | 98.6 | 98.0 | 104.6 | 114.7 | 129.6 | 140.9 |

从测试结果可以看出,随着线程数的增加,推理速度呈现显著上升趋势。在使用 12 个线程时,系统达到了惊人的 140.9 FPS,充分展现了 RK3588 强大的并行计算能力。
尽管 rknn-cpp-Multithreading 项目已经展现了卓越的性能,但作者表示该项目仍有进一步优化的空间:
rknn-cpp-Multithreading 项目为我们展示了如何在嵌入式设备上实现高性能的深度学习推理。通过多线程优化、模型改进和硬件加速,该项目成功将 YOLOv5s 的推理速度提升至接近实时处理的水平。这不仅为类似项目的开发提供了宝贵的参考,也为边缘 AI 应用的落地提供了新的可能性。
无论您是嵌入式开发者、AI 工程师还是对边缘计算感兴趣的爱好者,rknn-cpp-Multithreading 项目都值得深入研 究和借鉴。我们期待看到更多基于这一框架的创新应用,推动边缘 AI 技术的进一步发展。
通过本文的介绍,相信读者已经对 rknn-cpp-Multithreading 项目有了全面的了解。该项目不仅展示了优秀的技术实现,也为嵌入式 AI 应用的开发提供了有价值的参考。我们期待看到更多开发者能够从中获得启发,推动边缘 AI 技术的进步与创新。

一站式AI短剧创作平台
Pixmax专注打造下一代“ AI 视觉创作引擎”,整合行业顶尖 AI 大模型、工工业级精准控制及企业级协同管理功能,是全方位的 AI 内容创作平台。


字节跳动旗下 AI 智能助手
字节跳动旗下 AI 智能助手


GPT充值
支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。


AI 图片生成平台
GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。


你的AI Agent团队
Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。


全球首个AI音乐社区
音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。


阿里Qoder团队推出的桌面端AI智能体
QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。


一站式搞定所有学习需求
不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。


为AI短剧协作而生
专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。


能听懂你表达的视频模型
Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号