yolov5-deepsort-tensorrt

yolov5-deepsort-tensorrt

基于YOLOv5和DeepSORT的Jetson设备目标跟踪系统

这个项目是YOLOv5和DeepSORT算法在Jetson设备上的C++实现,针对Jetson Xavier NX和Jetson Nano进行了优化。系统能够高效跟踪多个人头目标,在Jetson Xavier NX上处理70多个目标时可达到10 FPS。项目包含环境配置、模型生成和运行指南,支持自定义模型,并提供了不同YOLOv5版本的兼容性说明。适合需要在边缘设备上进行高性能目标跟踪的应用场景。

Yolov5DeepSortTensorRTJetson目标跟踪Github开源项目

Jetson Xavier NX和Jetson Nano上的YOLOv5和DeepSort的C++实现

MIT许可证 GitHub星标

这个仓库使用YOLOv5和DeepSort来跟踪人头,可以在Jetson Xavier NX和Jetson Nano上运行。 在Jetson Xavier NX上,当图像中包含70多个头部时,它可以达到10 FPS的性能(你可以尝试Python版本,当使用Python版本时,你会发现在Jetson Xavier NX上非常慢,DeepSort可能需要近1秒的处理时间)。

<img src="https://yellow-cdn.veclightyear.com/0a4dffa0/5e892196-cf3a-4428-ad5d-ab59e81fe5bf.gif" >

感谢B.Q Long提供Windows版本的CMakeLists.txt。如果你想在Windows上运行这个仓库,你可以使用CMakeLists_deepsort-tensorrt_win10.txtCMakeLists_yolov5-deepsort-tensorrt_win10.txt

你可以在哔哩哔哩YouTubeYouTube上观看视频演示。

要求

  1. Jetson Nano或Jetson Xavier NX
  2. Jetpack 4.5.1
  3. Python3(默认版本,Jetson Nano或Jetson Xavier NX默认带有TensorRT 7.1.3.0的Python3)
  4. TensorRT 7.1.3.0
  5. PyTorch 1.8.0
  6. Torchvision 0.9.0
  7. Torch2trt 0.3.0
  8. ONNX 1.4.1
  9. OpenCV-Python 4.5.3.56
  10. Protobuf 3.17.3
  11. SciPy 1.5.4

如果你在这个项目中遇到问题,可以查看这篇文章

即将推出

  • Int8优化
  • IOU跟踪
  • 更快速且占用更少内存

速度

从读取图像到完成DeepSort的整个处理时间(包括每张图像的预处理和后处理) 注意!DeepSort跟踪的对象数量是70+,不是单个或10-20人,而是70+。所有结果都是在Jetson Xavier NX上获得的。

骨干网络TensorRT优化前(不含跟踪)TensorRT优化前(含跟踪)TensorRT优化后(仅检测)TensorRT优化后(检测+跟踪)FPS(检测+跟踪)
YOLOv5s_416100ms0.9s10-15ms100-150ms8 ~ 9
YOLOv5s-640120ms1s18-20ms100-150ms8 ~ 9

构建和运行

git clone https://github.com/RichardoMrMu/yolov5-deepsort-tensorrt.git cd yolov5-deepsort-tensorrt // 在运行cmake和make之前,请将./src/main.cpp中的char* yolo_engine = "";和char* sort_engine = "";修改为你自己的路径 mkdir build cmake .. make

如果你在cmake和make过程中遇到错误,请查看这篇文章或查看注意事项。

数据集

如果你需要训练自己的头部检测模型,可以使用SCUT-HEAD数据集,这个数据集包含头部边界框标注,可以免费下载。

模型

你需要两个模型,一个是YOLOv5模型用于检测,从tensorrtx生成。另一个是DeepSort模型用于跟踪。你应该以相同的方式生成这两个模型。

生成YOLOv5模型

对于YOLOv5检测模型,我选择了YOLOv5s,并选择了yolov5s.pt->yolov5s.wts->yolov5s.engine的转换路径。 注意,使用的模型可以从YOLOv5DeepSort获取,如果你需要使用自己的模型,可以按照"运行自定义模型"的说明进行操作。 你也可以查看tensorrtx官方README。 以下是deepsort.onnx和deepsort.engine文件,你可以在百度网盘和https://github.com/RichardoMrMu/yolov5-deepsort-tensorrt/releases/tag/yolosort找到。

模型链接
百度网盘百度网盘链接 密码:z68e
  1. 获取YOLOv5仓库

注意,这里使用官方预训练模型。我使用的是YOLOv5-5,v5.0版本。因此,如果你训练自己的模型,请确保你的YOLOv5代码是v5.0版本。

git clone -b v5.0 https://github.com/ultralytics/yolov5.git cd yolov5 mkdir weights cd weights // 下载 https://github.com/ultralytics/yolov5/releases/download/v5.0/yolov5s.pt wget https://github.com/ultralytics/yolov5/releases/download/v5.0/yolov5s.pt
  1. 获取tensorrtx

对于YOLOv5 v5.0,从YOLOv5 release v5.0下载.pt文件,执行git clone -b v5.0 https://github.com/ultralytics/yolov5.gitgit clone -b yolov5-v5.0 https://github.com/wang-xinyu/tensorrtx.git,然后按照tensorrtx/yolov5-v5.0中的说明运行。

  1. 获取xxx.wts模型
cp {tensorrtx}/yolov5/gen_wts.py {ultralytics}/yolov5/ cd yolov5 python3 gen_wts.py -w ./weights/yolov5s.pt -o ./weights/yolov5s.wts // 将生成一个'yolov5s.wts'文件

你可以在yolov5/weights/目录下找到yolov5s.wts模型。

  1. 构建tensorrtx/yolov5并获取TensorRT引擎
cd tensorrtx/yolov5 // 如果你的模型是在自定义数据集上训练的,请在 yololayer.h 中更新 CLASS_NUM mkdir build cd build cp {ultralytics}/yolov5/yolov5s.wts {tensorrtx}/yolov5/build cmake .. make // yolov5s sudo ./yolov5 -s yolov5s.wts yolov5s.engine s // 测试你的引擎文件 sudo ./yolov5 -d yolov5s.engine ../samples

然后你就得到了 yolov5s.engine,你可以将 yolov5s.engine 放入我的项目中。例如

cd {yolov5-deepsort-tensorrt} mkdir resources cp {tensorrtx}/yolov5/build/yolov5s.engine {yolov5-deepsort-tensorrt}/resources
  1. 获取 deepsort 引擎文件 你可以从这个drive 链接获取 deepsort 预训练模型 ckpt.t7 就可以了。
git clone https://github.com/RichardoMrMu/deepsort-tensorrt.git // 根据 github 的说明 cp {deepsort-tensorrt}/exportOnnx.py {deep_sort_pytorch}/ python3 exportOnnx.py mv {deep_sort_pytorch}/deepsort.onnx {deepsort-tensorrt}/resources cd {deepsort-tensorrt} mkdir build cd build cmake .. make ./onnx2engine ../resources/deepsort.onnx ../resources/deepsort.engine // 测试 ./demo ../resource/deepsort.engine ../resources/track.txt

完成所有5个步骤后,你就可以得到 yolov5s.engine 和 deepsort.engine。

在获取 yolov5s.engine 和 deepsort.engine 的过程中你可能会遇到一些问题,你可以在 github 上提问或查看这篇 csdn 文章

<details> <summary>不同版本的 yolov5</summary>

目前,tensorrt 支持 yolov5 v1.0(仅 yolov5s)、v2.0、v3.0、v3.1、v4.0 和 v5.0。

  • 对于 yolov5 v5.0,从 yolov5 release v5.0 下载 .pt 文件,git clone -b v5.0 https://github.com/ultralytics/yolov5.gitgit clone https://github.com/wang-xinyu/tensorrtx.git,然后按照当前页面的使用说明进行操作。
  • 对于 yolov5 v4.0,从 yolov5 release v4.0 下载 .pt 文件,git clone -b v4.0 https://github.com/ultralytics/yolov5.gitgit clone -b yolov5-v4.0 https://github.com/wang-xinyu/tensorrtx.git,然后按照 tensorrtx/yolov5-v4.0 中的使用说明进行操作。
  • 对于 yolov5 v3.1,从 yolov5 release v3.1 下载 .pt 文件,git clone -b v3.1 https://github.com/ultralytics/yolov5.gitgit clone -b yolov5-v3.1 https://github.com/wang-xinyu/tensorrtx.git,然后按照 tensorrtx/yolov5-v3.1 中的使用说明进行操作。
  • 对于 yolov5 v3.0,从 yolov5 release v3.0 下载 .pt 文件,git clone -b v3.0 https://github.com/ultralytics/yolov5.gitgit clone -b yolov5-v3.0 https://github.com/wang-xinyu/tensorrtx.git,然后按照 tensorrtx/yolov5-v3.0 中的使用说明进行操作。
  • 对于 yolov5 v2.0,从 yolov5 release v2.0 下载 .pt 文件,git clone -b v2.0 https://github.com/ultralytics/yolov5.gitgit clone -b yolov5-v2.0 https://github.com/wang-xinyu/tensorrtx.git,然后按照 tensorrtx/yolov5-v2.0 中的使用说明进行操作。
  • 对于 yolov5 v1.0,从 yolov5 release v1.0 下载 .pt 文件,git clone -b v1.0 https://github.com/ultralytics/yolov5.gitgit clone -b yolov5-v1.0 https://github.com/wang-xinyu/tensorrtx.git,然后按照 tensorrtx/yolov5-v1.0 中的使用说明进行操作。
</details> <details> <summary>配置</summary>
  • 从命令行参数中选择模型 s/m/l/x/s6/m6/l6/x6。
  • 输入形状在 yololayer.h 中定义。
  • 类别数量在 yololayer.h 中定义,如果使用自己的模型,不要忘记调整这个参数
  • INT8/FP16/FP32 可以通过 yolov5.cpp 中的宏来选择,INT8 需要更多步骤,请先按照"如何运行"进行操作,然后再参考下面的"INT8 量化"
  • GPU id 可以在 yolov5.cpp 中的宏中选择。
  • NMS 阈值在 yolov5.cpp 中。
  • 边界框置信度阈值在 yolov5.cpp 中。
  • Batch size 在 yolov5.cpp 中。
</details>

运行自定义模型

你可能需要训练自己的模型并将训练好的模型转换为 TensorRT。你可以按照以下步骤进行操作。

  1. 训练自定义模型 你可以按照官方 wiki在你的数据集上训练自己的模型。例如,我选择 yolov5-s 来训练我的模型。
  2. 转换自定义模型 就像 TensorRT 官方指南中说的那样。当你按照"生成 yolov5 模型"获得 yolov5 和 tensorrt 仓库后,下一步是将你的 PyTorch 模型转换为 TensorRT。 在此之前,你需要将 yololayer.h 文件的第 20、21 和 22 行(CLASS_NUM、INPUT_H、INPUT_W)更改为你自己的参数。
// 之前 static constexpr int CLASS_NUM = 80; // 20 static constexpr int INPUT_H = 640; // 21 yolov5 的输入高度和宽度必须能被 32 整除。 static constexpr int INPUT_W = 640; // 22 // 之后 // 如果你的模型是 2 分类且图像尺寸为 416*416 static constexpr int CLASS_NUM = 2; // 20 static constexpr int INPUT_H = 416; // 21 yolov5 的输入高度和宽度必须能被 32 整除。 static constexpr int INPUT_W = 416; // 22
cd {tensorrtx}/yolov5/ // 如果你的模型是在自定义数据集上训练的,请在 yololayer.h 中更新 CLASS_NUM mkdir build cd build cp {ultralytics}/yolov5/yolov5s.wts {tensorrtx}/yolov5/build cmake .. make sudo ./yolov5 -s [.wts] [.engine] [s/m/l/x/s6/m6/l6/x6 或 c/c6 gd gw] // 将模型序列化为计划文件 sudo ./yolov5 -d [.engine] [图像文件夹] // 反序列化并运行推理,[图像文件夹]中的图像将被处理。 // 以yolov5s为例 sudo ./yolov5 -s yolov5s.wts yolov5s.engine s sudo ./yolov5 -d yolov5s.engine ../samples // 以自定义模型为例,yolov5.yaml中depth_multiple=0.17,width_multiple=0.25 sudo ./yolov5 -s yolov5_custom.wts yolov5.engine c 0.17 0.25 sudo ./yolov5 -d yolov5.engine ../samples 通过这种方式,你可以获得自己的tensorrt yolov5模型。尽情享用吧! 其他项目 - yolov5-deepsort-tensorrt - 面部情绪识别 - yolov5火焰烟雾检测(Python版) - yolov5头盔检测 - yolov5火焰烟雾检测 - 网页版视线估计 - yolov5头盔检测(Python版) - yolov5反光衣检测(Python版) - yolov5反光衣检测 - yolov5吸烟检测 - yolov5口罩检测 - yolov5口罩检测(Python版) - yolov5烟雾检测(Python版) - deepsort-tensorrt

编辑推荐精选

潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

下拉加载更多