dynablox

dynablox

基于体积映射的复杂环境动态对象实时检测方法

Dynablox是一种基于在线体积映射的实时动态对象检测方法,针对复杂环境中的多样化移动物体。该开源项目提供完整的安装指南、数据集和运行示例,便于研究人员复现和扩展。Dynablox在准确性和实时性方面表现优异,已被NVIDIA的nvblox项目采用,可利用GPU加速实现高分辨率检测。其应用领域包括自动驾驶和机器人导航等。

Dynablox动态物体检测体积映射实时检测ROSGithub开源项目

Ubuntu 20.04 + ROS Noetic: 构建

Dynablox

一种基于在线体积映射的方法,用于在复杂环境中实时检测各种动态物体。

<p align="center"> <img width='100%' src="https://yellow-cdn.veclightyear.com/0a4dffa0/b4478f88-3337-467b-8dd3-5f850bccc15b.gif"> </p>

目录

学术资料

安装设置

示例

论文

如果您发现此软件包对您的研究有用,请考虑引用我们的论文:

  • Lukas Schmid, Olov Andersson, Aurelio Sulser, Patrick Pfreundschuh, 和 Roland Siegwart. "Dynablox: 复杂环境中多样动态物体的实时检测"发表于《IEEE机器人与自动化快报(RA-L)》,第8卷,第10期,6259-6266页,2023年10月。[ IEEE | ArXiv | 视频 ]
    @article{schmid2023dynablox, title={Dynablox: Real-time Detection of Diverse Dynamic Objects in Complex Environments}, author={Schmid, Lukas, and Andersson, Olov, and Sulser, Aurelio, and Pfreundschuh, Patrick, and Siegwart, Roland}, booktitle={IEEE Robotics and Automation Letters (RA-L)}, year={2023}, volume={8}, number={10}, pages={6259 - 6266}, doi={10.1109/LRA.2023.3305239}} }

视频

在YouTube上可以观看问题、方法和结果的简要概述: <img src=https://user-images.githubusercontent.com/36043993/233706937-1ccd0c03-d86b-4e4f-ad47-48c38e8a7f8d.png alt="Dynablox YouTube视频">

最新消息

我们很高兴得知Dynablox已被整合到NVIDIA的nvblox中,该算法的并行性可以充分利用GPU,实现快速、高分辨率的移动物体检测!

设置

这个软件包有一个可用的Docker镜像。请查看DockerHub页面上的使用说明。

安装

  • 版本说明: 本软件包是在Ubuntu 20.04和ROS Noetic环境下开发的。其他版本也应该可以使用,但不能保证完全支持。
  1. 如果尚未安装,请安装ROS。我们推荐使用Desktop-Full版本。

  2. 如果尚未设置,请设置catkin工作空间:

    mkdir -p ~/catkin_ws/src cd ~/catkin_ws catkin init catkin config --extend /opt/ros/$ROS_DISTRO catkin config --cmake-args -DCMAKE_BUILD_TYPE=RelWithDebInfo catkin config --merge-devel
  3. 安装系统依赖:

    sudo apt-get install python3-vcstool python3-catkin-tools ros-$ROS_DISTRO-cmake-modules protobuf-compiler autoconf git rsync -y
  4. 使用SSH密钥克隆仓库:

    cd ~/catkin_ws/src git clone git@github.com:ethz-asl/dynablox.git
  5. 安装ROS依赖:

    cd ~/catkin_ws/src vcs import . < ./dynablox/ssh.rosinstall --recursive
  6. 构建:

    catkin build dynablox_ros

数据集

为了运行演示,我们使用城市动态物体激光雷达(DOALS)数据集。 要下载数据并为我们的演示预处理,请使用提供的脚本:

roscd dynablox_ros/scripts ./download_doals_data.sh /home/$USER/data/DOALS # 或您选择的数据目标位置。

我们还收集了一个新的数据集,包含复杂场景中的各种动态物体。 完整的数据集和描述可以在这里找到。 要下载处理好的、可直接运行的演示数据,请使用提供的脚本:

roscd dynablox_ros/scripts ./download_dynablox_data.sh /home/$USER/data/Dynablox # 或您选择的数据目标位置。

示例

运行DOALS序列

  1. 如果尚未完成,请按照这里的说明下载DOALS数据集。

  2. 调整dynablox_ros/launch/run_experiment.launch中的数据集路径:

    <arg name="bag_file" default="/home/$(env USER)/data/DOALS/hauptgebaeude/sequence_1/bag.bag" />
  3. 运行

    roslaunch dynablox_ros run_experiment.launch
  4. 现在您应该能看到动态物体在传感器移动过程中被检测到:

运行DOALS示例

运行Dynablox序列

  1. 如果尚未完成,请按照这里的说明下载Dynablox数据集。

  2. 调整dynablox_ros/launch/run_experiment.launch中的数据集路径,并将use_doals设置为false:

    <arg name="use_doals" default="false" /> <arg name="bag_file" default="/home/$(env USER)/data/Dynablox/processed/ramp_1.bag" />
  3. 运行

    roslaunch dynablox_ros run_experiment.launch
  4. 现在您应该能看到动态物体在传感器移动过程中被检测到: 运行Dynablox示例

运行和评估实验

运行实验

  1. 如果尚未完成,请按照此处所述下载DOALS数据集。

  2. dynablox_ros/launch/run_experiment.launch 中调整数据集路径:

    <arg name="bag_file" default="/home/$(env USER)/data/DOALS/hauptgebaeude/sequence_1/bag.bag" />
  3. dynablox_ros/launch/run_experiment.launch 中,设置 evaluate 标志,调整地面真值数据路径,并指定存储生成的输出数据的位置:

    <arg name="evaluate" default="true" /> <arg name="eval_output_path" default="/home/$(env USER)/dynablox_output/" /> <arg name="ground_truth_file" default="/home/$(env USER)/data/DOALS/hauptgebaeude/sequence_1/indices.csv" />
  4. 运行

    roslaunch dynablox_ros run_experiment.launch
  5. 等待数据集处理完成。之后Dynablox应自动关闭。

分析数据

  • 打印检测性能指标:

    1. 运行:
    roscd dynablox_ros/src/evaluation python3 evaluate_data.py /home/$USER/dynablox_output
    1. 现在您应该可以看到该文件夹中所有实验的性能统计数据:
    1/1 数据条目已完成。
    数据                     物体_IoU               物体_精确度              物体_召回率
    hauptgebaeude_1          89.8 +- 5.6              99.3 +- 0.4                   90.3 +- 5.6
    全部                      89.8 +- 5.6              99.3 +- 0.4                   90.3 +- 5.6
    
  • 检查分割结果:

    1. 运行:
    roslaunch dynablox_ros cloud_visualizer.launch file_path:=/home/$USER/dynablox_output/clouds.csv
    1. 现在您应该可以看到标注的地面真值点云的分割结果,显示真阳性(绿色)、真阴性(黑色)、假阳性(蓝色)、假阴性(红色)和超出范围(灰色)的点: 评估
  • 检查运行时间和配置: 每个实验的附加信息会自动存储在 timings.txtconfig.txt 中。

高级选项

  • 为实验添加漂移: 要运行带有漂移的实验,请在 dynablox_ros/launch/run_experiment.launch 中指定预先计算的漂移方案之一:

    <arg name="drift_simulation_rollout" default="doals/hauptgebaeude/sequence_1/light_3.csv" />

    所有预先计算的方案都可以在 drift_simulation/config/rollouts 中找到。请注意,指定的序列需要与正在播放的数据匹配。对于每个序列,每种强度都有3个方案。

    或者,使用 drift_simulation/launch/generate_drift_rollout.launch 为其他数据集创建新的方案。

  • 更改Dynablox的配置: Dynablox中存在的所有参数都列在 dynablox_ros/config/motion_detector/default.yaml 中,请随意根据您的使用情况调整方法!

编辑推荐精选

潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

下拉加载更多