ChatSim

ChatSim

通过LLM-Agent协作实现自动驾驶的可编辑场景仿真

ChatSim项目通过LLM与Agent协作,实现可编辑的自主驾驶场景模拟。集成的3D高斯溅射技术使背景渲染速度提升,每30秒渲染50帧,前景渲染效率也因多进程并行处理大幅度提高。该项目适用于Ubuntu系统,依赖Blender、Pytorch和CUDA工具,并支持OpenAI和NVIDIA AI模型API。详细的安装步骤和数据处理指南帮助用户轻松上手,优化自主驾驶模拟效果。

ChatSimLLM-Agent Collaboration3D Gaussian SplattingMcNeRF自动驾驶Github开源项目

ChatSim 项目介绍

概述

ChatSim 项目旨在通过可编辑的场景模拟技术,推动自动驾驶技术的发展。该项目通过长语言模型(LLM)和智能代理的合作,提供灵活且高效的场景模拟解决方案。ChatSim 的核心在于其可编辑性和高效性,使得用户可以方便地创建和调试自动驾驶环境。

最新动态

ChatSim 项目不断更新,以提高性能和用户体验。其中一个亮点是整合了 3D Gaussian Splatting 技术,加速背景渲染,使得渲染50帧仅需30秒。此外,项目还引入了多进程 Blender 渲染技术,加快了前景渲染速度,50帧可在5分钟内完成。这些更新大大提升了模拟速度,使得自动驾驶测试更加高效。

系统要求

要运行 ChatSim 项目,开发环境需要满足以下条件:

  • Ubuntu 20.04 或以上版本(用于 Blender 3.+)。
  • Python 3.8 或以上。
  • Pytorch 1.13 或以上。
  • CUDA 11.6 或更高版本。
  • 虽然不必须,但 COLMAP 或 Metashape 软件可以用于姿态校正。
  • 发布了 OpenAI API Key 可进行试用,也可选用 NVIDIA AI 的免费 API。

安装步骤

  1. 克隆项目仓库

    首先,递归克隆 ChatSim 项目仓库:

    git clone https://github.com/yifanlu0227/ChatSim.git --recursive
  2. 设置环境

    创建并激活 Conda 环境:

    conda create -n chatsim python=3.9 git-lfs conda activate chatsim
  3. 安装背景渲染引擎

    ChatSim 提供两种背景渲染方法,即 McNeRF 和 3D Gaussian Splatting。这两种方法各有优势,用户可以根据需求选择安装。

  4. 安装图像修补工具

    为实现更真实的场景模拟,安装了视频和图像修补工具,实现对场景中的动态物体或缺失区域的修复。

  5. 安装 Blender 软件和实用程序

    为了渲染和模拟3D场景,ChatSim 使用 Blender 3.5.1 及相关实用工具。用户需确保系统中已安装 Blender,并通过项目提供的脚本安装相关依赖。

  6. 设置轨迹跟踪模块

    可选地,用户可以安装轨迹跟踪模块以获得平滑和更真实的运动轨迹。

  7. 安装 McLight(可选)

    如果用户希望训练天空模型,可以根据项目提供的说明进行安装和训练。

数据准备

ChatSim 使用 Waymo 数据集来支持场景的生成和模拟。用户需要从 Waymo 的官方网站下载数据并进行预处理。此外,项目提供了校准数据和3D资源,以便更好地模拟现实场景。

项目使用

ChatSim 提供了灵活的配置文件和命令行工具,用户可以根据需要自定义场景模拟内容。例如,用户可以通过输入提醒语句,快速在场景中添加移动汽车等对象,并渲染生成效果。

未来计划

  • 发布 arxiv 论文以补充项目背景。
  • 继续改进运动轨迹跟踪模块以提高模拟精度。
  • 增强多轮交互功能。

商业引用

如果您在学术研究中使用 ChatSim 项目,请使用以下引用格式:

@InProceedings{wei2024editable, title={Editable Scene Simulation for Autonomous Driving via Collaborative LLM-Agents}, author={Yuxi Wei and Zi Wang and Yifan Lu and Chenxin Xu and Changxing Liu and Hao Zhao and Siheng Chen and Yanfeng Wang}, booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR)}, month={June}, year={2024}, }

以上就是 ChatSim 项目的详细介绍。希望能够推动自动驾驶技术的进一步发展。

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多