ManiSkill

ManiSkill

开源机器人仿真与训练统一框架

ManiSkill是基于SAPIEN的开源机器人仿真与训练框架。它提供GPU并行化视觉数据采集系统,支持多种机器人和任务类型。该框架具有高效的GPU并行任务处理能力,可快速生成合成数据并在不同场景中进行仿真。ManiSkill提供灵活的任务构建API,简化GPU内存管理。它支持2D/3D视觉强化学习、模仿学习等工作流程,未来将扩展更多资产和场景支持。

ManiSkill 3机器人仿真GPU并行开源框架SAPIENGithub开源项目

ManiSkill 3(测试版)

预览图

<p style="text-align: center; font-size: 0.8rem; color: #999;margin-top: -1rem;">使用光线追踪渲染的环境/机器人样本。场景数据集来自AI2THOR和ReplicaCAD</p>

下载量 在Colab中打开 PyPI版本 文档状态 Discord

ManiSkill是一个由SAPIEN驱动的强大的统一机器人仿真和训练框架。整个框架尽可能开源,ManiSkill v3目前处于测试版发布阶段。其特点包括:

  • GPU并行化的视觉数据收集系统。在高端硬件上,使用4090 GPU可以以20k FPS的速度收集RGBD + 分割数据,比大多数其他模拟器快10-100倍。
  • 示例任务涵盖了广泛的不同机器人形态(四足机器人、移动操作机器人、单臂机器人)以及各种不同的任务(桌面操作、运动、灵巧操作)。
  • GPU并行化任务,能够在仿真中进行极快的合成数据收集。
  • GPU并行化任务支持模拟多样化场景,每个并行环境都有完全不同的场景/物体集。
  • 灵活的任务构建API,抽象了许多复杂的GPU内存管理代码。

ManiSkill计划支持各种工作流程,包括但不限于基于2D/3D视觉的强化学习、模仿学习、感知-规划-行动等。ManiSkill还将支持更多资产/场景(例如AI2THOR),以及其他功能,如用于评估真实世界策略的数字孪生。有关在正式v3发布之前计划添加的功能,请参阅我们的路线图

请参阅我们的文档,了解从构建任务到数据收集的教程等更多信息。

注意: 本项目目前处于测试版发布阶段,因此并非所有功能都已添加,可能存在一些错误。如果您发现任何错误或有任何功能请求,请在我们的GitHub issues上发布,或在GitHub discussions中讨论。我们还有一个Discord服务器,用于发布公告和讨论ManiSkill相关内容。

寻找原始ManiSkill2的用户可以在v0.5.3标签找到该代码库的提交。

安装

ManiSkill的安装非常简单,您只需运行几个pip安装命令即可

# 安装包 pip install --upgrade mani_skill # 安装与您的系统兼容的torch版本 pip install torch torchvision torchaudio

最后,您还需要按照这里的说明设置Vulkan

有关安装的更多详细信息(例如,从源代码安装或进行故障排除),请参阅文档

入门

要开始使用,请查看快速入门文档:https://maniskill.readthedocs.io/en/latest/user_guide/getting_started/quickstart.html

我们还有一个快速入门Colab笔记本,让您无需自己的硬件即可尝试GPU并行化仿真。所有内容都可以在Colab免费版上运行。

有关可以运行的完整示例脚本列表,请参阅文档

系统支持

我们目前最好地支持基于Linux的系统。Windows系统的支持有限,目前不支持MacOS。我们正在努力尝试在其他系统上支持更多功能,但这可能需要一些时间。大多数限制源于SAPIEN包能够支持的功能。

系统 / GPUCPU仿真GPU仿真渲染
Linux / NVIDIA GPU
Windows / NVIDIA GPU
Windows / AMD GPU
WSL / 任何GPU
MacOS / 任何GPU

引用和核心团队

ManiSkill 3的技术论文即将发布。

目前的作者列表如下:Stone Tao*、Fanbo Xiang*、Arth Shukla、Chen Bao、Nan Xiao、Rui Chen、Tongzhou Mu、Tse-Kai Chan、Xander Hinrichsen、Xiaodi Yuan、Xinsong Lin、Xuanlin Li、Yuan Gao、Yuzhe Qin、Zhiao Huang、Hao Su

许可

ManiSkill中的所有刚体环境均在完全许可的许可证(例如Apache-2.0)下授权。

资产在CC BY-NC 4.0许可下授权。

编辑推荐精选

GPT Plus|Pro充值

GPT Plus|Pro充值

GPT充值

支持 ChatGPT Plus / Pro 充值服务,支付便捷,自动发货,售后可查。

GPT Image 2中文站

GPT Image 2中文站

AI 图片生成平台

GPT Image 2 是面向用户的 AI 图片生成平台,支持文生图、图生图及多模型创意工作流。

Vecbase

Vecbase

你的AI Agent团队

Vecbase 是专为 AI 团队打造的智能工作空间,将数据管理、模型协作与知识沉淀整合于一处。算法、产品与业务在同一平台无缝协同,让从数据到 AI 应用的落地更快一步。

音述AI

音述AI

全球首个AI音乐社区

音述AI是全球首个AI音乐社区,致力让每个人都能用音乐表达自我。音述AI提供零门槛AI创作工具,独创GETI法则帮助用户精准定义音乐风格,AI润色功能支持自动优化作品质感。音述AI支持交流讨论、二次创作与价值变现。针对中文用户的语言习惯与文化背景进行专门优化,支持国风融合、C-pop等本土音乐标签,让技术更好地承载人文表达。

QoderWork

QoderWork

阿里Qoder团队推出的桌面端AI智能体

QoderWork 是阿里推出的本地优先桌面 AI 智能体,适配 macOS14+/Windows10+,以自然语言交互实现文件管理、数据分析、AI 视觉生成、浏览器自动化等办公任务,自主拆解执行复杂工作流,数据本地运行零上传,技能市场可无限扩展,是高效的 Agentic 生产力办公助手。

lynote.ai

lynote.ai

一站式搞定所有学习需求

不再被海量信息淹没,开始真正理解知识。Lynote 可摘要 YouTube 视频、PDF、文章等内容。即时创建笔记,检测 AI 内容并下载资料,将您的学习效率提升 10 倍。

AniShort

AniShort

为AI短剧协作而生

专为AI短剧协作而生的AniShort正式发布,深度重构AI短剧全流程生产模式,整合创意策划、制作执行、实时协作、在线审片、资产复用等全链路功能,独创无限画布、双轨并行工业化工作流与Ani智能体助手,集成多款主流AI大模型,破解素材零散、版本混乱、沟通低效等行业痛点,助力3人团队效率提升800%,打造标准化、可追溯的AI短剧量产体系,是AI短剧团队协同创作、提升制作效率的核心工具。

seedancetwo2.0

seedancetwo2.0

能听懂你表达的视频模型

Seedance two是基于seedance2.0的中国大模型,支持图像、视频、音频、文本四种模态输入,表达方式更丰富,生成也更可控。

nano-banana纳米香蕉中文站

nano-banana纳米香蕉中文站

国内直接访问,限时3折

输入简单文字,生成想要的图片,纳米香蕉中文站基于 Google 模型的 AI 图片生成网站,支持文字生图、图生图。官网价格限时3折活动

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

下拉加载更多