Gymnasium-Robotics

Gymnasium-Robotics

基于Gymnasium和MuJoCo的强化学习机器人环境库

Gymnasium-Robotics是一个强化学习机器人环境库,基于Gymnasium API和MuJoCo物理引擎开发。它提供多种机器人环境,包括Fetch机械臂、Shadow灵巧手等,并支持多目标API。该项目还集成了D4RL环境,如迷宫导航和Adroit机械臂。Gymnasium-Robotics为研究人员提供丰富的机器人操作任务,有助于开发和测试强化学习算法。

强化学习机器人环境GymnasiumMuJoCoPythonGithub开源项目

pre-commit 代码风格:black

<p align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/955270bb-6afa-4800-8d72-d6745d5f36ef.png" width="500px"/> </p>

这个库包含了一系列使用GymansiumAPI的强化学习机器人环境。这些环境运行在MuJoCo物理引擎和维护的mujoco python绑定上。

文档网站位于robotics.farama.org,我们还有一个公开的discord服务器(我们也用它来协调开发工作),你可以在这里加入:https://discord.gg/YymmHrvS

安装

要安装Gymnasium-Robotics环境,请使用pip install gymnasium-robotics

这些环境还需要安装Deepmind的MuJoCo引擎。安装物理引擎的说明可以在MuJoCo网站MuJoCo Github仓库找到。

请注意,最新的环境版本使用MuJoCo团队维护的最新mujoco python绑定。如果你希望使用依赖于mujoco-py的旧版环境,请使用pip install gymnasium-robotics[mujoco-py]安装此库。

我们支持并测试Linux和macOS上的Python 3.8、3.9、3.10和3.11版本。我们会接受与Windows相关的PR,但不官方支持它。

环境

Gymnasium-Robotics包括以下环境组:

  • Fetch - 一系列具有7自由度机器人手臂的环境,需要执行诸如到达、推动、滑动或抓取和放置等操作任务。
  • Shadow Dexterous Hand - 一系列具有24自由度拟人机器人手的环境,需要执行对立方体、蛋形物体或笔的物体操作任务。这些环境的变体还在观察空间中包括来自92个触觉传感器的数据。

D4RL环境现已可用。这些环境已经重构,可能与原始环境的动作/观察空间不同,请阅读它们的文档。

  • 迷宫环境 - 代理需要在迷宫中导航以到达特定目标位置。可以使用两种不同的代理:一个2自由度力控制的球,或来自Gymnasium MuJoCo环境的经典Ant代理。环境可以以不同难度级别的各种迷宫形状初始化。

  • Adroit手臂 - 一系列使用Shadow灵巧手的环境,增加了手臂移动的自由度。不同任务包括钉钉子、开门、转笔或拾取和移动球。

  • Franka厨房 - 多任务环境,其中一个9自由度的Franka机器人被放置在一个包含几个常见家居物品的厨房中。每个任务的目标是与物品互动以达到所需的目标配置。

  • MaMuJoCo - Gymnasium/MuJoCo环境的多代理分解集合,以及用于分解机器人环境的框架,使用pettingzoo.ParallelEnv API。

进行中:使用Minari生成新的D4RL环境数据集。

多目标API

机器人环境通过继承GoalEnv类来扩展核心Gymnasium API。新API要求环境具有包含3个键的字典观察空间:

  • observation - 环境的实际观察
  • desired_goal - 代理需要达到的目标
  • achieved_goal - 代理当前实际达到的目标。环境的目标是使这个值接近desired_goal

该API还公开了奖励函数以及终止和截断信号,以便用不同的目标重新计算它们的值。这个功能对于使用回顾经验回放(HER)的算法很有用。

以下示例演示了如何使用公开的奖励、终止和截断函数来用替代目标重新计算值。info字典可用于存储重新计算奖励可能需要的额外信息,但这些信息与目标无关,例如从模拟中派生的状态。

import gymnasium as gym env = gym.make("FetchReach-v3") env.reset() obs, reward, terminated, truncated, info = env.step(env.action_space.sample()) # 以下总是成立: assert reward == env.compute_reward(obs["achieved_goal"], obs["desired_goal"], info) assert truncated == env.compute_truncated(obs["achieved_goal"], obs["desired_goal"], info) assert terminated == env.compute_terminated(obs["achieved_goal"], obs["desired_goal"], info) # 但目标也可以被替换: substitute_goal = obs["achieved_goal"].copy() substitute_reward = env.compute_reward(obs["achieved_goal"], substitute_goal, info) substitute_terminated = env.compute_terminated(obs["achieved_goal"], substitute_goal, info) substitute_truncated = env.compute_truncated(obs["achieved_goal"], substitute_goal, info)

GoalEnv类也可用于自定义环境。

项目维护者

主要贡献者:Rodrigo Perez-VicenteKallinteris AndreasJet Tai

本项目的维护还得到了更广泛的Farama团队的贡献:farama.org/team

引用

如果您在研究中使用了本项目,请引用:

@software{gymnasium_robotics2023github,
  author = {Rodrigo de Lazcano and Kallinteris Andreas and Jun Jet Tai and Seungjae Ryan Lee and Jordan Terry},
  title = {Gymnasium Robotics},
  url = {http://github.com/Farama-Foundation/Gymnasium-Robotics},
  version = {1.2.4},
  year = {2023},
}

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具使用教程AI营销产品酷表ChatExcelAI智能客服
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

数据安全AI助手热门AI工具AI辅助写作AI论文工具论文写作智能生成大纲
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

热门AI工具AI办公办公工具智能排版AI生成PPT博思AIPPT海量精品模板AI创作
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多