
POGEMA(Partially-Observable Grid Environment for Multiple Agents)是一个为部分可观察多智能体路径规划(PO-MAPF)问题设计的网格环境。它具有以下特点:
与传统的MAPF不同,PO-MAPF是一个本质上去中心化的问题。在POGEMA中,每个智能体只能获得局部环境观察,需要在执行过程中进行决策。智能体的目标是到达各自的目标位置,同时避免与其他智能体和静态障碍物发生碰撞。
网格环境:基于网格的环境设计,支持多智能体同时运行。
部分可观察:智能体只能观察到局部环境信息。
动作空间:支持上下左右移动和等待五种基本动作。
随机地图生成:可以生成具有不同障碍密度的随机地图。
自定义地图:支持导入自定义设计的地图。
多框架集成:提供与PettingZoo、PyMARL、SampleFactory等主流强化学习框架的集成。
单智能体支持:除了多智能体场景,也完全支持单智能体的路径规划任务。
POGEMA的安装非常简单,只需通过pip进行安装:
pip install pogema
以下是一个基本使用示例:
from pogema import pogema_v0, GridConfig env = pogema_v0(grid_config=GridConfig()) obs, info = env.reset() while True: # 使用随机策略进行动作选择 obs, reward, terminated, truncated, info = env.step(env.sample_actions()) env.render() if all(terminated) or all(truncated): break
POGEMA提供了丰富的定制选项,允许研究者根据需求调整环境参数。
from pogema import pogema_v0, GridConfig # 定义随机配置 grid_config = GridConfig(num_agents=4, # 智能体数量 size=8, # 网格大小 density=0.4, # 障碍物密度 seed=1, # 随机种子 max_episode_steps=128, # 最大步数 obs_radius=3, # 观察半径 ) env = pogema_v0(grid_config=grid_config) env.reset() env.render()
from pogema import pogema_v0, GridConfig grid = """ .....#..... .....#..... ........... .....#..... .....#..... #.####..... .....###.## .....#..... .....#..... ........... .....#..... """ # 定义新配置,包含8个随机放置的智能体 grid_config = GridConfig(map=grid, num_agents=8) # 创建自定义POGEMA环境 env = pogema_v0(grid_config=grid_config)
POGEMA支持与多个主流强化学习框架的集成,使研究者可以灵活选择适合自己的工具:
env = pogema_v0(GridConfig(integration="PettingZoo"))
env = pogema_v0(GridConfig(integration="PyMARL"))
env = pogema_v0(GridConfig(integration="SampleFactory"))
env = pogema_v0(GridConfig(integration="gymnasium"))
POGEMA项目提供了一系列基准实现,可以作为研究的起点或比较基准。这些基准实现被放在一个单独的仓库中,研究者可以方便地访问和使用。
如果您在研究中使用了POGEMA,请引用以下论文:
@misc{skrynnik2024pogema,
title={POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation},
author={Alexey Skrynnik and Anton Andreychuk and Anatolii Borzilov and Alexander Chernyavskiy and Konstantin Yakovlev and Aleksandr Panov},
year={2024},
eprint={2407.14931},
archivePrefix={arXiv},
primaryClass={cs.LG},
url={https://arxiv.org/abs/2407.14931},
}
POGEMA为研究部分可观察多智能体路径规划问题提供了一个强大而灵活的工具。无论您是专注于算法开发、环境设计还是基准测试,POGEMA都能为您的研究提供有力支持。我们期待看到更多基于POGEMA的创新研究成果,推动PO-MAPF领域的发展。


职场AI,就用扣子
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!


多风格AI绘画神器
堆友平台由阿里巴巴设计团队 创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

