这是论文的官方代码发布 <br> 通过模仿强化学习教练实现端到端城市驾驶 <br> 作者:张哲骏、Alexander Liniger、戴登新、俞飞跃和Luc van Gool,发表于ICCV 2021。<br>
它包含了基准测试、离线策略数据收集、在线策略数据收集、强化学习训练和使用DAGGER进行模仿学习训练的代码。 它还包含了强化学习专家和模仿学习智能体的训练模型。 补充视频可以在论文的主页上找到。
我们评估的"排行榜"是CARLA排行榜的离线版本。正如在论文中进一步详述的那样,离线排行榜有以下设置
如果想对方 法的泛化能力进行彻底研究,可以使用离线排行榜。
(+) 所有方法都在完全相同的条件下进行评估。
(+) 无需重新评估其他方法。
(-) 对方法的训练方式和训练数据的收集方式没有限制。
(+) 严格规定了训练和测试环境。
(+) 对基准测试有完全的控制和观察。
(-) 如果基准测试的任何设置发生变化,例如CARLA版本等,您将不得不重新评估其他方法。
请参考INSTALL.md进行安装。 我们使用AWS EC2,但您也可以在自己的计算机或集群上安装和运行所有实验。
Roach是一个端到端训练的智能体,比手工制作的CARLA专家驾驶得更好、更自然。 要从Roach收集数据集,请使用run/data_collect_bc.sh并修改以下参数:
save_to_wandb
:如果您不想将数据集上传到W&B,请设置为False
。dataset_root
:保存数据集的本地目录。test_suites
:默认为eu_data
,在Town01中收集NoCrash-dense基准测试的数据。可用配置可在此处找到。您也可以创建自己的配置。n_episodes
:要收集的episode数量,每个episode将保存到单独的h5文件中。agent/cilrs/obs_configs
:观察(即传感器)配置,默认为central_rgb_wide
。可用配置可在