Odyssey框架为大型语言模型提供Minecraft开放世界探索技能
Odyssey框架通过40种基础技能和183种组合技能,增强了LLM代理在Minecraft世界中的探索和规划能力。它的关键组件包括一个交互式代理技能库、包含390k+条指令的Minecraft Wiki数据集训练的LLaMA-3模型,以及涵盖多种长期和短期规划任务的新基准。实验结果显示,该框架能够有效评估代理的规划和探索能力,并公开所有数据集、模型权重和代码,以促进未来对高级自主代理的研究。
Odyssey项目是一个创新框架,旨在为Minecraft中的代理们赋予更多的开放世界探索和任务执行能力。这个项目的基础是以大型语言模型(LLM)为依托,帮助代理在Minecraft这样丰富的开放世界中更好地完成复杂任务。项目借助了Voyager框架,并在此基础上进行了扩展。
现有的研究多致力于在开放世界环境中,如Minecraft,构建通用代理。尽管取得了一些进展,但目前的努力主要集中在解决基础的程序化任务上,比如收集材料和沿着技术树制作工具,以及将获取钻石作为最终目标。这一限制源于代理可用的行动集合的范围较窄,迫使其从零开始学习有效的长远策略。因此,在开放世界中发现多样化的游戏机会变得异常困难。
Odyssey框架通过以下三个核心组件赋予Minecraft代理开创性的开放世界技能:
互动代理及其开放世界技能库:该技能库包含40种基础技能和183种组合技能,旨在帮助代理在复杂的环境中进行自由探索和任务执行。
经过微调的大型语言模型(LLaMA-3):该模型在来自Minecraft Wiki的超过39万条指令构成的大型问答数据集上进行训练,以在复杂任务中为代理提供更强大的规划和执行能力。
新的代理能力基准测试:包括长远规划任务、动态即时规划任务和自主探索任务,旨在全面评估代理的能力。
经过广泛的实验验证,Odyssey框架可以有效评估基于大型语言模型的代理的不同能力。项目旨在激励未来关于自主代理解决方案的更多研究。所有的数据集、模型权重以及代码都是开源的,以供研究和进一步开发。
Odyssey项目还提供了多个功能演示视频,展示了以下能力:
Odyssey定义了多个任务以测试不同的代理能力,包括子目标任务、长远规划任务、动态即时规划任务和自主探索任务。
项目需要Python ≥ 3.9 和Node.js ≥ 16.13.0的环境,支持在Ubuntu 20.04,Windows 10和macOS上运行。有详细的安装说明和配置指南,确保用户能够顺利部署和使用Odyssey框架。
Odyssey项目得到了许多相关研究的启发和支持,这部分内容列出了关键论文和贡献者以供参考。
如果您对这项研究感兴趣,欢迎通过电子邮件与Zhejiang University的VIPA实验室团队联系。
最强AI数据分析助手
小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。
像人一样思考的AI智能体
imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。
AI数字人视频创作平台
Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。
一站式AI创作平台
提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作