awesome-LLM-game-agent-papers

awesome-LLM-game-agent-papers

大型语言模型驱动的游戏智能体研究最新进展

这个项目是关于大型语言模型(LLM)在游戏智能体研究中应用的论文集。内容涵盖文字冒险、Minecraft、社会模拟等多种游戏类型,展示LLM在游戏规划、决策和交互方面的能力。项目定期更新,为研究人员提供LLM游戏智能体领域的综合资源,助力了解该领域的前沿进展。

LLM游戏智能体人工智能自然语言处理强化学习Github开源项目

基于大型语言模型的游戏智能体综述

<div align="center">

欢迎PR 访问量徽章 星标 分支 <a href='https://arxiv.org/pdf/2404.02039'><img src='https://yellow-cdn.veclightyear.com/0a4dffa0/51e3e433-0d11-448a-ae1e-10e471ed33a0.svg'></a>

</div>

🔥 基于大型语言模型的游戏智能体必读论文。

💫 每周持续更新。 (最近更新:2024/08/11)

目录

冒险游戏

文字冒险游戏

  • [2019/09] 交互式小说游戏:巨大的冒险 AAAI 2020 [论文] [代码]
  • [2020/10] ALFWorld:对齐文本和实体环境以进行交互式学习 ICLR 2021 [论文][代码]
  • [2022/03] 科学世界:你的智能体比五年级学生聪明吗? EMNLP 2022 [论文] [代码]
  • [2022/10] ReAct:协同语言模型中的推理和行动 ICLR 2023 [论文] [[代码](https://github.com/ysymyth/ReAct]
  • [2023/03] Reflexion:具有语言强化学习的语言智能体 NeurIPS 2023 [论文] [代码]
  • [2023/04] 大型语言模型能否很好地玩文字游戏?当前技术水平和未解问题 arXiv [论文]
  • [2023/05] SwiftSage:一个具有快慢思维能力的生成智能体,用于复杂交互任务 NeurIPS 2023 [论文] [代码]
  • [2023/10] FireAct:面向语言智能体的微调 arXiv [论文][代码]
  • [2023/11] ADaPT:语言模型的按需分解和规划 arXiv [论文][代码]
  • [2024/02] 软自洽性提升语言模型智能体性能 arXiv [论文][代码]
  • [2024/02] 通过行动学习赋能大型语言模型智能体 arXiv [论文][代码]
  • [2024/03] KnowAgent:基于知识增强的LLM智能体规划 arXiv [论文][代码]
  • [2024/03] 语言引导的文本环境强化学习智能体探索 arXiv [论文][代码]
  • [2024/03] 尝试和错误:基于探索的LLM智能体轨迹优化 ACL 2024 [论文][代码]
  • [2024/04] 从失败中学习:在微调大型语言模型作为智能体时整合负面示例 arXiv[论文][代码]
  • [2024/04] ReAct遇上ActRe:当语言智能体享受训练数据自主权 [论文]
  • [2024/05] 具有世界知识模型的智能体规划 arXiv [论文][代码]
  • [2024/05] THREAD:通过递归生成进行深层思考 arXiv [论文]
  • [2024/06] 密切关注每一步!通过迭代步骤级流程改进的LLM智能体学习 arXiv [论文][代码]

视频冒险游戏

  • [2023/09] Motif: 来自人工智能反馈的内在动机 ICLR 2024 [论文] [代码]
  • [2024/03] Cradle: 赋能基础智能体实现通用计算机控制 arXiv [论文][代码]
  • [2024/03] 使用大语言模型玩NetHack: 作为零样本智能体的潜力与局限性 arXiv [论文] [代码]

制作与探索类游戏

我的世界

  • [2023/02] 描述、解释、计划和选择:通过大语言模型的交互式规划实现开放世界多任务智能体 NeurIPS 2023 [论文][代码]
  • [2023/03] Plan4MC: 面向开放世界我的世界任务的技能强化学习与规划 FMDM@NeurIPS2023 [论文][代码]
  • [2023/05] 我的世界中的幽灵:通过大语言模型、基于文本的知识和记忆实现开放世界环境中的通用能力智能体 arXiv [论文]
  • [2023/05] VOYAGER: 基于大语言模型的开放式具身智能体 FMDM@NeurIPS2023 [论文][代码]
  • [2023/10] LLaMA Rider: 激励大语言模型探索开放世界 arXiv [论文][代码]
  • [2023/10] Steve-Eye: 为基于大语言模型的具身智能体在开放世界中装备视觉感知能力 ICLR 2024 [论文]
  • [2023/11] JARVIS-1: 基于记忆增强多模态语言模型的开放世界多任务智能体 arXiv [论文][代码]
  • [2023/11] 看见并思考:虚拟环境中的具身智能体 arXiv [论文][代码]
  • [2023/12] MP5: 通过主动感知实现我的世界中的多模态开放式具身系统 CVPR 2024 [论文][代码]
  • [2023/12] Auto MC-Reward: 使用大语言模型为我的世界自动设计密集奖励 arXiv [论文]
  • [2023/12] 创造性智能体:通过想象力赋能智能体完成创造性任务 arXiv [论文][代码]
  • [2024/02] RL-GPT: 整合强化学习和代码即策略方法 arXiv [论文]
  • [2024/03] MineDreamer: 通过想象链学习遵循指令以控制模拟世界 arXiv [论文][代码]
  • [2024/07] Odyssey: 赋予智能体开放世界技能 arXiv [论文][代码]

Crafter

  • [2023/02] 使用大型语言模型指导强化学习中的预训练 ICML 2023 [论文]
  • [2023/05] SPRING:研究论文并推理以玩游戏 NeurIPS 2023 [论文]
  • [2023/06] OMNI:通过人类有趣性概念模型实现开放性 arXiv [论文][代码]
  • [2023/09] AdaRefiner:通过自适应反馈优化语言模型的决策 arXiv [论文]
  • [2024/03] EnvGen:通过大型语言模型生成和调整环境以训练具身智能体 arXiv [论文]
  • [2024/04] AgentKit:使用图而非编码进行流程工程 arXiv [论文][代码]
  • [2024/04] 带有大型语言模型提示的世界模型用于目标实现 arXiv [论文]
  • [2024/07] 通过世界动态建模增强智能体学习 arXiv [论文]

模拟游戏

人类/社会模拟

  • [2023/04] 生成式智能体:人类行为的交互式模拟 UIST 2023 [论文][代码]
  • [2023/08] AgentSims:用于大型语言模型评估的开源沙盒 arXiv [论文]
  • [2023/10] 人形智能体:模拟类人生成式智能体的平台 arXiv [论文]
  • [2023/10] Lyfe Agents:用于低成本实时社交互动的生成式智能体 arXiv [论文]
  • [2023/10] SOTOPIA:语言智能体社交智能的交互式评估 arXiv [论文][代码]
  • [2024/03] SOTOPIA-$\pi$:具有社交智能的语言智能体的交互式学习 arXiv [论文][代码]

具身模拟

  • [2022/01] 语言模型作为零样本规划器:为具身智能体提取可行动知识 ICML 2022 [论文][代码]
  • [2022/12] LLM-Planner:使用大型语言模型进行具身智能体的少样本基础规划 ICCV 2023 [论文]
  • [2023/05] 语言模型遇见世界模型:具身经验增强语言模型 NeurIPS 2023 [论文][代码]
  • [2023/10] 章鱼:从环境反馈中学习的具身视觉语言程序员 arXiv [论文] [代码]
  • [2024/01] 实践出真知:通过强化学习将大型语言模型与具身环境对齐 arXiv[论文][代码]

其他模拟

  • [2024/01] CivRealm:文明游戏中决策智能体的学习与推理之旅 ICLR 2024 [论文][代码]

竞争游戏

  • [2022/10] 涌现的世界表征:探索在合成任务上训练的序列模型 ICLR 2023 [论文]
  • [2023/06] ChessGPT:连接策略学习和语言建模 NeurIPS 2023 [论文][代码]
  • [2023/08] ChatGPT和GPT-4是否擅长打扑克?——翻牌前分析 arXiv [论文]
  • [2023/09] Suspicion-Agent:利用具有心智理论意识的GPT-4玩不完全信息游戏 arXiv [论文]
  • [2023/12] 大型语言模型玩星际争霸II:基准测试和链式总结方法 arXiv [论文][代码]
  • [2024/01] PokerGPT:通过大型语言模型实现多人德州扑克的端到端轻量级求解器 arXiv [论文]
  • [2024/01] SwarmBrain:通过大型语言模型实现星际争霸II实时策略游戏的具身代理 arXiv [论文]
  • [2024/02] PokéLLMon:使用大型语言模型的达到人类水平的宝可梦对战代理 arXiv [论文][代码]
  • [2024/02] Agent-Pro:通过策略级反思和优化学习进化 arXiv [论文][代码]
  • [2024/03] 具身LLM代理学习在有组织的团队中合作 arXiv [论文]

合作游戏

  • [2023/07] 使用大型语言模型模块化构建合作的具身代理 ICLR 2024 [论文][代码]
  • [2023/09] MindAgent:涌现的游戏交互 arXiv [论文]
  • [2023/10] 评估大型语言模型中的多代理协调能力 arXiv [论文]
  • [2023/12] 基于LLM的分层语言代理,用于实时人机协调 arXiv [论文]
  • [2024/02] S-Agents:开放式环境中的自组织代理 arXiv [论文]
  • [2024/03] ProAgent:使用大型语言模型构建主动合作代理 AAAI 2024 [论文]
  • [2024/03] LLM增强的自主代理能否合作?通过Melting Pot评估其合作能力 arXiv [论文]
  • [2024/03] 开放式多代理导航的分层自组织系统 arXiv[论文]
  • [2024/05] 面向具身多代理协作的高效LLM基础 arXiv[论文][代码]

通信(会话)游戏

  • [2022/12] 在外交游戏中通过结合语言模型和战略推理实现人类级别的表现 Science [论文]
  • [2023/08] GameEval:在对话游戏中评估大型语言模型 arXiv [论文][代码]
  • [2023/09] 探索大型语言模型在通信游戏中的应用:以狼人游戏为例的实证研究 arXiv [论文]
  • [2023/10] 使用强化学习的语言智能体在狼人游戏中进行战略博弈 arXiv [论文]
  • [2023/10] 阿瓦隆的思维游戏:通过递归思考对抗欺骗 arXiv [论文]
  • [2023/10] AvalonBench:评估大型语言模型在阿瓦隆游戏中的表现 FMDM@NeurIPS2023 [论文][代码]
  • [2023/10] 基于大型语言模型的智能体社会调查:阿瓦隆游戏中的合作与对抗 arXiv [论文]
  • [2023/10] 利用猜词游戏评估大型语言模型的智能 arXiv [论文][代码]
  • [2023/11] 战争与和平(WarAgent):基于大型语言模型的多智能体世界大战模拟 arXiv [论文][代码]
  • [2023/12] 即时合作:探索语言智能体在阿瓦隆游戏中的临时团队合作 arXiv [论文]
  • [2023/12] 解密数字侦探:理解大型语言模型在多智能体推理游戏中的行为和能力 [论文]
  • [2024/02] 提升大型语言模型在狼人游戏中的推理能力 arXiv [论文]
  • [2024/02] 如果大型语言模型有不同的世界观会怎样:用基于大型语言模型的智能体模拟外星文明 arXiv [论文]
  • [2024/04] 自我对抗性语言游戏提升大型语言模型的推理能力 [论文][代码]
  • [2024/06] PLAYER:在谋杀推理游戏中增强基于大型语言模型的多智能体通信和交互 arXiv[论文]

动作游戏

  • [2023/02] 通过在线强化学习将大型语言模型接地到交互环境中 ICML 2023 [论文][代码]
  • [2024/03] Cradle:赋能基础智能体实现通用计算机控制 arXiv [论文][代码]
  • [2024/03] GPT-4能运行DOOM吗? arXiv [论文][代码]
  • [2024/03] 使用街头霸王III实时评估大型语言模型 GitHub [代码]
  • [2024/07] Baba是AI:打破规则以超越基准 ICML 2024 [论文]

引用

如果您觉得本仓库有用,请引用我们的论文:

@misc{hu2024survey,
      标题={基于大型语言模型的游戏智能体综述}, 
      作者={Sihao Hu 和 Tiansheng Huang 和 Fatih Ilhan 和 Selim Tekin 和 Gaowen Liu 和 Ramana Kompella 和 Ling Liu},
      年份={2024},
      电子预印本={2404.02039},
      预印本库={arXiv},
      主分类={cs.AI}
}

联系方式

如果您发现任何适合但未包含的论文,请联系Sihao Hu(sihaohu@gatech.edu)。

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

热门AI工具AI办公办公工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

模型训练热门AI工具内容创作智能问答AI开发讯飞星火大模型多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多