awesome-LLM-game-agent-papers

awesome-LLM-game-agent-papers

大型语言模型驱动的游戏智能体研究最新进展

这个项目是关于大型语言模型(LLM)在游戏智能体研究中应用的论文集。内容涵盖文字冒险、Minecraft、社会模拟等多种游戏类型,展示LLM在游戏规划、决策和交互方面的能力。项目定期更新,为研究人员提供LLM游戏智能体领域的综合资源,助力了解该领域的前沿进展。

LLM游戏智能体人工智能自然语言处理强化学习Github开源项目

基于大型语言模型的游戏智能体综述

<div align="center">

欢迎PR 访问量徽章 星标 分支 <a href='https://arxiv.org/pdf/2404.02039'><img src='https://yellow-cdn.veclightyear.com/0a4dffa0/51e3e433-0d11-448a-ae1e-10e471ed33a0.svg'></a>

</div>

🔥 基于大型语言模型的游戏智能体必读论文。

💫 每周持续更新。 (最近更新:2024/08/11)

目录

冒险游戏

文字冒险游戏

  • [2019/09] 交互式小说游戏:巨大的冒险 AAAI 2020 [论文] [代码]
  • [2020/10] ALFWorld:对齐文本和实体环境以进行交互式学习 ICLR 2021 [论文][代码]
  • [2022/03] 科学世界:你的智能体比五年级学生聪明吗? EMNLP 2022 [论文] [代码]
  • [2022/10] ReAct:协同语言模型中的推理和行动 ICLR 2023 [论文] [[代码](https://github.com/ysymyth/ReAct]
  • [2023/03] Reflexion:具有语言强化学习的语言智能体 NeurIPS 2023 [论文] [代码]
  • [2023/04] 大型语言模型能否很好地玩文字游戏?当前技术水平和未解问题 arXiv [论文]
  • [2023/05] SwiftSage:一个具有快慢思维能力的生成智能体,用于复杂交互任务 NeurIPS 2023 [论文] [代码]
  • [2023/10] FireAct:面向语言智能体的微调 arXiv [论文][代码]
  • [2023/11] ADaPT:语言模型的按需分解和规划 arXiv [论文][代码]
  • [2024/02] 软自洽性提升语言模型智能体性能 arXiv [论文][代码]
  • [2024/02] 通过行动学习赋能大型语言模型智能体 arXiv [论文][代码]
  • [2024/03] KnowAgent:基于知识增强的LLM智能体规划 arXiv [论文][代码]
  • [2024/03] 语言引导的文本环境强化学习智能体探索 arXiv [论文][代码]
  • [2024/03] 尝试和错误:基于探索的LLM智能体轨迹优化 ACL 2024 [论文][代码]
  • [2024/04] 从失败中学习:在微调大型语言模型作为智能体时整合负面示例 arXiv[论文][代码]
  • [2024/04] ReAct遇上ActRe:当语言智能体享受训练数据自主权 [论文]
  • [2024/05] 具有世界知识模型的智能体规划 arXiv [论文][代码]
  • [2024/05] THREAD:通过递归生成进行深层思考 arXiv [论文]
  • [2024/06] 密切关注每一步!通过迭代步骤级流程改进的LLM智能体学习 arXiv [论文][代码]

视频冒险游戏

  • [2023/09] Motif: 来自人工智能反馈的内在动机 ICLR 2024 [论文] [代码]
  • [2024/03] Cradle: 赋能基础智能体实现通用计算机控制 arXiv [论文][代码]
  • [2024/03] 使用大语言模型玩NetHack: 作为零样本智能体的潜力与局限性 arXiv [论文] [代码]

制作与探索类游戏

我的世界

  • [2023/02] 描述、解释、计划和选择:通过大语言模型的交互式规划实现开放世界多任务智能体 NeurIPS 2023 [论文][代码]
  • [2023/03] Plan4MC: 面向开放世界我的世界任务的技能强化学习与规划 FMDM@NeurIPS2023 [论文][代码]
  • [2023/05] 我的世界中的幽灵:通过大语言模型、基于文本的知识和记忆实现开放世界环境中的通用能力智能体 arXiv [论文]
  • [2023/05] VOYAGER: 基于大语言模型的开放式具身智能体 FMDM@NeurIPS2023 [论文][代码]
  • [2023/10] LLaMA Rider: 激励大语言模型探索开放世界 arXiv [论文][代码]
  • [2023/10] Steve-Eye: 为基于大语言模型的具身智能体在开放世界中装备视觉感知能力 ICLR 2024 [论文]
  • [2023/11] JARVIS-1: 基于记忆增强多模态语言模型的开放世界多任务智能体 arXiv [论文][代码]
  • [2023/11] 看见并思考:虚拟环境中的具身智能体 arXiv [论文][代码]
  • [2023/12] MP5: 通过主动感知实现我的世界中的多模态开放式具身系统 CVPR 2024 [论文][代码]
  • [2023/12] Auto MC-Reward: 使用大语言模型为我的世界自动设计密集奖励 arXiv [论文]
  • [2023/12] 创造性智能体:通过想象力赋能智能体完成创造性任务 arXiv [论文][代码]
  • [2024/02] RL-GPT: 整合强化学习和代码即策略方法 arXiv [论文]
  • [2024/03] MineDreamer: 通过想象链学习遵循指令以控制模拟世界 arXiv [论文][代码]
  • [2024/07] Odyssey: 赋予智能体开放世界技能 arXiv [论文][代码]

Crafter

  • [2023/02] 使用大型语言模型指导强化学习中的预训练 ICML 2023 [论文]
  • [2023/05] SPRING:研究论文并推理以玩游戏 NeurIPS 2023 [论文]
  • [2023/06] OMNI:通过人类有趣性概念模型实现开放性 arXiv [论文][代码]
  • [2023/09] AdaRefiner:通过自适应反馈优化语言模型的决策 arXiv [论文]
  • [2024/03] EnvGen:通过大型语言模型生成和调整环境以训练具身智能体 arXiv [论文]
  • [2024/04] AgentKit:使用图而非编码进行流程工程 arXiv [论文][代码]
  • [2024/04] 带有大型语言模型提示的世界模型用于目标实现 arXiv [论文]
  • [2024/07] 通过世界动态建模增强智能体学习 arXiv [论文]

模拟游戏

人类/社会模拟

  • [2023/04] 生成式智能体:人类行为的交互式模拟 UIST 2023 [论文][代码]
  • [2023/08] AgentSims:用于大型语言模型评估的开源沙盒 arXiv [论文]
  • [2023/10] 人形智能体:模拟类人生成式智能体的平台 arXiv [论文]
  • [2023/10] Lyfe Agents:用于低成本实时社交互动的生成式智能体 arXiv [论文]
  • [2023/10] SOTOPIA:语言智能体社交智能的交互式评估 arXiv [论文][代码]
  • [2024/03] SOTOPIA-$\pi$:具有社交智能的语言智能体的交互式学习 arXiv [论文][代码]

具身模拟

  • [2022/01] 语言模型作为零样本规划器:为具身智能体提取可行动知识 ICML 2022 [论文][代码]
  • [2022/12] LLM-Planner:使用大型语言模型进行具身智能体的少样本基础规划 ICCV 2023 [论文]
  • [2023/05] 语言模型遇见世界模型:具身经验增强语言模型 NeurIPS 2023 [论文][代码]
  • [2023/10] 章鱼:从环境反馈中学习的具身视觉语言程序员 arXiv [论文] [代码]
  • [2024/01] 实践出真知:通过强化学习将大型语言模型与具身环境对齐 arXiv[论文][代码]

其他模拟

  • [2024/01] CivRealm:文明游戏中决策智能体的学习与推理之旅 ICLR 2024 [论文][代码]

竞争游戏

  • [2022/10] 涌现的世界表征:探索在合成任务上训练的序列模型 ICLR 2023 [论文]
  • [2023/06] ChessGPT:连接策略学习和语言建模 NeurIPS 2023 [论文][代码]
  • [2023/08] ChatGPT和GPT-4是否擅长打扑克?——翻牌前分析 arXiv [论文]
  • [2023/09] Suspicion-Agent:利用具有心智理论意识的GPT-4玩不完全信息游戏 arXiv [论文]
  • [2023/12] 大型语言模型玩星际争霸II:基准测试和链式总结方法 arXiv [论文][代码]
  • [2024/01] PokerGPT:通过大型语言模型实现多人德州扑克的端到端轻量级求解器 arXiv [论文]
  • [2024/01] SwarmBrain:通过大型语言模型实现星际争霸II实时策略游戏的具身代理 arXiv [论文]
  • [2024/02] PokéLLMon:使用大型语言模型的达到人类水平的宝可梦对战代理 arXiv [论文][代码]
  • [2024/02] Agent-Pro:通过策略级反思和优化学习进化 arXiv [论文][代码]
  • [2024/03] 具身LLM代理学习在有组织的团队中合作 arXiv [论文]

合作游戏

  • [2023/07] 使用大型语言模型模块化构建合作的具身代理 ICLR 2024 [论文][代码]
  • [2023/09] MindAgent:涌现的游戏交互 arXiv [论文]
  • [2023/10] 评估大型语言模型中的多代理协调能力 arXiv [论文]
  • [2023/12] 基于LLM的分层语言代理,用于实时人机协调 arXiv [论文]
  • [2024/02] S-Agents:开放式环境中的自组织代理 arXiv [论文]
  • [2024/03] ProAgent:使用大型语言模型构建主动合作代理 AAAI 2024 [论文]
  • [2024/03] LLM增强的自主代理能否合作?通过Melting Pot评估其合作能力 arXiv [论文]
  • [2024/03] 开放式多代理导航的分层自组织系统 arXiv[论文]
  • [2024/05] 面向具身多代理协作的高效LLM基础 arXiv[论文][代码]

通信(会话)游戏

  • [2022/12] 在外交游戏中通过结合语言模型和战略推理实现人类级别的表现 Science [论文]
  • [2023/08] GameEval:在对话游戏中评估大型语言模型 arXiv [论文][代码]
  • [2023/09] 探索大型语言模型在通信游戏中的应用:以狼人游戏为例的实证研究 arXiv [论文]
  • [2023/10] 使用强化学习的语言智能体在狼人游戏中进行战略博弈 arXiv [论文]
  • [2023/10] 阿瓦隆的思维游戏:通过递归思考对抗欺骗 arXiv [论文]
  • [2023/10] AvalonBench:评估大型语言模型在阿瓦隆游戏中的表现 FMDM@NeurIPS2023 [论文][代码]
  • [2023/10] 基于大型语言模型的智能体社会调查:阿瓦隆游戏中的合作与对抗 arXiv [论文]
  • [2023/10] 利用猜词游戏评估大型语言模型的智能 arXiv [论文][代码]
  • [2023/11] 战争与和平(WarAgent):基于大型语言模型的多智能体世界大战模拟 arXiv [论文][代码]
  • [2023/12] 即时合作:探索语言智能体在阿瓦隆游戏中的临时团队合作 arXiv [论文]
  • [2023/12] 解密数字侦探:理解大型语言模型在多智能体推理游戏中的行为和能力 [论文]
  • [2024/02] 提升大型语言模型在狼人游戏中的推理能力 arXiv [论文]
  • [2024/02] 如果大型语言模型有不同的世界观会怎样:用基于大型语言模型的智能体模拟外星文明 arXiv [论文]
  • [2024/04] 自我对抗性语言游戏提升大型语言模型的推理能力 [论文][代码]
  • [2024/06] PLAYER:在谋杀推理游戏中增强基于大型语言模型的多智能体通信和交互 arXiv[论文]

动作游戏

  • [2023/02] 通过在线强化学习将大型语言模型接地到交互环境中 ICML 2023 [论文][代码]
  • [2024/03] Cradle:赋能基础智能体实现通用计算机控制 arXiv [论文][代码]
  • [2024/03] GPT-4能运行DOOM吗? arXiv [论文][代码]
  • [2024/03] 使用街头霸王III实时评估大型语言模型 GitHub [代码]
  • [2024/07] Baba是AI:打破规则以超越基准 ICML 2024 [论文]

引用

如果您觉得本仓库有用,请引用我们的论文:

@misc{hu2024survey,
      标题={基于大型语言模型的游戏智能体综述}, 
      作者={Sihao Hu 和 Tiansheng Huang 和 Fatih Ilhan 和 Selim Tekin 和 Gaowen Liu 和 Ramana Kompella 和 Ling Liu},
      年份={2024},
      电子预印本={2404.02039},
      预印本库={arXiv},
      主分类={cs.AI}
}

联系方式

如果您发现任何适合但未包含的论文,请联系Sihao Hu(sihaohu@gatech.edu)。

编辑推荐精选

潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

下拉加载更多