近年来,大语言模型(Large Language Models, LLMs)在各类任务中展现出惊人的能力。由于LLMs强大的规划和推理能力,研究人员开始将其作为自主智能体来执行各种复杂任务。在单一LLM智能体取得成功的基础上,基于LLM的多智能体系统(LLM-based Multi-Agent Systems, LLM-MA)在复杂问题求解和世界模拟方面取得了显著进展。
本文旨在为读者提供LLM-MA系统的全面概述,深入讨论这一新兴领域的关键方面及面临的挑战。我们希望读者能够通过本综述获得以下问题的深刻见解:LLM-MA系统模拟了哪些领域和环境?这些智能体是如何被定义的,它们如何进行交互?哪些机制促进了智能体能力的提升?对于有兴趣深入研究该领域的读者,我们还总结了常用的数据集和基准测试。
为了使研究人员能够及时了解最新进展,我们维护了一个开源的GitHub仓库,专门用于概述LLM-MA系统的研究成果。本综述的主要贡献包括:
LLM-MA系统由多个基于大语言模型的智能体组成,这些智能体能够自主地进行规划、讨论和决策,模拟人类团队协作解决问题的过程。与单一LLM智能体相比,LLM-MA系统具有以下优势:
LLM-MA系统充分利用了LLMs强大的文本生成和理解能力,以及跨领域的知识储备和专门化潜力。近期研究表明,LLM-MA系统在软件开发、多机器人系统、社会模拟、政策模拟和游戏模拟等多个领域取得了令人瞩目的成果。
智能体-环境接口定义了智能体如何感知和作用于其运行环境。根据当前研究,我们将接口分为三类:
沙盒环境:一个模拟或虚拟环境,智能体可以在其中自由交互和尝试各种策略。常用于软件开发和游戏模拟等场景。
物理环境:真实世界环境,智能体需要遵守物理规律并与实体对象交互。如多机器人协作任务中的物理空间。
无环境:某些应用中不存在特定的外部环境,智能体之间仅进行交流。如多智能体辩论等场景。
在LLM-MA系统中,智能体通过其特征、行为和技能来定义,以满足特定目标。不同系统中的智能体承担不同角色,每个角色都有全面的描述,包括特征、能力、行为和约束。智能体定义方法主要有三种:
智能体之间的通信是LLM-MA系统集体智能的关键基础设施。我们从三个方面分析智能体通信:
智能体能力获取是LLM-MA系统中智能体学习和进化的关键过程。主要包括两个方面:
反馈:智能体接收的关键信息,帮助其学习行为影响并适应复杂动态问题。反馈来源包括环境、智能体交互、人类反馈等。
智能体调整:智能体通过记忆、自我进化和动态生成等方式增强能力,以更好地解决复杂问题。
LLM-MA系统已在多个领域得到应用,主要可分为问题求解和世界模拟两大类:
尽管LLM-MA系统取得了显著进展,但仍面临诸多挑战,主要包括:
未来研究可以从以下方向展开:
基于大语言模型的多智能体系统是一个快速发展的研究领域,展现出巨大的应用潜力。本综述系统地梳理了LLM-MA系统的关键技术、应用场景和未来挑战,为研究人员提供了全面的参考。我们期待这一领域能够持续创新,推动人工智能向着更高层次的集体智能迈进。
欢迎关注我们的最新研究进展,并为该领域的发展贡献您的智慧!
最强AI数据分析助手
小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。
像人一 样思考的AI智能体
imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。
AI数字人视频创作平台
Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。
一站式AI创作平台
提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作
AI办公助手, 复杂任务高效处理
AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!
AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。
AI小说写作助手,一站式润色、改写、扩写
蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。
全能AI智能助手,随时解答生活与工作的多样问题
问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工 作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。
实时语音翻译/同声传译工具
Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱 好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。
一键生成PPT和Word,让学习生活更轻松
讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。