Agent-FLAN

Agent-FLAN 项目介绍

Agent-FLAN 是一个专注于优化大型语言模型（LLMs）作为智能体表现的项目。尽管开源的大型语言模型在许多自然语言处理任务中取得了显著成功，但在作为智能体使用时仍然逊色于基于 API 的模型。因此，如何将智能体能力有效整合入大型通用语言模型成为一个迫切需要解决的问题。

项目背景

研究者在项目初期提出了三点关键观察：

当前的智能体训练语料包含了复杂的格式和推理内容，与预训练数据的分布差异显著。
LLMs 对于智能体任务所需能力的学习速度各不相同。
当前一些方法为了提高智能体能力，会引入不真实的信息或“幻觉”。

基于这些发现，Agent-FLAN 项目设计出一个有效的语言模型微调方法，专注于提升模型的智能体能力。通过对训练语料的精细分解和重新设计，Agent-FLAN 使得 Llama2-7B 模型在多个智能体评估数据集上表现优于之前的最佳作品，提升幅度达到 3.5%。

Agent-FLAN 模型和数据集

Agent-FLAN 系列模型是通过在 AgentInstruct 和 Toolbench 数据集上微调，应用了本文提出的数据生成管道，在多个智能体任务和工具利用方面展现了强大的能力。

这些模型遵循 Llama-2-chat 的对话格式，支持在人类与系统和助手之间切换角色。7B 模型可以在 Huggingface 和 OpenXLab 模型库中获得。

可用模型和数据集

模型：Agent-FLAN-7B 可在 Huggingface 和 OpenXLab 获取。
数据集：Agent-FLAN 数据集可在 Huggingface 数据集中心获取。

详细结果

Agent-FLAN 显著超越了之前的智能体微调方法，在各类任务中展示了卓越的性能。特别是在对比 Held-In 和 Held-Out 任务时，Agent-FLAN 展现出稳定的优秀表现。

致谢

Agent-FLAN 的开发过程中使用了 Lagent 和 T-Eval，感谢他们的杰出工作。

引用

如果在您的研究中发现此项目有用，请考虑引用以下文献：

@article{chen2024agent,
  title={Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models},
  author={Chen, Zehui and Liu, Kuikun and Wang, Qiuchen and Zhang, Wenwei and Liu, Jiangning and Lin, Dahua and Chen, Kai and Zhao, Feng},
  journal={arXiv preprint arXiv:2403.12881},
  year={2024}
}