KwaiAgents: 基于大语言模型的通用信息检索代理系统

KwaiAgents: 开启智能信息检索新纪元

在人工智能和自然语言处理领域的快速发展背景下,大语言模型(LLMs)展现出了令人惊叹的能力。然而,如何更好地利用这些模型来解决实际问题,特别是在信息检索领域,仍然是一个充满挑战的课题。为此,快手科技的KwaiKEG团队推出了KwaiAgents项目,旨在构建一个基于大语言模型的通用信息检索代理系统。

KwaiAgents的核心组成

KwaiAgents主要包含四个核心部分:

KAgentSys-Lite: 这是论文中提到的KAgentSys的轻量级版本。虽然在功能上有所简化,但它仍保留了原系统的主要特性,能够在众多开源Agent系统中展现出不俗的性能。
KAgentLMs: 这是一系列具有代理能力的大语言模型,通过论文中提出的Meta-agent tuning方法获得了规划、反思和工具使用等能力。
KAgentInstruct: 包含超过20万条Agent相关的指令微调数据,部分经过人工编辑。
KAgentBench: 包含超过3000条人工编辑的自动评估数据,用于测试Agent的各项能力,评估维度包括规划、工具使用、反思、总结和分析等。

KwaiAgents系统概览

KAgentSys-Lite: 轻量级但功能强大

KAgentSys-Lite作为KAgentSys的简化版本,虽然在某些方面有所限制,但仍然保留了原系统的核心功能。它的主要特点包括:

工具集相对精简,但涵盖了常用的信息检索功能。
没有复杂的记忆机制,但能够有效处理上下文信息。
性能略有降低,但在实际应用中仍表现出色。
代码基础不同,借鉴了BabyAGI和Auto-GPT等开源项目的优秀设计。

尽管存在这些差异,KAgentSys-Lite在众多开源Agent系统中仍然表现出色,能够满足大多数用户的信息检索需求。

KAgentLMs: 赋予语言模型代理能力

KAgentLMs是KwaiAgents项目中的一大亮点。通过Meta-agent tuning方法,研究团队成功地为大语言模型注入了强大的代理能力。目前,KAgentLMs包括以下模型:

Qwen-7B-MAT
Qwen-14B-MAT
Qwen-7B-MAT-cpp (用于CPU推理)
Qwen1.5-14B-MAT
Baichuan2-13B-MAT

这些模型在规划、反思和工具使用等方面展现出了优秀的性能,为构建智能信息检索系统奠定了坚实的基础。

KAgentInstruct: 丰富的指令数据集

高质量的训练数据是提升模型性能的关键。KAgentInstruct数据集包含了超过20万条与Agent相关的指令数据,涵盖了各种信息检索场景。这些数据经过精心设计和部分人工编辑,能够有效提升模型在实际应用中的表现。

KAgentBench: 全面的评估基准

为了客观评估Agent系统的性能,KwaiAgents项目还提供了KAgentBench评估基准。该基准包含超过3000条人工编辑的评估数据,从规划、工具使用、反思、总结和分析等多个维度对Agent系统进行全面评估。这不仅有助于衡量KwaiAgents的性能,也为整个Agent研究领域提供了一个valuable的评估标准。