快手开源 KwaiAgents:7B 小模型实现超越 GPT-3.5 的 Agent 能力
近期,快手联合哈尔滨工业大学正式开源了「KwaiAgents」项目。这一开源举措标志着大语言模型(LLM)在智能体(Agent)领域取得了重要进展。通过该系统,即使是 7B 或 13B 参数量的'小'规模模型,也能展现出超越 GPT-3.5 的复杂任务处理能力。
背景与挑战
大语言模型通过对海量语言的建模掌握了广泛知识,具备了一定的认知和推理能力。然而,即便是当前最强的 GPT-4 等模型,在单独使用时仍面临'幻觉'问题,即一本正经地胡说八道,且无法与真实世界保持实时交互。AI Agents(智能体)被视为解决这一问题的关键路径之一。
AI Agents 旨在激发大模型的任务规划、反思及工具调用能力,使其能够借助现实世界的工具提升生成内容的准确性,甚至有能力解决复杂的跨域问题。本次开源的 KwaiAgents 系统、模型、数据及评测基准全部开放,为社区提供了宝贵的研究资源。

核心组件概览
从 KwaiAgents 的 GitHub 主页可以看到,本次开源内容主要包含三大板块:
- 系统(KAgentSys-Lite):轻量级 AI Agents 系统,配备事实性与时效性工具集。
- 模型(KAgentLMs):经过 Meta-Agent Tuning (MAT) 微调后,具有通用 Agent 能力的系列大模型及其训练数据。
- 评测(KAgentBench):开箱即用的 Agent 能力自动化评测 Benchmark 与人工评测结果。
1. KAgentSys 系统架构
KAgentSys 系统以大模型作为认知内核,辅以记忆机制和工具库,形成迭代式的自动化处理流程。其核心设计包括以下三个部分:
记忆机制
系统包含三类记忆:知识库、对话历史、任务历史。依托于混合向量检索与关键词检索技术构建的检索框架,系统能够在每一次任务规划的路径中精准检索所需信息,确保上下文的一致性和连贯性。
工具集
工具集分为两类以增强模型能力:
- 事实性增强工具集:采用异构的搜索和浏览机制,能够汇集网页、文本百科、视频百科等多个来源的知识,解决知识滞后问题。
- 时效性增强工具集:包含日历、节日、时间差、天气等常见工具,帮助模型理解当前时间相关的约束。
自动化 Loop
在一轮对话中,用户输入问题及可选知识库和人设。系统执行以下循环:
- 记忆更新与检索:根据当前输入更新记忆并检索相关信息。
- 任务规划:调用大模型进行任务拆解与规划。
- 工具调用:若规划需要,则调用相应工具获取外部信息。
- 总结回答:综合历史信息给出符合预期的回答。
本次开源展示了 KAgentSys 的部分核心能力,未来系统将逐步升级并开放更多功能。

2. 模型微调:Meta-Agent Tuning (MAT)
为了避免训练中单一模板引起的过拟合问题,团队提出了 Meta-Agent Tuning (MAT) 方法。该方法通过在训练数据中引入更多样化的 Agent Prompt 模板,显著提升大模型在 Agent 能力上的通用性和效果。




