快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

快手联合哈工大开源 KwaiAgents 项目，包含轻量级系统 KAgentSys-Lite、微调模型 KAgentLMs 及评测基准 KAgentBench。通过 Meta-Agent Tuning 方法，7B/13B 小模型在任务规划、工具调用及反思能力上超越 GPT-3.5。系统支持混合检索记忆机制及事实性、时效性工具集，解决了大模型幻觉及实时交互问题。评测显示经 MAT 调优的模型在准确性和泛化性上均有显著提升，为中小模型构建智能体提供了低成本、高效率的解决方案。

未来可期发布于 2025/2/6更新于 2026/7/2533 浏览

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

近期，快手联合哈尔滨工业大学正式开源了「KwaiAgents」项目。这一开源举措标志着大语言模型（LLM）在智能体（Agent）领域取得了重要进展。通过该系统，即使是 7B 或 13B 参数量的'小'规模模型，也能展现出超越 GPT-3.5 的复杂任务处理能力。

背景与挑战

大语言模型通过对海量语言的建模掌握了广泛知识，具备了一定的认知和推理能力。然而，即便是当前最强的 GPT-4 等模型，在单独使用时仍面临'幻觉'问题，即一本正经地胡说八道，且无法与真实世界保持实时交互。AI Agents（智能体）被视为解决这一问题的关键路径之一。

AI Agents 旨在激发大模型的任务规划、反思及工具调用能力，使其能够借助现实世界的工具提升生成内容的准确性，甚至有能力解决复杂的跨域问题。本次开源的 KwaiAgents 系统、模型、数据及评测基准全部开放，为社区提供了宝贵的研究资源。

KwaiAgents System Overview

核心组件概览

从 KwaiAgents 的 GitHub 主页可以看到，本次开源内容主要包含三大板块：

系统（KAgentSys-Lite）：轻量级 AI Agents 系统，配备事实性与时效性工具集。
模型（KAgentLMs）：经过 Meta-Agent Tuning (MAT) 微调后，具有通用 Agent 能力的系列大模型及其训练数据。
评测（KAgentBench）：开箱即用的 Agent 能力自动化评测 Benchmark 与人工评测结果。

1. KAgentSys 系统架构

KAgentSys 系统以大模型作为认知内核，辅以记忆机制和工具库，形成迭代式的自动化处理流程。其核心设计包括以下三个部分：

记忆机制

系统包含三类记忆：知识库、对话历史、任务历史。依托于混合向量检索与关键词检索技术构建的检索框架，系统能够在每一次任务规划的路径中精准检索所需信息，确保上下文的一致性和连贯性。

工具集

工具集分为两类以增强模型能力：

事实性增强工具集：采用异构的搜索和浏览机制，能够汇集网页、文本百科、视频百科等多个来源的知识，解决知识滞后问题。
时效性增强工具集：包含日历、节日、时间差、天气等常见工具，帮助模型理解当前时间相关的约束。

自动化 Loop

在一轮对话中，用户输入问题及可选知识库和人设。系统执行以下循环：

记忆更新与检索：根据当前输入更新记忆并检索相关信息。
任务规划：调用大模型进行任务拆解与规划。
工具调用：若规划需要，则调用相应工具获取外部信息。
总结回答：综合历史信息给出符合预期的回答。

本次开源展示了 KAgentSys 的部分核心能力，未来系统将逐步升级并开放更多功能。

KAgentSys Workflow

2. 模型微调：Meta-Agent Tuning (MAT)

为了避免训练中单一模板引起的过拟合问题，团队提出了 Meta-Agent Tuning (MAT) 方法。该方法通过在训练数据中引入更多样化的 Agent Prompt 模板，显著提升大模型在 Agent 能力上的通用性和效果。

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

背景与挑战

KwaiAgents System Overview

核心组件概览

从 KwaiAgents 的 GitHub 主页可以看到，本次开源内容主要包含三大板块：

系统（KAgentSys-Lite）：轻量级 AI Agents 系统，配备事实性与时效性工具集。
模型（KAgentLMs）：经过 Meta-Agent Tuning (MAT) 微调后，具有通用 Agent 能力的系列大模型及其训练数据。
评测（KAgentBench）：开箱即用的 Agent 能力自动化评测 Benchmark 与人工评测结果。

1. KAgentSys 系统架构

KAgentSys 系统以大模型作为认知内核，辅以记忆机制和工具库，形成迭代式的自动化处理流程。其核心设计包括以下三个部分：

记忆机制

工具集

工具集分为两类以增强模型能力：

事实性增强工具集：采用异构的搜索和浏览机制，能够汇集网页、文本百科、视频百科等多个来源的知识，解决知识滞后问题。
时效性增强工具集：包含日历、节日、时间差、天气等常见工具，帮助模型理解当前时间相关的约束。

自动化 Loop

在一轮对话中，用户输入问题及可选知识库和人设。系统执行以下循环：

记忆更新与检索：根据当前输入更新记忆并检索相关信息。
任务规划：调用大模型进行任务拆解与规划。
工具调用：若规划需要，则调用相应工具获取外部信息。
总结回答：综合历史信息给出符合预期的回答。

本次开源展示了 KAgentSys 的部分核心能力，未来系统将逐步升级并开放更多功能。

KAgentSys Workflow

模型	准确率提升	泛化性表现
7B 模型	显著提升	优于基线
13B 模型	显著超越	接近 GPT-3.5

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

背景与挑战

核心组件概览

1. KAgentSys 系统架构

记忆机制

工具集

自动化 Loop

2. 模型微调：Meta-Agent Tuning (MAT)

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

背景与挑战

核心组件概览

1. KAgentSys 系统架构

记忆机制

工具集

自动化 Loop

2. 模型微调：Meta-Agent Tuning (MAT)

更多推荐文章

相关免费在线工具

模板生成阶段

指令微调阶段

3. 评测基准：KAgentBench

典型案例分析

技术意义与未来展望

结语

更多推荐文章

相关免费在线工具

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

背景与挑战

核心组件概览

1. KAgentSys 系统架构

记忆机制

工具集

自动化 Loop

2. 模型微调：Meta-Agent Tuning (MAT)

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

快手开源 KwaiAgents：7B 小模型实现超越 GPT-3.5 的 Agent 能力

背景与挑战

核心组件概览

1. KAgentSys 系统架构

记忆机制

工具集

自动化 Loop

2. 模型微调：Meta-Agent Tuning (MAT)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

模板生成阶段

指令微调阶段

3. 评测基准：KAgentBench

典型案例分析

技术意义与未来展望

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具