多智能体（Multi-Agent）架构选型：四种模式详解 | 极客日志

PythonAI算法

多智能体（Multi-Agent）架构选型：四种模式详解

综述由AI生成介绍多智能体架构的四种选型模式：Subagents（集中编排）、Skills（按需加载）、Handoffs（状态交接）和 Router（路由分发）。阐述了从单 Agent 升级的触发条件（上下文隔离、并行化、长流程可控等），并通过对比表与决策树指导如何根据业务场景选择合适模式。重点在于通过状态与契约管理复杂度，而非单纯依赖模型能力。

观心发布于 2026/3/28更新于 2026/5/2926 浏览

多智能体（Multi-Agent）架构选型：四种模式详解

摘要（先看结论）

多智能体不是'更高级'，而是用更高的系统复杂度换取：上下文隔离、并行化、分工协作、长流程可控。

仍然能用'单 Agent + 好工具'解决：不要上多智能体
需要强控制权 + 上下文隔离：选 Subagents（主 - 子集中编排）
需要单 Agent 多专业化且保持交互简单：选 Skills（按需加载）
需要多阶段顺序流程（每阶段职责清晰）：选 Handoffs（状态驱动交接）
需要多领域并行查询 + 合成答案：选 Router（路由分发 + 汇总）

一句话口诀：并行找 Router，顺序走 Handoffs，强控用 Subagents，轻量用 Skills。

先把三个词说清楚：Context / State / Tools

Context：模型每次调用能'看到'的输入（system prompt + history + reference），天然会变长、会漂移、会浪费 Token
State：系统保存的结构化进度（通常是 JSON/DB），描述'任务进行到哪了、已确认什么、下一步做什么'
Tools：确定性动作（查库/下单/发邮件/运行脚本），应该具备幂等、超时、错误码与可观测

多智能体的工程价值，本质是把：

'靠模型自己从上下文里悟出来该做什么'
变成
'靠状态与契约决定下一步、靠工具做确定性动作'

什么时候需要从单 Agent 升级

Prompt 越写越长：塞了太多领域知识，Token 浪费 + 注意力被稀释
任务跨度变大：一次请求要跨多个系统/团队/领域协作
对吞吐/延迟有要求：希望并行查多个源或并行跑多个子任务
长流程要可控：必须支持分阶段、可回滚、可恢复、可审计

把它更'工程化'地说：不是因为 Prompt 变长就一定要多智能体，而是出现了这些不可绕过的系统约束：

single agent common pain points (symptoms) -> system constraints (causes)
Prompt gets longer/harder to control -> Need context isolation
Request spans multiple systems/teams -> Need distributed ownership
Need to query multiple sources/run subtasks in parallel -> Need parallel fan-out
Process needs phases with rollback/audit -> Need state machine

升维前先问 4 个 Yes/No（只要命中 1 个'硬约束'，再考虑多智能体）：

你是否必须把某些领域知识与对话历史隔离开，否则质量会明显下降？
你是否必须把能力拆给不同团队独立维护、独立发布？
你是否必须把 2+ 个子任务并行执行，才能满足延迟/吞吐？
你是否必须把流程做成可恢复的状态机（阶段、回滚、审计）？

四种模式（每种都用同一套模板理解）

方案一：Subagents（集中式编排）

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

User Request --> Main Agent (Supervisor, owns Context)
                 |
              +--+--+
              |     |
              v     v
        Subagent A  Subagent B  Subagent C
        (Calendar)  (Mail)      (CRM)
              |     |           |
              +-----+-----------+
                        v
                  Final Response

User
  |
  v
Agent
  +-- load(skill: code-review) --> follow fixed output
  +-- load(skill: db-debug)      --> read reference/* if needed
  +-- load(skill: release)       --> run scripts/* if needed
(conversation history grows if not trimmed)

+---------------+ handoff +---------------+ handoff +---------------+
| Agent A       |-------->| Agent B       |-------->| Agent C       |
| (Collect Info)|         | (Execute)     |         | (Verify/Close)| 
+-------+-------+         +-------+-------+         +-------+-------+
        | update state          | update state          | update state
        v                       v                       v
    state.phase=collect     state.phase=execute     state.phase=verify

{
  "ticketId": "T-123",
  "phase": "execute",
  "facts": {"user": "u_001", "device": "iOS", "errorCode": "AUTH_403"},
  "artifacts": {"diagnosis": "token expired", "toolResults": ["reset_token:ok"]},
  "nextActions": ["ask_user_relogin", "verify_login_success"],
  "retry": {"count": 1, "max": 3}
}

      +--------------+
User --| Router       |
      +------+-------+
             | fan-out (parallel)
      +------+------+------+
      |      |      |      |
      v      v      v      v
Agent DomainA AgentB AgentC
      +------+------+------+
             v
      +--------------+
      | Aggregator   |
      +--------------+
             v
      Final Answer

模式	分布式开发	并行	多跳顺序	直接用户交互	主要成本	主要风险
Subagents	强	强	中	弱（一般不直连）	往返调用次数↑	延迟、编排复杂度
Skills	中	弱	中	强	history 变长 Token↑	技能污染上下文、漂移
Handoffs	中	弱	强	中/强	状态管理成本↑	交接丢信息、状态不一致
Router	强	强	弱	弱/中	路由 + 合成开销	路由误判、合成偏差

先问一句：单 Agent + 工具 + 约束化输出 是否已足够？
└─ 是 → 先不升维
└─ 否 → 你的核心矛盾是什么？
   ├─ 要强控制 + 上下文隔离 + 多领域协作 → Subagents
   ├─ 要保持直连交互 + 按需专业化 → Skills
   ├─ 要分阶段顺序推进 + 进度可恢复可审计 → Handoffs
   └─ 要并行查多源 + 汇总合成 → Router

场景	更优模式	为什么	你要提前付的成本
一次性请求（单工具）	Skills / 单 Agent	需求简单，别为架构加延迟	控制 history 增长
多阶段客服/审批	Handoffs	阶段边界清晰，进度可追踪	state schema + 恢复策略
企业知识检索与比对	Router	天然并行，多源合成	路由准确率 + 合成策略

多智能体（Multi-Agent）架构选型：四种模式详解

多智能体（Multi-Agent）架构选型：四种模式详解

摘要（先看结论）

先把三个词说清楚：Context / State / Tools

什么时候需要从单 Agent 升级

四种模式（每种都用同一套模板理解）

方案一：Subagents（集中式编排）

更多推荐文章

相关免费在线工具

方案二：Skills（渐进式揭示 / 按需加载）

方案三：Handoffs（状态驱动交接）

方案四：Router（路由分发 + 汇总合成）

一张表对比（选型时只看这张也够）

怎么选（决策树）

三个典型场景（模式怎么落到业务）

客户端落地要点（端侧视角）

最小实践清单（你要交付什么）

更多推荐文章

相关免费在线工具

多智能体（Multi-Agent）架构选型：四种模式详解

多智能体（Multi-Agent）架构选型：四种模式详解

摘要（先看结论）

先把三个词说清楚：Context / State / Tools

什么时候需要从单 Agent 升级

四种模式（每种都用同一套模板理解）

方案一：Subagents（集中式编排）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

方案二：Skills（渐进式揭示 / 按需加载）

方案三：Handoffs（状态驱动交接）

方案四：Router（路由分发 + 汇总合成）

一张表对比（选型时只看这张也够）

怎么选（决策树）

三个典型场景（模式怎么落到业务）

客户端落地要点（端侧视角）

最小实践清单（你要交付什么）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具