AI Agent 分身术：OpenClaw 子代理系统设计深度解析 | 极客日志

TypeScriptAI大前端

AI Agent 分身术：OpenClaw 子代理系统设计深度解析

OpenClaw 子代理系统通过 Session 隔离、Lane 并发控制和上下文精简三大机制，实现主 Agent 派生独立"影分身"执行后台任务。核心设计包括禁止嵌套 spawn 防止资源爆炸，Bootstrap 文件过滤减少上下文开销，以及基于 Prompt 驱动的并行工具调用。结果通过 Announce Flow 队列汇报给主 Agent，确保不干扰用户交互。该架构遵循最小权限原则，提升系统效率与安全性。

漫步发布于 2026/4/6更新于 2026/5/2434 浏览

AI Agent 的分身术：深度解析 OpenClaw 子代理系统设计

当主 Agent 分身乏术时，如何优雅地派出"影分身"？OpenClaw 的 Subagent 系统给出了一个工程上极其优雅的答案。

🎯 一句话总结

OpenClaw 的子代理系统通过 Session 隔离、Lane 并发控制、上下文精简三大机制，让主 Agent 能够派生独立的"影分身"执行后台任务，实现真正的并行处理——而且不会互相干扰。

📖 为什么需要子代理？

想象一下这个场景：

你让 AI 助手帮你做一个复杂的代码重构任务。AI 需要先搜索代码库找到所有相关文件，分析依赖关系，理解业务逻辑，然后才能动手改代码。

传统做法是串行的：搜索 → 分析 → 理解 → 动手。每一步都要等上一步完成，效率很低。

更糟糕的是，如果搜索过程中需要探索三个不同的方向（比如找认证模块、找测试文件、找组件结构），AI 只能一个个来，不能同时进行。

OpenClaw 的解决方案是引入子代理系统：主 Agent 可以派出多个"影分身"，每个影分身独立执行一个任务，完成后自动汇报结果。

这就像老板派出三个员工同时去调研三个方向，而不是自己一个人跑三趟。

🏗️ Subagent 系统架构总览

先来看一张全景图，理解整个系统的运作方式：

Subagent 子代理系统架构

整个流程可以分成四个阶段：

Spawn 阶段：主 Agent 调用 sessions_spawn 工具，创建子代理
Queue 阶段：子代理进入独立的 Subagent Lane，受并发控制
Execute 阶段：子代理在隔离的 Session 中独立执行任务
Announce 阶段：子代理完成后，结果自动汇报给主 Agent

这套系统的精妙之处在于：每个环节都有清晰的边界和职责，不会互相干扰。

🔑 核心机制一：Session Key 隔离

Session Key 命名规范

OpenClaw 用一套命名规范来区分不同类型的会话：

主会话：agent:<agentId>:main
子代理会话：agent:<agentId>:subagent:<uuid>
Cron 会话：agent:<agentId>:cron:<jobId>

这个设计很聪明。通过解析 Session Key，系统可以立即知道当前会话是什么类型，该给它什么权限。

判断是否为子代理

export function isSubagentSessionKey():  {
   raw = (sessionKey ?? ).();
  
   (raw.().()) {
     ;
  }
  
   parsed = (raw);
   ((parsed?. ?? ).().());
}

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

// 在 sessions_spawn 工具中
if (isSubagentSessionKey(requesterSessionKey)) {
  return jsonResult({ status: "forbidden", error: "sessions_spawn is not allowed from sub-agent sessions" });
}

const SUBAGENT_BOOTSTRAP_ALLOWLIST = new Set(["AGENTS.md", // 基础行为规范
  "TOOLS.md", // 工具配置
  // 不包含：SOUL.md, USER.md, MEMORY.md, IDENTITY.md, HEARTBEAT.md
]);

被过滤的文件	原因
`SOUL.md`	人格定义——子代理不需要"人格"，它只是执行任务的工具
`USER.md`	用户信息——子代理不直接与用户交互
`MEMORY.md`	长期记忆——子代理是短期任务，不需要历史
`HEARTBEAT.md`	心跳配置——子代理不应该自己设置定时任务

// 子代理默认禁用的工具:
// - cron: 不能创建定时任务
// - message: 不能直接发消息给用户
// - sessions_spawn: 不能嵌套创建子代理
// - todo: 不需要任务追踪（主 Agent 负责）

# Subagent Context
You are a **subagent** spawned by the main agent for a specific task.

## Your Role
- You were created to handle: {task_text}
- Your output will be reported back to the main agent when done

## Rules
1. **Stay focused** - Do your assigned task, nothing else
2. **Be thorough** - Your final message is your deliverable
3. **Complete the task** - Don't ask for clarification, make reasonable assumptions

## What You DON'T Do
- NO user conversations (that's the main agent's job)
- NO external messages unless explicitly tasked
- NO cron jobs or persistent state (you're ephemeral)
- NO spawning other sub-agents

export const enum CommandLane {
  Main = "main",      // 主代理通道，最大并发 4
  Cron = "cron",      // 定时任务通道，最大并发 1
  Subagent = "subagent", // 子代理通道，最大并发 8
  Nested = "nested"   // 嵌套调用通道
}

async function processLane(lane: string) {
  const state = lanes.get(lane);
  if (!state) return;
  
  // 检查并发限制
  while (state.active < state.maxConcurrent && state.queue.length > 0) {
    const entry = state.queue.shift()!;
    state.active++;
    try {
      await executeEntry(entry);
    } finally {
      state.active--;
      void processLane(lane); // 继续处理队列
    }
  }
}

### Phase 1: Initial Understanding
2. **Launch up to 3 Explore agents IN PARALLEL** (single message, multiple tool calls) to efficiently explore the codebase. Each agent can focus on different aspects:
   - Example: One agent searches for existing implementations, another explores related components, a third investigates testing patterns
   - Provide each agent with a specific search focus or area to explore
   - Quality over quantity - 3 agents maximum

{"content": [{"type": "text", "text": "Let me explore the codebase..."}, {"type": "tool_use", "id": "1", "name": "task", "input": {...}}, {"type": "tool_use", "id": "2", "name": "task", "input": {...}}, {"type": "tool_use", "id": "3", "name": "task", "input": {...}}]}

Promise.all([
  TaskTool.execute(task1), // → 创建 Child Session 1
  TaskTool.execute(task2), // → 创建 Child Session 2
  TaskTool.execute(task3)  // → 创建 Child Session 3
])

export async function runSubagentAnnounceFlow(params: {
  childRunId: string;
  childSessionKey: string;
  requesterSessionKey: string;
  taskLabel: string;
  cleanup?: "delete" | "keep";
}) {
  // 1. 等待子代理完全结束
  const waitResult = await callGateway({
    method: "agent.wait",
    params: { runId: params.childRunId },
  });
  
  // 2. 读取子代理的最终回复
  const latestReply = await readLatestAssistantReply({ sessionKey: params.childSessionKey });
  
  // 3. 构建触发消息
  const triggerMessage = `📋 Background task "${params.taskLabel}" just ${statusLabel}. **Findings:** ${latestReply || "(no output)"} --- Summarize this naturally for the user.`;
  
  // 4. 发送到主代理会话
  await callGateway({
    method: "agent",
    params: {
      sessionKey: params.requesterSessionKey,
      message: triggerMessage,
      deliver: true,
      isSystemEvent: true,
    },
  });
  
  // 5. 可选：清理子代理会话
  if (params.cleanup === "delete") {
    await callGateway({
      method: "sessions.delete",
      params: { key: params.childSessionKey },
    });
  }
}

export async function maybeQueueSubagentAnnounce(params: {...}) {
  // 检查主代理是否正忙
  const isMainAgentBusy = await checkSessionBusy(params.requesterSessionKey);
  if (!isMainAgentBusy) {
    return "none"; // 可以直接发送
  }
  
  // 主代理正忙，加入队列
  queue.push({...});
  return "queued";
}

// 批量处理：将多个公告合并成一条消息
const combined = queue.map((a) => `### ${a.taskLabel}\n${a.triggerMessage}`).join("\n\n---\n\n");
await callGateway({
  method: "agent",
  params: {
    sessionKey,
    message: `Multiple background tasks completed:\n\n${combined}`,
  },
});

/subagents list       # 列出当前会话的所有子代理
/subagents stop <id>  # 停止指定子代理
/subagents log <id>   # 查看子代理对话日志
/subagents send <id> <msg> # 向子代理发送消息
/subagents info <id>  # 查看子代理详细信息

- [running] AI Trends Research (abc12345...)
- [completed] Code Analysis (def67890...)
- [error] Database Migration (ghi11213...)

设计点	目的	实现方式
Session Key 隔离	区分主/子会话	`agent:xxx:subagent:uuid` 格式
禁止嵌套 spawn	防止无限递归	`isSubagentSessionKey` 检查
Bootstrap 过滤	减少子代理上下文	白名单机制，只保留 AGENTS.md, TOOLS.md
工具策略隔离	限制子代理能力	禁用 cron, message, spawn 等
Lane 并发控制	资源隔离和限流	主代理 4 并发，子代理 8 并发
Registry 追踪	生命周期管理	注册表 + 事件监听
Announce Queue	避免消息冲突	队列化 + 批量合并
spawnedBy 字段	父子关系追踪	用于权限和清理

AI Agent 分身术：OpenClaw 子代理系统设计深度解析

AI Agent 的分身术：深度解析 OpenClaw 子代理系统设计

🎯 一句话总结

📖 为什么需要子代理？

🏗️ Subagent 系统架构总览

🔑 核心机制一：Session Key 隔离

Session Key 命名规范

判断是否为子代理

更多推荐文章

相关免费在线工具

禁止嵌套 spawn：防止套娃

🔑 核心机制二：上下文隔离

对比图：Main Agent vs Subagent

Bootstrap 文件过滤

工具策略隔离

专用 System Prompt

🔑 核心机制三：Lane 并发控制

为什么子代理的并发限制更高？

队列实现

🚀 并行 Subagent：让 AI 同时做多件事

核心发现：不是代码层面实现并行

并行执行流程图

SDK 自动并行的原理

为什么这种设计很聪明？

📢 结果汇报：Announce Flow

汇报流程

公告队列：避免消息冲突

🎮 用户命令支持

📊 关键设计要点总结

💡 我的观点和启发

1. "一次性、专注、受限"的设计哲学

2. Prompt 驱动 vs 代码驱动

3. 工程上的"最小权限原则"

4. 队列的艺术

🔗 复刻建议

📚 参考资料

更多推荐文章

相关免费在线工具

AI Agent 分身术：OpenClaw 子代理系统设计深度解析

AI Agent 的分身术：深度解析 OpenClaw 子代理系统设计

🎯 一句话总结

📖 为什么需要子代理？

🏗️ Subagent 系统架构总览

🔑 核心机制一：Session Key 隔离

Session Key 命名规范

判断是否为子代理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

禁止嵌套 spawn：防止套娃

🔑 核心机制二：上下文隔离

对比图：Main Agent vs Subagent

Bootstrap 文件过滤

工具策略隔离

专用 System Prompt

🔑 核心机制三：Lane 并发控制

为什么子代理的并发限制更高？

队列实现

🚀 并行 Subagent：让 AI 同时做多件事

核心发现：不是代码层面实现并行

并行执行流程图

SDK 自动并行的原理

为什么这种设计很聪明？

📢 结果汇报：Announce Flow

汇报流程

公告队列：避免消息冲突

🎮 用户命令支持

📊 关键设计要点总结

💡 我的观点和启发

1. "一次性、专注、受限"的设计哲学

2. Prompt 驱动 vs 代码驱动

3. 工程上的"最小权限原则"

4. 队列的艺术

🔗 复刻建议

📚 参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具