OpenClaw 架构原理与核心机制深度解析 | 极客日志

TypeScriptNode.jsAI

OpenClaw 架构原理与核心机制深度解析

OpenClaw 是一款本地优先的开源 AI 助手框架，支持多消息平台接入。其核心采用 Gateway 控制平面架构，通过 WebSocket 调度所有渠道、会话及工具调用。系统包含 Pi Agent 嵌入式运行时、会话模型、多渠道适配器、Skills 扩展平台及多 Agent 协作机制。安全方面提供多层防护，包括沙箱隔离、权限控制及故障转移策略。支持主流 AI 模型及本地部署，适合开发者研究 AI Agent 框架设计与工程实践。

狂少发布于 2026/3/28更新于 2026/5/2928 浏览

前言

OpenClaw 是一款运行在个人设备上的开源 AI 助手框架，支持 WhatsApp、Telegram、Discord、Slack、Signal、iMessage 等 20+ 主流消息平台。本文基于其源码（openclaw-main）对其整体架构、核心子系统及关键设计原理进行深度解析。

一、整体架构概览

OpenClaw 采用本地优先（Local-First）的 Gateway 控制平面架构，核心思想是：所有消息渠道、AI 会话、工具调用都通过一个统一的本地 WebSocket 服务（Gateway）进行调度。

WhatsApp / Telegram / Slack / Discord / Signal / iMessage / ...
│
▼
┌───────────────────────────────┐
│ Gateway │
│ (控制平面 / Control Plane) │
│ ws://127.0.0.1:18789 │
└──────────────┬────────────────┘
│
├─ Pi Agent（嵌入式 AI 运行时，RPC 模式）
├─ CLI（openclaw 命令行）
├─ WebChat UI（内置 Web 界面）
├─ macOS 菜单栏 App
└─ iOS / Android 节点（Nodes）

设计哲学：

Gateway 只是控制平面，不是产品本身

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

openclaw-main/
├── src/ # 核心源码
│   ├── gateway/ # Gateway 服务（WebSocket 控制平面）
│   ├── agents/ # Agent 运行时（Pi 嵌入式 Runner）
│   ├── sessions/ # 会话管理
│   ├── channels/ # 消息渠道适配器
│   ├── providers/ # AI 模型提供商
│   ├── skills/ # Skills 平台
│   ├── browser/ # 浏览器控制工具
│   ├── canvas-host/ # Canvas 可视化工作区
│   └── ...
├── extensions/ # 扩展插件（Discord、Feishu、Matrix 等）
├── skills/ # 内置 Skills 目录
├── ui/ # WebChat 前端（TypeScript + Vite）
├── apps/ # 平台 App（macOS、iOS、Android）
└── packages/ # 共享包

1. 加载配置（openclaw.json）
2. 初始化认证模块（auth.ts）
3. 启动 HTTP 服务（server-http.ts）
4. 升级 WebSocket 连接（server-ws-runtime.ts）
5. 初始化渠道连接（server-channels.ts）
6. 启动 Cron 调度器（server-cron.ts）
7. 注册工具目录（tool-catalog.ts）
8. 加载 Skills（skills.ts）
9. 启动内存服务（server-startup-memory.ts）

用户消息到达
│
▼
构建 System Prompt（SOUL.md + AGENTS.md + Skills + 上下文）
│
▼
调用 AI 模型 API（支持 Anthropic / OpenAI / Gemini / Ollama 等）
│
▼
流式接收响应（pi-embedded-subscribe.ts）
│
├─ 文本块 → 实时推送到渠道
├─ 工具调用 → 执行工具 → 结果注入上下文
└─ 思考块（Reasoning）→ 可选显示
│
▼
会话历史持久化（session-utils.fs.ts）

工具调用请求
│
▼
tool-policy-pipeline.ts（策略检查）
├─ 沙箱策略（sandbox-tool-policy.ts）
├─ 文件系统策略（tool-fs-policy.ts）
├─ 路径策略（path-policy.ts）
└─ 自定义策略
│
▼
工具执行（bash-tools.exec.ts / browser / canvas 等）
│
▼
结果返回 + 持久化（session-tool-result-guard.ts）

类型	说明
`main`	主会话，用于与用户直接对话，拥有完整工具权限
非 main	群组/渠道会话，可配置沙箱隔离

{"agents":{"defaults":{"sandbox":{"mode":"non-main"}}}}

入站消息
│
▼
渠道适配器（解析 + 标准化）
│
▼
routing/（路由决策）
├─ 确定目标 Agent（基于 sender/group 配置）
├─ 安全检查（allowFrom / dmPolicy）
└─ 会话键生成（session-key-utils.ts）
│
▼
会话队列（lanes.ts）
│
▼
Pi Agent 处理
│
▼
回复分块（streaming/chunking）→ 发送回渠道

请求到来
│
▼
resolve-auth-profile-order.ts（排序策略）
├─ 按 lastUsed 时间排序（避免单 Key 过热）
├─ 跳过冷却中的 Key（rate limit 后自动冷却）
└─ 优先使用 lastGood Key
│
▼
执行请求
│
├─ 成功 → 更新 lastUsed
└─ 失败 → 标记冷却 → 自动切换下一个 Key

类型	位置	说明
内置 Skills	`skills/` 目录	随 OpenClaw 发布
托管 Skills	`~/.openclaw/skills/`	通过 ClawHub 安装
工作区 Skills	`workspace/skills/`	用户自定义

启动时扫描 Skills 目录
│
▼
解析 SKILL.md（提取 description、触发条件）
│
▼
构建 Skills 快照（buildworkspaceskillsnapshot.ts）
│
▼
注入 System Prompt（build-workspace-skills-prompt.ts）
│
▼
Agent 根据用户意图选择并加载对应 Skill

工具	说明
`exec` / `bash`	Shell 命令执行，支持 PTY
`read` / `write` / `edit`	文件系统操作
`browser`	Chrome/Chromium 浏览器控制（CDP）
`canvas`	Agent 驱动的可视化工作区
`nodes`	移动设备控制（相机、屏幕录制、位置）
`sessions_*`	多 Agent 协作工具
`memory_search` / `memory_get`	语义记忆检索
`web_search` / `web_fetch`	网络搜索与内容抓取

主 Agent
├─ sessions_spawn() → 子 Agent A（独立会话）
├─ sessions_spawn() → 子 Agent B（独立会话）
└─ sessions_send() → 向其他会话发消息

外部请求
│
▼
网络层：默认绑定 127.0.0.1（不暴露公网）
│
▼
认证层：Token / Password / Tailscale 身份
│
▼
授权层：角色权限（owner/user/guest）+ 方法作用域
│
▼
渠道层：allowFrom 白名单 + dmPolicy 配对
│
▼
工具层：沙箱隔离 + 路径策略 + 审批机制
│
▼
Agent 层：Prompt 注入防护 + 内容清理

{
  "agent": {
    "model": "anthropic/claude-opus-4-6"
  },
  "gateway": {
    "bind": "loopback",
    "port": 18789
  },
  "channels": {
    "telegram": { "botToken": "..." },
    "discord": { "token": "..." },
    "whatsapp": { "allowFrom": ["..."] }
  },
  "agents": {
    "defaults": {
      "workspace": "~/.openclaw/workspace",
      "sandbox": { "mode": "non-main" }
    }
  }
}

OpenClaw 架构原理与核心机制深度解析

前言

一、整体架构概览

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、核心目录结构

三、Gateway：WebSocket 控制平面

3.1 核心职责

3.2 服务启动流程

3.3 WebSocket 协议设计

四、Pi Agent：嵌入式 AI 运行时

4.1 架构设计

4.2 Agent 运行循环

4.3 工具执行机制

4.4 上下文压缩（Compaction）

五、会话模型（Session Model）

5.1 会话类型

5.2 会话隔离与沙箱

5.3 会话持久化

六、多渠道架构

6.1 渠道适配器设计

6.2 消息路由

6.3 安全模型

七、模型管理与故障转移

7.1 多模型支持

7.2 Auth Profile 轮换

7.3 模型故障转移

八、Skills 平台

8.1 Skills 架构

8.2 Skills 加载流程

8.3 Skills 安装

九、工具系统

9.1 核心工具集

9.2 Bash 工具深度解析

9.3 浏览器控制

十、子 Agent 系统（Multi-Agent）

10.1 设计理念

10.2 子 Agent 注册表

10.3 ACP（Agent Coding Protocol）

十一、内存与记忆系统

11.1 文件系统记忆

11.2 语义搜索

十二、安全架构

12.1 多层安全防护

12.2 Docker 沙箱

十三、配置系统

13.1 配置文件

13.2 热重载机制

十四、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具