Open Claw 框架(业内常指代 AI Agent Execution Framework / Coding Agent 架构)是连接大模型与实际系统操作的执行层框架。它不是单一产品,而是一类让 AI 从"对话"进化到"动手执行"的技术架构统称(涵盖 OpenAI Codex CLI、Claude Code、Kimi Agent SDK 等)。
以下是该框架的完整技术剖析:
一、框架定位:从 LLM 到 Action 的桥梁
传统 LLM 调用:用户提问 → 模型回答
Open Claw 框架:用户目标 → 理解 → 规划 → 执行 → 验证 → 迭代
纯文本交互 vs 物理世界/代码/系统操作
核心使命:将模型的认知能力转化为系统级操作能力(文件读写、代码编译、命令执行、API 调用)。
二、五层架构详解
第 1 层:输入层(Interface Layer)
职责:多模态意图捕获
- 终端界面:REPL 交互(Claude Code/Codex CLI)
- IDE 插件:VSCode/JetBrains 扩展(Kimi Code)
- API 接口:程序化调用(Agent SDK)
# 示例:自然语言输入捕获
user_input = "帮我重构这个 Python 项目,添加类型注解并运行测试"
context = {
"cwd": "/workspace/project",
"files": get_file_tree(),
"history": load_conversation_memory()
}
第 2 层:理解层(Comprehension Layer)
职责:意图解析与任务分解
- 意图识别:区分"问答"vs"执行"
- 实体提取:识别文件路径、代码片段、工具名称
- 任务图生成:将目标拆解为可执行步骤(Todo List)
关键技术:
- Function Calling:模型输出结构化工具调用指令
- Chain-of-Thought:显式推理过程('我需要先…然后…')
第 3 层:规划层(Planning Layer)
职责:动态策略制定
- 依赖分析:识别任务间的先后关系
- 工具选择:从 MCP 工具箱中选择合适的工具
- 回滚策略:失败时的备选方案
# 生成的执行计划示例

