跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI大前端算法

OpenClaw Self-Improving 技能解析:从 SKILL.md 看 AI 自我进化逻辑

综述由AI生成深入解析 OpenClaw 的 Self-Improving 技能,通过 SKILL.md 文件展示 AI 如何实现跨会话记忆与自我进化。内容涵盖记忆捕获规则、分层存储策略(HOT/WARM/COLD)、自我反思流程及人类确认机制。结合前端开发实战案例,演示了从纠正到记忆固化再到生效的全过程。此外,还介绍了技能自身的元学习进化机制,包括安全边界、提案审批及版本更新,实现了透明可控的 AI 能力迭代。

DockerOne发布于 2026/4/6更新于 2026/5/2229 浏览
OpenClaw Self-Improving 技能解析:从 SKILL.md 看 AI 自我进化逻辑

引言:打开技能的'黑盒'

你是否好奇过,OpenClaw 的技能究竟是如何工作的?为什么一个 self-improving 技能能让 AI 拥有跨会话的记忆,甚至能从错误中自我反思?答案并不在神秘的代码深处,而是藏在每个技能目录下那个看似普通的 Markdown 文件——SKILL.md 中。

SKILL.md 是技能的'基因组'。它用一套清晰、结构化的语法,定义了技能的触发条件、行为逻辑、学习规则,甚至自我更新的方式。今天,我们就以 self-improving 技能为样本,打开它的 SKILL.md,逐行解析其中的设计智慧,带你理解 AI '自我进化'背后的底层逻辑。


一、SKILL.md 概览:技能的'身份证'与'操作手册'

一个典型的 self-improving 技能目录结构如下:

self-improving/
├── SKILL.md          # 核心定义文件
├── memory/           # 记忆存储目录
│   ├── memory.md     # HOT 层(常驻记忆)
│   ├── projects/     # WARM 层(项目级记忆)
│   └── archive/      # COLD 层(归档记忆)
├── hooks/            # 钩子脚本(可选)
└── README.md         # 技能说明

而 SKILL.md 本身由几个关键区块组成,我们可以通过一张结构图来认识它们:

区块内容
元数据区技能名称、版本、作者
BEHAVIOR触发器列表、依赖项、行为定义
LEARNING记忆捕获规则、分层存储策略
SELF-EVOLUTION自我反思流程、人类确认机制、元学习指令

接下来,我们将逐一深入这些区块,揭示 self-improving 技能的底层逻辑。


二、提示词原理:BEHAVIOR 区块的指令逻辑

BEHAVIOR 区块是技能的核心,它用近乎伪代码的清晰语言,定义了 AI 在特定事件下该如何行动。这其实就是 '提示词原理' 的具体体现——通过结构化的指令,让 AI 执行复杂的认知任务。

1. 记忆捕获规则:从纠正中学习

### 1. 记忆捕获规则
当触发器 `on_user_correction` 被激活时,执行以下流程:
a. 解析用户消息,识别纠正类型:
   - 偏好纠正(如'我更喜欢 X')
   - 事实纠正(如'这个命令应该是 Y')
   - 流程纠正(如'你应该先做 A 再做 B')
b. 生成候选记忆条目,格式为:
   `[<context>] <pattern> -> <preference>`
   例如:`[coding:python] "use print instead of logger" -> "avoid logger"`
c. 将候选条目写入 `~/self-improving/memory/pending/` 目录,并记录首次出现时间。

原理图解:

  1. 用户纠正
  2. 触发 on_user_correction
  3. 解析纠正类型
  4. 生成候选记忆条目
  5. 存入 pending 目录
  6. 等待确认

这段规则揭示了 AI 是如何从用户的自然语言中 '提炼' 出结构化记忆的。通过模式识别(如关键词匹配),AI 将模糊的纠正转化为清晰的'模式→偏好'映射,并暂存在待确认区,等待后续的验证。

2. 分层存储策略:模拟人脑的认知分级

### 2. 分层存储策略
- **HOT 层** (`memory/memory.md`):
  - 存储最近 7 天内使用次数 ≥ 3 的条目,或用户明确'固定'的条目。
  - 行数上限:100 行。超出时按'最近最少使用'淘汰至 WARM 层。
- **WARM 层** (`memory/projects/`, `memory/domains/`):
  - 按项目或领域分类存储,每个文件独立。
  - 加载条件:当用户当前任务路径或话题匹配项目/领域标签时,自动加载对应文件。
- **COLD 层** (`memory/archive/`):
  - 超过 90 天未访问的条目自动移入。
  - 不主动加载,但可通过用户手动查询调取。

分层架构图:

  • HOT 层:常驻记忆 (≤100 行)
  • WARM 层:情景记忆 (projects/, domains/)
  • COLD 层:归档记忆 (archive/)

这种分层设计完美平衡了 响应速度 与 记忆容量。HOT 层常驻系统提示词,保证 AI 快速'热身';WARM 层按需加载,让 AI 能在不同角色间无缝切换;COLD 层防止记忆无限膨胀,同时保留了长尾知识的可追溯性。

3. 自我反思流程:从经验中提炼教训

### 3. 自我反思流程
当触发器 `on_task_complete` 被激活时,AI 应执行以下反思步骤:
a. 回顾任务过程中的'摩擦点'(例如用户纠正、自己犹豫的地方)。
b. 生成反思记录,格式为:

CONTEXT: <任务描述> REFLECTION: <观察到的不足> LESSON: <提炼的经验>

c. 将反思记录追加到 `memory/reflections.log`。
d. 如果同一 LESSON 在 7 天内出现 3 次,则自动生成一个候选记忆条目(转入待确认区)。

反思流程图:

  1. 任务完成
  2. 回顾摩擦点
  3. 生成反思记录
  4. 写入 reflections.log
  5. 判断:同一教训 7 天≥3 次?
    • 是 → 生成候选记忆条目
    • 否 → 结束

这一机制让 AI 具备了 '事后诸葛亮' 的能力。它不仅能从用户的直接纠正中学习,还能从自己的'失败'中提炼经验,实现了更高层次的自我进化。

4. 人类确认机制:人在回路的安全阀

### 4. 人类确认机制
当候选记忆条目累积到一定数量或特定时间点,AI 应主动询问用户:
'我注意到您最近几次倾向于使用 X,是否要将此设为默认规则?'

用户可以选择:
- 确认:条目移入 HOT 层。
- 拒绝:条目删除。
- 推迟:条目保留在待确认区。

若用户连续 3 次忽略询问,则默认拒绝该条目。

确认流程图:

  1. AI 主动询问用户
  2. 用户选择(确认/拒绝/推迟)
  3. 连续 3 次忽略 → 默认拒绝
  4. 确认 → 移入 HOT 层
  5. 拒绝 → 删除条目

这条规则确保了 '人类是进化的最终仲裁者',防止 AI 的自主学习走向错误的方向。同时,'连续忽略则拒绝'的机制避免了无休止的询问干扰用户。


三、使用场景:谁需要这个技能?

通过分析 SKILL.md 中的触发器配置和分层存储逻辑,我们可以推断出 self-improving 技能最适合以下几类场景:

场景类型典型用户技能价值
代码开发程序员、DevOps记住代码规范、框架偏好、命令习惯,让 AI 成为'熟悉你代码风格的协作者'。
内容创作写手、营销人员学习你的文风、常用词汇、语气偏好,让 AI 生成的文案'越来越像你'。
项目管理项目经理、助理记录项目特定的流程、术语、干系人信息,实现跨会话的项目知识管理。
研究分析分析师、学者沉淀研究过程中的方法论、数据源偏好,让 AI 成为你的'研究助手'。

触发器匹配场景:

  • on_user_correction:最适合需要频繁调整和优化的创造性工作。
  • on_task_complete:适合长流程、多步骤的任务,如数据分析报告撰写。
  • periodic:适合需要定期维护知识库的领域,如代码库重构。

四、实战案例:从零到一构建专属记忆

让我们模拟一个完整的实战案例,看看 self-improving 技能如何在实际交互中发挥作用。

场景:前端开发者小李使用 OpenClaw 辅助开发一个 React 项目,项目使用 Ant Design 组件库,代码规范要求使用函数组件和 TypeScript。

阶段一:初始交互(无记忆)

小李在终端中开启新会话:

小李:帮我写一个按钮组件。

AI(无记忆):

import React from 'react';
const Button = () => {
  return <button>Click me</button>;
};
export default Button;

小李看到后纠正:

小李:不对,我项目里一直用的是 Ant Design 的 Button,而且要用 TypeScript,组件名用箭头函数。

此时,on_user_correction 触发器激活,AI 按照 SKILL.md 的规则执行:

  1. 解析纠正:识别出'偏好纠正'(Ant Design、TypeScript、箭头函数)。
  2. 生成候选记忆条目:
    • [coding:react] "use antd Button" -> "prefer antd"
    • [coding:typescript] "use TypeScript" -> "always use .tsx"
    • [coding:style] "arrow function component" -> "use const Component: FC = () => ..."
  3. 将条目存入 pending/ 目录。

AI 根据纠正重新生成代码:

import React from 'react';
import { Button as AntButton } from 'antd';
const MyButton: React.FC = () => {
  return <AntButton>Click me</AntButton>;
};
export default MyButton;

小李满意地继续工作。

阶段二:记忆固化

几天后,小李又在一个新会话中开启任务:

小李:帮我写一个表单组件。

AI 加载 memory.md(目前还是空的,因为条目还在待确认区),仍然生成普通代码,小李再次纠正。同样的纠正模式重复出现。

7 天内,[coding:react] "use antd Button" 这条模式出现了 3 次。AI 按照自我反思流程(d 规则),自动生成候选记忆条目,并在下次交互时询问:

AI:我注意到您最近几次倾向于使用 Ant Design 组件和 TypeScript,是否要将此设为 React 项目的默认规则?

小李选择 '确认'。条目正式移入 memory/memory.md(HOT 层)。

阶段三:记忆生效

又一个新会话:

小李:帮我写一个卡片组件。

AI 加载 memory.md,读取到三条偏好规则,直接生成:

import React from 'react';
import { Card } from 'antd';
const DataCard: React.FC = () => {
  return <Card title="Default Card">Content</Card>;
};
export default DataCard;

小李无需再纠正。AI 已经记住了他的开发习惯。

阶段四:自我反思与进化

在完成一个复杂的数据可视化任务后,AI 触发 on_task_complete,进行自我反思:

CONTEXT: 生成 ECharts 图表代码
REFLECTION: 用户要求修改了三次颜色主题,最后选择了暗色主题
LESSON: 在生成图表时,优先询问用户是否需要暗色主题

如果这个教训在 7 天内出现 3 次,它将转化为候选记忆条目,最终可能成为永久规则:'图表任务默认使用暗色主题'。


五、让 OpenClaw 不断更新该 Skill:自我进化机制

self-improving 技能最酷的地方在于:它不仅能进化用户的记忆,还能 进化自身。这得益于 SELF-EVOLUTION 区块的定义。

1. 安全边界:哪些可以改,哪些不能改

## SELF-EVOLUTION
### 技能更新策略
本技能支持对自身代码的进化性修改,但必须遵循以下安全规则:
1. **安全边界**:只能修改 `BEHAVIOR` 和 `LEARNING` 区块中标记为 `mutable: true` 的参数,不能修改元数据、触发器列表和依赖。
2. **进化触发**:当元学习模块发现现有规则无法有效捕获用户偏好时,可提议修改规则。
3. **提案生成**:生成一个包含修改内容和理由的提案,存入 `evolution/proposals/`。
4. **人工审批**:向用户发送通知,请求审阅提案。用户确认后,技能自动应用修改并重启。
5. **版本自增**:每次成功更新后,`version` 字段的补丁号 +1。

2. 进化触发示例

假设元学习模块分析发现:用户经常对'流程纠正'的反应是沉默接受,但现有规则要求用户明确确认才能固化。元学习模块认为这可能导致效率损失,于是生成一个提案:

{
  "proposal-id": "20240521-001",
  "type": "parameter-adjustment",
  "reason": "用户对流程纠正的接受度较高,可适当降低确认阈值"
}

修改 BEHAVIOR/记忆捕获规则:

  • 原规则:流程纠正必须经过用户确认才能进入待确认区。
  • 新规则:如果同一流程纠正出现 2 次且未被反驳,自动转为候选记忆条目(仍需人工确认)。

提案存入 evolution/proposals/,并通知用户。用户审阅后批准,技能自动应用修改,版本从 2.1.0 升至 2.1.1。

3. 如何主动触发技能更新?

你可以通过以下指令让 OpenClaw 检查并应用 self-improving 技能的更新:

OpenClaw,请检查 self-improving 技能的更新。如果有新版本,拉取并生成更新提案供我审阅。

或者更主动地:

OpenClaw,请运行自我进化循环。分析过去一周 self-improving 技能的记忆捕获效果,如果发现任何可优化的参数,生成一个优化提案。

这样,self-improving 技能就形成了一个 '监控 - 分析 - 提案 - 审批 - 应用' 的闭环,实现了真正的持续自我改进。


六、总结:从 SKILL.md 看技能设计的哲学

通过深入剖析 self-improving 技能的 SKILL.md,我们看到了一个精心设计的 元指令系统 是如何让 AI 具备'记忆与进化'能力的:

  • 事件驱动:只在关键时刻激活,高效不浪费。
  • 分层记忆:模拟人脑认知,兼顾速度与容量。
  • 人在回路:所有进化必须经用户确认,安全可控。
  • 元学习:能自我调整学习策略,适应不同用户。
  • 可进化:甚至能修改自身行为规则,持续迭代。

这就是 OpenClaw 技能的强大之处:它用透明、可读的 Markdown 文件,将复杂的 AI 行为逻辑封装成模块化的技能,让每个用户都能理解、定制甚至进化 AI 的能力。

目录

  1. 引言:打开技能的“黑盒”
  2. 一、SKILL.md 概览:技能的“身份证”与“操作手册”
  3. 二、提示词原理:BEHAVIOR 区块的指令逻辑
  4. 1. 记忆捕获规则:从纠正中学习
  5. 1. 记忆捕获规则
  6. 2. 分层存储策略:模拟人脑的认知分级
  7. 2. 分层存储策略
  8. 3. 自我反思流程:从经验中提炼教训
  9. 3. 自我反思流程
  10. 4. 人类确认机制:人在回路的安全阀
  11. 4. 人类确认机制
  12. 三、使用场景:谁需要这个技能?
  13. 四、实战案例:从零到一构建专属记忆
  14. 阶段一:初始交互(无记忆)
  15. 阶段二:记忆固化
  16. 阶段三:记忆生效
  17. 阶段四:自我反思与进化
  18. 五、让 OpenClaw 不断更新该 Skill:自我进化机制
  19. 1. 安全边界:哪些可以改,哪些不能改
  20. SELF-EVOLUTION
  21. 技能更新策略
  22. 2. 进化触发示例
  23. 3. 如何主动触发技能更新?
  24. 六、总结:从 SKILL.md 看技能设计的哲学
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Jetson Orin NX 部署 Ollama 及 Llama 3.2 模型
  • Vue 3 最佳实践总结与开发技巧
  • Python 中 SyntaxError: invalid syntax 错误解决方法总结
  • 利用 GraphRAG + GLM-4 构建《红楼梦》全文的中文增强检索系统
  • MySQL 行级锁机制详解:Record、Gap 与 Next-Key Lock
  • 网络安全工程师职业解析与入门指南
  • Word 文档的 5 种视图详解:页面、阅读、Web 版式、大纲及草稿
  • GitNexus:纯本地代码知识图谱与可视化关系网工具
  • 汇川 RobotLab 软件常规操作指南
  • 递归、搜索与回溯算法:深入理解记忆化搜索
  • 微服务架构中单一代码仓库的管理策略
  • 前端Canvas:让你的网站更具视觉冲击力
  • DigitalPlat FreeDomain 架构与模式分析:后 Freenom 时代的免费域名实践
  • 5 款免费 AIGC 检测工具推荐与论文降重实践指南
  • Git LFS 安装教程:Linux、macOS 与 Windows 全平台指南
  • Mac Mini 本地部署 OpenClaw 智能体实战指南
  • GitHub 入门指南:Git 区别、核心操作与协作流程
  • 无人机避障算法核心技术:五种主流算法原理与实战应用场景
  • 如何安装 Python 的第三方模块
  • GitHub MCP 服务配置与调用实战指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online