OpenClaw 刚配好就完了？5 步调教，让你的 AI 助手真正“能干活”

优质文章学习记录

08 Apr 2026 — 9 min read

很多人装完 OpenClaw，接上 Discord 或 Telegram，发现能聊天了就觉得“搞定了”。

但我自己踩坑一圈后，越来越确定一件事：默认状态的 OpenClaw，可能只发挥了 20% 的能力。剩下的 80%，藏在一些你没太注意的配置文件里——而且改起来并不难。

下面我按“收益从高到低”的顺序，把我自己最有效的 5 步调教方法整理出来。新手照着做，大概率能立刻感受到差别。

默认状态 vs 调教后：差别到底在哪？

先给你一个直观对比，方便建立预期：

项目	默认状态	调教后
回复风格	客服味：“我很乐意帮助您！”	更像懂你的搭档
记忆	每次对话都像陌生人	记得你们之前聊过什么
能力	只能聊天	能下载视频、查股票、做 PPT、巡检服务器…
主动性	你不说它不动	会定期检查状态，主动提醒
成本/效率	所有任务都用同一个模型	复杂任务用强模型，简单活用便宜模型

如果你只做一件事：先把第 1 步和第 2 步做了，体验就会明显提升。

1）先给它一个“人格”：别再像客服了

OpenClaw 的 workspace 里，我认为最关键的三份文件是：

SOUL.md — 它是谁、怎么说话、做事风格是什么
IDENTITY.md — 名字、形象、emoji（让它“自我一致”）
USER.md — 你是谁，它怎么称呼你、你的偏好是什么

很多人默认 SOUL.md 基本空着，所以 AI 回答就会很“标准化”：礼貌但没劲，像客服。

我自己改 SOUL.md 时，没有写一堆长篇大论，就几条原则，效果立刻变了：

# 核心原则 - 别说“很高兴帮助您”，直接帮 - 允许有自己的观点和偏好（但别装懂） - 先自己查，查不到再问我 - 简洁：该详细时详细，该简短时简短

就这么几行，回复会明显从“尊敬的用户您好”变成“正常人说话”。

另外，IDENTITY.md 我建议一定要填：给它起名字、配个 emoji。
别小看这个——有名字的 AI，在多轮对话里一致性真的更好，不会一会儿像程序，一会儿像客服。

USER.md 则写你自己的基础信息，比如：

时区（避免它半夜“主动关心”你）
技术栈（别给写 Go 的人推荐 Java 方案）
沟通偏好（比如希望先给结论还是先给过程）

2）搭一套“分层记忆”：别把 MEMORY.md 写成流水账

这一步是我觉得提升最大的。

默认 OpenClaw 会有一个 MEMORY.md，但常见两种翻车写法：

完全不写：结果就是“每次都像第一次见面”
什么都往里塞：最后变成一大坨流水账，AI 也不爱读，人也不爱翻

我自己的做法是：分层记忆。结构大概长这样：

MEMORY.md ← 索引层：只放最核心信息 + 指向其他文件的索引 memory/projects.md ← 项目层：每个项目状态、待办 memory/infra.md ← 基础设施层：服务器配置、API 地址等速查 memory/lessons.md ← 教训层：踩过的坑，按严重程度分级 memory/YYYY-MM-DD.md ← 日志层：当天发生了什么

关键思路只有一句话：

MEMORY.md 只做索引，不堆内容。
启动新 session 时只加载索引，需要细节再去读对应文件。

这样你会得到一个很舒服的效果：
既能“记得住”，又不会“记得太乱”。

开启 memorySearch：让记忆真的“能搜到”

如果你希望出现这种场景：

你问：“上次那个部署问题怎么解决的？”
AI 能语义检索 → 直接定位到某天日志的某段 → 精准复述

那我建议开启 OpenClaw 的 memorySearch（向量语义检索）。

参考配置（放在 openclaw.json 里）：

"memorySearch":{"enabled":true,"provider":"openai","remote":{"baseUrl":"你的embedding API地址","apiKey":"你的key"},"model":"BAAI/bge-m3"}

我自己的经验是：embedding 选 bge-m3 这种通用模型，性价比很高。
（你提到的 SiliconFlow 免费 embedding API 也确实是一个“入门就能用”的路线。）

另外我也建议你开启 compaction.memoryFlush：
上下文快满的时候，AI 会把重要信息写进当天日志，避免对话一长就“失忆”。

3）用 Skill 扩展能力：让它从“会聊”变成“会做”

OpenClaw 内置了一些 skill（天气、新闻等），但真正好玩的，是自定义 skill。

你可以把 skill 理解成：

给 AI 一份“标准作业流程（SOP）”，让它遇到某类请求就按流程执行。

一个 skill 的目录通常是这样：

skills/ my-skill/ SKILL.md ← AI 主要读这个：触发条件、步骤、输出格式 script.sh ← 可选：需要执行脚本就放这 README.md ← 可选：给人看的说明

我自己常用的几个例子：

视频下载：发 B 站/YouTube 链接 → 自动下载 → 生成分享链接
PPT 生成：说“做个关于 XX 的 PPT” → 直接产出 .pptx
股票分析：问“XX 股票能买吗” → 跑你的分析流程 → 输出结论 + 风险点
新闻摘要：每天自动抓热点 → 压缩成几条重点

写 skill 时，我总结一个很实用的心法：

把 AI 当成新来的实习生。
你写得越清楚，它越稳定。你写得越含糊，它越玄学。

触发条件、步骤、输出格式都写死，结果会稳很多。

你也提到了社区现成 skill（比如 clawhub.com），我建议新手路线是：

先装 1-2 个现成的用起来
再把你自己的高频流程固化成 skill（比如“周报生成”“日志整理”）

4）Heartbeat 心跳：让它学会“主动干活”

OpenClaw 有个心跳机制：系统每隔一段时间（默认 30 分钟）会 ping 一下 AI，问它有没有要做的。

默认情况下，AI 收到心跳就回个 HEARTBEAT_OK，等于啥也没干。

但你可以写一个 HEARTBEAT.md，告诉它心跳时该检查什么。比如：

# HEARTBEAT.md ## 每次心跳 - 检查 XX 服务是否在线（curl 一下） - 如果挂了，通知我，但不要自动重启 ## 每天一次 - 检查有没有超过 3 天没更新的项目待办 ## 每周一次 - 整理最近 7 天的日志，提炼到长期记忆

这样你的 AI 就像一个 7×24 的值班员：
你睡觉它巡检，你醒来直接看报告。

heartbeat vs cron：怎么选？

我自己的选择逻辑是：

Heartbeat：适合“顺便检查一下”的轻量任务，能批量做
Cron：适合“精确定时”的独立任务（比如每周一 9 点发周报）

如果你想从简单开始：先用 Heartbeat 做巡检、整理，再考虑 cron。

5）多模型分级：别让“最强模型”干“最简单的活”

如果你能接入多个模型（比如走 API 中转），我强烈建议做 多模型分级。原因很现实：省钱、省 token，也更快。

我自己大概按这个思路分：

等级	模型	用途
🔴 强	Claude Opus / GPT-5	主对话、复杂架构设计、深度推理
🟡 中	Claude Sonnet	子任务：写代码、信息整理
🟢 轻	Claude Haiku	简单操作：文件搜索、格式转换

在 openclaw.json 里配置 alias（示例）：

"models":{"your-provider/strong-model":{"alias":"opus"},"your-provider/medium-model":{"alias":"sonnet"},"your-provider/light-model":{"alias":"haiku"}}

然后在 AGENTS.md 里写清楚分配策略：
当 AI 需要派子 agent 执行任务时，就会更倾向选合适的模型。

我的体感收益是：日常 token 消耗能降很多，因为大多数任务根本不需要最强模型。

配置 Checklist：按优先级照着做

如果你想按“最省时间、最有效”的顺序来，我建议：

✅ 写好 SOUL.md / IDENTITY.md / USER.md（10 分钟，立竿见影）
✅ 设计分层记忆结构，开启 memorySearch（30 分钟）
✅ 配置 HEARTBEAT.md（10 分钟）
✅ 安装或编写 2-3 个最常用的 skill（按需）
✅ 配置多模型分级（有多个模型时再上）
✅ 完善 AGENTS.md 里的行为规范和安全规则

写在最后：默认只是起点，价值在“你怎么定义它”

OpenClaw 的设计哲学，我理解就是：

给你一个框架，你来定义它是谁。

默认配置只能算“通了”。真正让它变好用的，是你把它调成更贴合你工作方式的搭档：
能记住上下文、能按流程做事、还能主动巡检和提醒。

我自己折腾了一段时间，最大的感受是：
从“只会回消息的 bot”，到“真的能帮我省时间的助手”，中间差的就是这些配置细节。

如果你也在用 OpenClaw，欢迎交流你的调教经验 👋

更多AI文章：
转载地址：https://17nas.com/openclaw-tuning-5-steps
下一篇文章：OpenClaw 调教手册：从”能用”到”离不开”

财务RPA机器人上岗：90%重复工作被取代，会计人该恐慌还是进化？

“每月花3天核对500张发票，现在借助八爪鱼RPA机器人1小时就能搞定；手工录入200条银行流水，出错率高达5%，机器人却能实现零误差；月末结账熬夜到凌晨的日子彻底结束，机器人可自动生成精准报表……”这不是科幻剧情，而是国内多家大中型企业财务部的真实工作场景。如今，以RPA（机器人流程自动化）技术为核心的财务机器人，正凭借“秒级处理速度”和“零失误率”席卷财务领域，90%的重复性财务工作逐渐被替代。对于会计人而言，这并非职业危机，而是升级转型的关键契机。本文将深度拆解财务RPA机器人的3大核心能力、5大落地应用场景，并为会计人梳理清晰的“进化路径”，助力大家在这场财务自动化革命中掌握主动权。一、财务RPA机器人“有多强”？3大核心能力颠覆传统财务模式能力1：7×24小时不间断作业，效率提升超10倍典型场景：某连锁零售企业每月需处理10万张销售小票，传统人工模式下，需5名财务人员连续工作3天（合计15人天）才能完成核对、录入与异常标记。引入八爪鱼RPA机器人后，通过OCR图文识别+预设规则校验，1小时即可完成全部10万张小票的处理工作，错误率从人工的3%直接降至

汇川机器人软件RobotLab常规操作

一.权限管理注意事项 1.1 软件登录权限管理连接上软件后，修改轴参数、点位数据需要权限。点击人物图标，登录对应的权限，管理员权限登录密码6个0。 1.2机器人控制权限管理点击“锁”，打开机器人控制权配置页面。选择“InoRoboLabt”，机器人受编程软件控制，使用软件可手动移动点位、示教位置信息。选择“远程IO单元”，机器人受外部设备控制如PLC、上位机，机器人进入自动模式，收到交互信号就按照程序执行。选择“远程以太网客户端”，机器人受远程客户短控制，用于查找问题、远程调试。二、使用过渡点注意事项程序中点到点直线运动会有机构干涉或有安全风险时，使用过渡点在运动规避风险。使用过渡点时，注意指令的工具坐标系，选择正确的Wobj工具好，否则运动出错有撞机风险。如下图所示为例，wobj0为A工位，wobj1为B工位,注意在“轴控制面板”中选择对应工具坐标号三、使用全局点位移动注意事项双击左侧“P.

.NET/JAVA集成GoView低代码可视化大屏完整案例详解【.NET篇】

文章目录 * 一、GoView简介 * 二、.NET集成GoView方案 * 三、集成步骤详解 * 1. 环境准备 * 2. 获取并构建GoView * 3. 创建.NET项目 * 5. 修改.NET路由配置 * 6. 配置API接口 * 7. 修改GoView配置 * 四、进阶集成方案 * 1. 身份验证集成 * 2. 动态主题切换 * 3. 数据缓存优化 * 五、常见问题解决 * 1.跨域问题： * 2. 静态文件404错误： * 3. API请求路径问题： * 4. 性能优化： * 六、总结一、GoView简介 GoView 是一款基于 Vue3.x 构建的低代码数据可视化开发平台，它允许开发者通过简单的配置快速构建各种数据可视化大屏。 * 官网文档：

（10-1）大模型时代的人形机器人感知：视觉-语言模型在机器人中的应用

本章内容聚焦大模型时代人形机器人的感知体系升级，系统介绍了视觉—语言模型、多模态Transformer与3D大模型在机器人中的核心作用，详细讲解了文本、视觉、点云与语音等信息的语义对齐与融合机制，介绍了从语言指令到视觉目标的Grounding、任务分解与意图理解方法，并通过闭环感知与决策联动，展示了大模型支撑机器人在复杂真实场景中的理解、规划与实时行动的用法。 10.1 视觉-语言模型在机器人中的应用视觉—语言模型（Vision-Language Model，VLM）通过统一建模视觉与自然语言，使机器人具备“看懂并理解语言”的能力，是大模型时代机器人感知与认知融合的核心技术。VLM不仅能够完成图像识别、目标检测等传统感知任务，还可以直接理解语言指令、进行语义推理，并将高层语义映射为可执行的感知与行动目标，在人形机器人中广泛应用于交互理解、场景认知和任务执行等环节。 10.1.1 CLIP/BLIP/Flamingo等模型简介随着大规模多模态数据与Transformer架构的发展，视觉—语言模型逐渐从“跨模态对齐”演进为“多模态理解与推理”。CLIP、BLIP与Flam