从 70% Token 自动压缩到'每日三省吾身',打造一个真正会学习的 AI 助手
背景
在使用 OpenClaw 的过程中,我遇到了两个典型痛点:
- 会话太长,Token 爆满 — 聊着聊着就忘了前面的内容
- 每次重启都是白纸 — 知识没有沉淀,重复问同样的问题
能不能让 AI 自己管理记忆,像人一样'三省吾身'?折腾了一天,终于搞定了。
一、Token 自动压缩:70% 就动手
问题
OpenClaw 默认的 auto-compaction 是在 context window 接近满载时才触发。但这时候已经太晚了——对话质量下降,响应变慢。
解决方案
在 ~/.openclaw/openclaw.json 中配置如下策略:
{
"compaction": {
"mode": "safeguard",
"reserveTokensFloor": 38400,
"memoryFlush": {
"enabled": true,
"softThresholdTokens": 89600,
"prompt": "Summarize the conversation history..."
}
}
}
这里设置 reserveTokensFloor 为 38400,意味着保留 30% 的剩余空间时强制压缩;而 softThresholdTokens 设为 89600(约 70%),会在达到该阈值时先静默存储记忆。
触发顺序
| 阶段 | Token 使用率 | 行为 |
|---|---|---|
| 1 | 70% (89600 tokens) | memoryFlush 静默存储重要信息 |
| 2 | 70% 剩余 (38400 tokens) | auto-compaction 强制压缩 |
配合 Heartbeat 每 30 分钟检查,超过 70% 会主动提醒:
{
"heartbeat": {
"every": "30m",
"prompt": "Read HEARTBALL.md if it exists..."
}
}
二、双层记忆体系:快 + 深
架构设计
┌─────────────────────────────────────────────────┐
│ 用户查询 │
└─────────────────────┬───────────────────────────┘
▼
┌─────────────────────────────────────────────────┐
│ QMD(短期记忆) │
│ • 本地 BM25 关键词搜索 │
│ • 毫秒级响应 │
│ • 工作区文件索引 │
└─────────────────────┬───────────────────────────┘
│ 无结果/需语义理解
▼
┌─────────────────────────────────────────────────┐
│ Mem0(长期记忆) │
│ • 云端语义向量搜索 │
│ • 跨会话知识沉淀 │
│ • 重要决策、经验教训 │
└─────────────────────────────────────────────────┘
QMD 安装
# 安装 Bun(如果没装)
powershell -c "irm bun.sh/install.ps1|iex"
# 安装 QMD
bun install -g qmd
# 加入 PATH
# Windows: 添加 C:\Users\{user}\.bun\bin 到环境变量
使用方式
# 更新索引
qmd update "C:\Users\{user}\.openclaw\workspace-magic"
# BM25 搜索(无需语义向量)
qmd search "关键词" -c "C:\Users\{user}\.openclaw\workspace-magic"
# 查看已索引文件
qmd ls "C:\Users\{user}\.openclaw\workspace-magic"
记忆分类
| 类型 | QMD(短期) | Mem0(长期) |
|---|---|---|
| 工作区文档 | ✅ 自动索引 | ❌ |
| 临时信息 | ✅ | ❌ |
| 技术知识 | ❌ | ✅ |
| 用户偏好 | ❌ | ✅ |
| 重要决策 | ❌ | ✅ |
| 经验教训 | ✅ 可选 | ✅ |
三、每日三省吾身:AI 也会反思
设计思路
既然 AI 每次会话都是'新'的,那就让它定时'醒过来'检查一下自己。
仿照古人的'三省吾身':
- 晨省:检查今日计划
- 午省:进度回顾
- 晚省:今日总结,存入长期记忆
实现
创建 scripts/self-reflection.py:
from datetime import time
# 三省时间窗口
MORNING_START, MORNING_END = time(6, 0), time(10, 0) # 晨省
NOON_START, NOON_END = time(12, 0), time(15, 0) # 午省
EVENING_START, EVENING_END = time(20, 0), time(23, 0) # 晚省
# 检查当前时段,决定是否触发反思
def get_current_period(now):
current_time = now.time()
if MORNING_START <= current_time <= MORNING_END:
return "morning"
# ... 后续逻辑类似
在 HEARTBEAT.md 中配置检查流程:
## Check Procedure
### Step 1: Check Token Usage
- If usage >= 70%: 提醒用户 /compact
### Step 2: Self-Reflection Check
运行 self-reflection.py,按时段执行反思
### Step 3: Run Task Checker
执行定时任务(QMD 更新、每日总结、每周维护)
工作流程
Heartbeat (每 30 分钟)
│
├── 检查 Token 使用率 >= 70%? → 提醒压缩
│
├── 检查时段
│ ├── 06:00-10:00 → 晨省(今日计划)
│ ├── 12:00-15:00 → 午省(进度回顾)
│ └── 20:00-23:00 → 晚省(总结 + Mem0)
│
└── 执行定时任务
├── QMD 索引更新(>20h)
├── 每日总结(>20h)
└── 每周维护(~6 天)
四、文件结构
workspace-magic/
├── AGENTS.md # 工作区规则
├── SOUL.md # AI 人格定义
├── USER.md # 用户信息
├── MEMORY.md # 长期记忆核心(手动维护)
├── HEARTBEAT.md # Heartbeat 任务定义
│
├── scripts/
│ ├── check-tasks.py # 定时任务检查
│ └── self-reflection.py # 三省系统
│
└── memory/
├── 2026-02-25.md # 每日日志
├── reflection-state.json # 三省状态
└── cron-state.json # 任务状态
五、效果
配置生效确认
$ openclaw config get agents.defaults.compaction
{
"mode": "safeguard",
"reserveTokensFloor": 38400,
"memoryFlush": {
"enabled": true,
"softThresholdTokens": 89600
}
}
$ openclaw config get agents.defaults.heartbeat
{
"every": "30m",
"prompt": "Read HEARTBEAT.md if it exists..."
}
记忆系统状态
| 系统 | 状态 | 数量 |
|---|---|---|
| QMD | ✅ 正常 | 17 个文件索引 |
| Mem0 | ✅ 正常 | 26 条记忆 |
三省系统
当前时段会自动检查,在对应时间窗口触发反思任务。
六、下一步
- 观察晚省自动总结效果
- 优化 Mem0 存储质量(自动提取关键信息)
- 探索更智能的记忆召回策略
总结
这套系统的核心思想:
- Token 管理:主动出击,70% 就压缩,不要等爆了再救
- 双层记忆:快的负责日常,深的负责沉淀
- 自我进化:定时反思,让 AI 越用越聪明
OpenClaw 的配置灵活度很高,配合 Heartbeat 和自定义脚本,可以做出很多有趣的东西。

