跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
PythonAI算法

OpenClaw 记忆管理实战:Token 压缩与双层记忆体系

OpenClaw 通过主动式 Token 压缩策略防止上下文溢出,结合本地 QMD 快速检索与云端 Mem0 长期存储构建双层记忆架构。引入定时自省脚本模拟人类晨午晚省机制,实现知识的持续沉淀与系统自我优化,显著提升 AI 助手的连续对话能力与任务执行效率。

花里胡哨发布于 2026/4/5更新于 2026/4/251 浏览

为什么需要这套方案

使用 OpenClaw 一段时间后,我们发现了两个明显的痛点:

  1. 会话太长,Token 爆满 —— 聊着聊着就忘了前面的内容
  2. 每次重启都是白纸 —— 知识没有沉淀,重复问同样的问题

能不能让 AI 自己管理记忆,像人一样'三省吾身'?折腾了一天,终于搞定了。

Token 自动压缩:70% 就动手

核心痛点

OpenClaw 默认的 auto-compaction 是在 context window 接近满载时才触发。但这时候已经太晚了——对话质量下降,响应变慢。

解决方案

在 ~/.openclaw/openclaw.json 中配置主动策略:

compaction: {
  mode: "safeguard",
  reserveTokensFloor: 38400,  // 30% 剩余时强制压缩
  memoryFlush: {
    enabled: true,
    softThresholdTokens: 89600,  // 70% 时先存储记忆
    prompt: "Summarize the conversation history..."
  }
}

触发顺序

阶段Token 使用率行为
170% (89600 tokens)memoryFlush 静默存储重要信息
270% 剩余 (38400 tokens)auto-compaction 强制压缩

配合 Heartbeat 每 30 分钟检查,超过 70% 会主动提醒:

heartbeat: {
  every: "30m",
  prompt: "Read HEARTBEAT.md if it exists..."
}

双层记忆体系:快 + 深

架构设计

┌─────────────────────────────────────────────────┐
│                 用户查询                        │
└─────────────────────┬───────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────┐
│      QMD(短期记忆)                            │
│      • 本地 BM25 关键词搜索                       │
│      • 毫秒级响应                               │
│      • 工作区文件索引                           │
└─────────────────────┬───────────────────────────┘
                      │ 无结果/需语义理解
                      ▼
┌─────────────────────────────────────────────────┐
│      Mem0(长期记忆)                           │
│      • 云端语义向量搜索                         │
│      • 跨会话知识沉淀                           │
│      • 重要决策、经验教训                       │
└─────────────────────────────────────────────────┘

QMD 安装

# 安装 Bun(如果没装)
powershell -c "irm bun.sh/install.ps1|iex"

# 安装 QMD
bun install -g qmd



# 加入 PATH
# Windows: 添加 C:\Users\{username}\.bun\bin 到环境变量

使用方式

# 更新索引
qmd update "C:\Users\{username}\.openclaw\workspace-magic"

# BM25 搜索(无需语义向量)
qmd search "关键词" -c "C:\Users\{username}\.openclaw\workspace-magic"

# 查看已索引文件
qmd ls "C:\Users\{username}\.openclaw\workspace-magic"

记忆分类

类型QMD(短期)Mem0(长期)
工作区文档✅ 自动索引❌
临时信息✅❌
技术知识❌✅
用户偏好❌✅
重要决策❌✅
经验教训✅ 可选✅

每日三省吾身:AI 也会反思

设计思路

既然 AI 每次会话都是'新'的,那就让它定时'醒过来'检查一下自己。 仿照古人的'三省吾身':

  • 晨省:检查今日计划
  • 午省:进度回顾
  • 晚省:今日总结,存入长期记忆

实现

创建 scripts/self-reflection.py:

# 三省时间窗口
MORNING_START, MORNING_END = time(6, 0), time(10, 0)   # 晨省
NOON_START, NOON_END = time(12, 0), time(15, 0)        # 午省
EVENING_START, EVENING_END = time(20, 0), time(23, 0) # 晚省

# 检查当前时段,决定是否触发反思
def get_current_period(now):
    current_time = now.time()
    if MORNING_START <= current_time <= MORNING_END:
        return "morning"
    # ...

在 HEARTBEAT.md 中配置检查流程:

## Check Procedure
### Step 1: Check Token Usage
- If usage >= 70%: 提醒用户 /compact

### Step 2: Self-Reflection Check
运行 self-reflection.py,按时段执行反思

### Step 3: Run Task Checker
执行定时任务(QMD 更新、每日总结、每周维护)

工作流程

Heartbeat (每 30 分钟)
    │
    ├── 检查 Token 使用率 >= 70%? → 提醒压缩
    │
    ├── 检查时段
    │   ├── 06:00-10:00 → 晨省(今日计划)
    │   ├── 12:00-15:00 → 午省(进度回顾)
    │   └── 20:00-23:00 → 晚省(总结 + Mem0)
    │
    └── 执行定时任务
        ├── QMD 索引更新(>20h)
        ├── 每日总结(>20h)
        └── 每周维护(~6 天)

文件结构

workspace-magic/
├── AGENTS.md             # 工作区规则
├── SOUL.md               # AI 人格定义
├── USER.md               # 用户信息
├── MEMORY.md             # 长期记忆核心(手动维护)
├── HEARTBEAT.md          # Heartbeat 任务定义
│
├── scripts/
│   ├── check-tasks.py    # 定时任务检查
│   └── self-reflection.py # 三省系统
│
└── memory/
    ├── 2026-02-25.md     # 每日日志
    ├── reflection-state.json  # 三省状态
    └── cron-state.json    # 任务状态

效果验证

配置生效确认

$ openclaw config get agents.defaults.compaction
{
  "mode": "safeguard",
  "reserveTokensFloor": 38400,
  "memoryFlush": {
    "enabled": true,
    "softThresholdTokens": 89600
  }
}
$ openclaw config get agents.defaults.heartbeat
{
  "every": "30m",
  "prompt": "Read HEARTBEAT.md if it exists..."
}

记忆系统状态

系统状态数量
QMD✅ 正常17 个文件索引
Mem0✅ 正常26 条记忆

三省系统

当前时段会自动检查,在对应时间窗口触发反思任务。

下一步

  • 观察晚省自动总结效果
  • 优化 Mem0 存储质量(自动提取关键信息)
  • 探索更智能的记忆召回策略

总结

这套系统的核心思想:

  1. Token 管理:主动出击,70% 就压缩,不要等爆了再救
  2. 双层记忆:快的负责日常,深的负责沉淀
  3. 自我进化:定时反思,让 AI 越用越聪明

OpenClaw 的配置灵活度很高,配合 Heartbeat 和自定义脚本,可以做出很多有趣的东西。

目录

  1. 为什么需要这套方案
  2. Token 自动压缩:70% 就动手
  3. 核心痛点
  4. 解决方案
  5. 触发顺序
  6. 双层记忆体系:快 + 深
  7. 架构设计
  8. QMD 安装
  9. 安装 Bun(如果没装)
  10. 安装 QMD
  11. 加入 PATH
  12. Windows: 添加 C:\Users\{username}\.bun\bin 到环境变量
  13. 使用方式
  14. 更新索引
  15. BM25 搜索(无需语义向量)
  16. 查看已索引文件
  17. 记忆分类
  18. 每日三省吾身:AI 也会反思
  19. 设计思路
  20. 实现
  21. 三省时间窗口
  22. 检查当前时段,决定是否触发反思
  23. Check Procedure
  24. Step 1: Check Token Usage
  25. Step 2: Self-Reflection Check
  26. Step 3: Run Task Checker
  27. 工作流程
  28. 文件结构
  29. 效果验证
  30. 配置生效确认
  31. 记忆系统状态
  32. 三省系统
  33. 下一步
  34. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • 💰 8折买阿里云服务器限时8折购买
  • 🦞 5分钟部署阿里云小龙虾了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog

更多推荐文章

查看全部
  • GitHub Copilot 与国产 AI 编程助手对比:通义灵码、Comate 等选型指南
  • 后仿真 SDF 反标常见 Warning 分析与处理指南
  • OpenClaw 开源项目实现机器人空间记忆与具身智能突破
  • PyTorch 实战:基于文本引导的图像生成与 Stable Diffusion 实践
  • Motrix WebExtension 浏览器扩展配置指南
  • N46Whisper:三步实现日语视频 AI 字幕生成
  • FPGA 核心资源解析:LUT、FF、BRAM、DSP、PLL 及综合报告解读
  • 前端状态管理对比:如何选择合适的方案
  • AI 实践:Claude Skills 技能详解与实践
  • Neo4j 图数据库核心概念与在线控制台实战指南
  • 前端流式输出:从原理到实战落地
  • OpenClaw 接入 QVeris:为 AI 助手赋予实时数据查询能力
  • 自然语言处理在客户服务领域的实战应用
  • ERNIE-4.5-0.3B 轻量级模型部署与性能实测指南
  • Web 安全学习体系与常见漏洞实战解析
  • VS Code 前端开发必备:10 款高效插件推荐与配置
  • 基于 YOLOv8/v11 与 LLM 的 Web 目标检测及人脸识别系统
  • 前端组件库实战:告别重复造轮子,提升开发效率
  • 优雅降级 vs 渐进增强:前端兼容策略的“道”与“术”
  • VSCode Copilot 接入智谱 GLM-5.1 实战指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online