OpenClaw 记忆管理实战：Token 压缩与双层记忆体系

OpenClaw 通过主动式 Token 压缩策略防止上下文溢出，结合本地 QMD 快速检索与云端 Mem0 长期存储构建双层记忆架构。引入定时自省脚本模拟人类晨午晚省机制，实现知识的持续沉淀与系统自我优化，显著提升 AI 助手的连续对话能力与任务执行效率。

花里胡哨发布于 2026/4/5更新于 2026/4/251 浏览

为什么需要这套方案

使用 OpenClaw 一段时间后，我们发现了两个明显的痛点：

会话太长，Token 爆满 —— 聊着聊着就忘了前面的内容
每次重启都是白纸 —— 知识没有沉淀，重复问同样的问题

能不能让 AI 自己管理记忆，像人一样'三省吾身'？折腾了一天，终于搞定了。

Token 自动压缩：70% 就动手

核心痛点

OpenClaw 默认的 auto-compaction 是在 context window 接近满载时才触发。但这时候已经太晚了——对话质量下降，响应变慢。

解决方案

在 ~/.openclaw/openclaw.json 中配置主动策略：

compaction: {
  mode: "safeguard",
  reserveTokensFloor: 38400,  // 30% 剩余时强制压缩
  memoryFlush: {
    enabled: true,
    softThresholdTokens: 89600,  // 70% 时先存储记忆
    prompt: "Summarize the conversation history..."
  }
}

触发顺序

阶段	Token 使用率	行为
1	70% (89600 tokens)	memoryFlush 静默存储重要信息
2	70% 剩余 (38400 tokens)	auto-compaction 强制压缩

配合 Heartbeat 每 30 分钟检查，超过 70% 会主动提醒：

heartbeat: {
  every: "30m",
  prompt: "Read HEARTBEAT.md if it exists..."
}

双层记忆体系：快 + 深

架构设计

┌─────────────────────────────────────────────────┐
│                 用户查询                        │
└─────────────────────┬───────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────┐
│      QMD（短期记忆）                            │
│      • 本地 BM25 关键词搜索                       │
│      • 毫秒级响应                               │
│      • 工作区文件索引                           │
└─────────────────────┬───────────────────────────┘
                      │ 无结果/需语义理解
                      ▼
┌─────────────────────────────────────────────────┐
│      Mem0（长期记忆）                           │
│      • 云端语义向量搜索                         │
│      • 跨会话知识沉淀                           │
│      • 重要决策、经验教训                       │
└─────────────────────────────────────────────────┘

QMD 安装

# 安装 Bun（如果没装）
powershell -c "irm bun.sh/install.ps1|iex"

# 安装 QMD
bun install -g qmd

为什么需要这套方案

使用 OpenClaw 一段时间后，我们发现了两个明显的痛点：

会话太长，Token 爆满 —— 聊着聊着就忘了前面的内容
每次重启都是白纸 —— 知识没有沉淀，重复问同样的问题

能不能让 AI 自己管理记忆，像人一样'三省吾身'？折腾了一天，终于搞定了。

Token 自动压缩：70% 就动手

核心痛点

OpenClaw 默认的 auto-compaction 是在 context window 接近满载时才触发。但这时候已经太晚了——对话质量下降，响应变慢。

解决方案

在 ~/.openclaw/openclaw.json 中配置主动策略：

compaction: {
  mode: "safeguard",
  reserveTokensFloor: 38400,  // 30% 剩余时强制压缩
  memoryFlush: {
    enabled: true,
    softThresholdTokens: 89600,  // 70% 时先存储记忆
    prompt: "Summarize the conversation history..."
  }
}

触发顺序

阶段	Token 使用率	行为
1	70% (89600 tokens)	memoryFlush 静默存储重要信息
2	70% 剩余 (38400 tokens)	auto-compaction 强制压缩

配合 Heartbeat 每 30 分钟检查，超过 70% 会主动提醒：

heartbeat: {
  every: "30m",
  prompt: "Read HEARTBEAT.md if it exists..."
}

双层记忆体系：快 + 深

架构设计

┌─────────────────────────────────────────────────┐
│                 用户查询                        │
└─────────────────────┬───────────────────────────┘
                      ▼
┌─────────────────────────────────────────────────┐
│      QMD（短期记忆）                            │
│      • 本地 BM25 关键词搜索                       │
│      • 毫秒级响应                               │
│      • 工作区文件索引                           │
└─────────────────────┬───────────────────────────┘
                      │ 无结果/需语义理解
                      ▼
┌─────────────────────────────────────────────────┐
│      Mem0（长期记忆）                           │
│      • 云端语义向量搜索                         │
│      • 跨会话知识沉淀                           │
│      • 重要决策、经验教训                       │
└─────────────────────────────────────────────────┘

QMD 安装

# 安装 Bun（如果没装）
powershell -c "irm bun.sh/install.ps1|iex"

# 安装 QMD
bun install -g qmd

类型	QMD（短期）	Mem0（长期）
工作区文档	✅ 自动索引	❌
临时信息	✅	❌
技术知识	❌	✅
用户偏好	❌	✅
重要决策	❌	✅
经验教训	✅ 可选	✅

系统	状态	数量
QMD	✅ 正常	17 个文件索引
Mem0	✅ 正常	26 条记忆

OpenClaw 记忆管理实战：Token 压缩与双层记忆体系

为什么需要这套方案

Token 自动压缩：70% 就动手

核心痛点

解决方案

触发顺序

双层记忆体系：快 + 深

架构设计

QMD 安装

OpenClaw 记忆管理实战：Token 压缩与双层记忆体系

为什么需要这套方案

Token 自动压缩：70% 就动手

核心痛点

解决方案

触发顺序

双层记忆体系：快 + 深

架构设计

QMD 安装

更多推荐文章

相关免费在线工具

使用方式

记忆分类

每日三省吾身：AI 也会反思

设计思路

实现

工作流程

文件结构

效果验证

配置生效确认

记忆系统状态

三省系统

下一步

总结

更多推荐文章

相关免费在线工具

OpenClaw 记忆管理实战：Token 压缩与双层记忆体系

为什么需要这套方案

Token 自动压缩：70% 就动手

核心痛点

解决方案

触发顺序

双层记忆体系：快 + 深

架构设计

QMD 安装

OpenClaw 记忆管理实战：Token 压缩与双层记忆体系

为什么需要这套方案

Token 自动压缩：70% 就动手

核心痛点

解决方案

触发顺序

双层记忆体系：快 + 深

架构设计

QMD 安装

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

使用方式

记忆分类

每日三省吾身：AI 也会反思

设计思路

实现

工作流程

文件结构

效果验证

配置生效确认

记忆系统状态

三省系统

下一步

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具