跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI

Claude-Mem:为 Claude Code 构建跨会话长期记忆

综述由AI生成Claude-Mem 是一个针对 Claude Code 的本地持久化记忆插件,通过事件驱动捕获关键操作,利用 SQLite 和 Chroma 进行混合存储,并采用三层渐进式披露机制按需注入上下文。该方案有效解决了 AI 编程助手跨会话失忆和 Token 成本高的问题,实测可节省 90% 至 95% 的 Token 消耗。文章详细分析了其架构原理、实战效果及局限性,指出分层记忆和本地化存储是 Agent 时代的重要趋势,建议开发者将其纳入实际工作流以提升协作效率。

萤火微光发布于 2026/3/29更新于 2026/6/1120 浏览
Claude-Mem:为 Claude Code 构建跨会话长期记忆

Claude-Mem:给 Claude Code 装上长期记忆

用 Claude Code 写代码时,最头疼的莫过于每次开新会话都要重新解释项目背景。我们借着 Claude-Mem 这个开源项目,聊聊为什么 AI 编程助手需要'长期记忆',它是怎么实现的,以及在工程上有哪些值得借鉴的地方。

概述

这篇文章主要写给三类人看:日常在用 Claude Code 或 VS Code AI 插件写代码的开发者、正在做 Agent 或 RAG 方向的工程师,以及对 AI 编程效率感兴趣的技术爱好者。

核心问题只有一个:如何用一个开源插件,把'金鱼记忆'的 Claude Code,改造成记得住你项目细节的'老同事'?

痛点:为什么 AI 编程助手必须要'长期记忆'?

场景有多难受?

周一你和 Claude 反复讨论微服务架构和数据库分片,周二为了修 Bug 切了分支,周三回来接着做架构,Claude 却一脸懵:'这是什么项目?'

这种体验在 GitHub 的 issue 里被直接称为'重大工作流程中断'。本质上,现在的 IDE 插件大多是'短期 + 纯上下文',而不是'长期 + 按需召回'。这导致项目一旦跨天,重复解释成本极高,多人协作时新人也无法顺畅接上历史上下文。

开发者已经开始自救

GitHub 上已经出现了 memory-mcp、mcp-memory-keeper 等自建方案。这说明痛点是真痛,社区已经在尝试给 AI 装记忆。Claude-Mem 恰好踩在这个需求点上:专为 Claude Code 设计,免费开源,装完就能用。

Claude-Mem 是什么?

一句话概括:这是一个给 Claude Code 用的本地持久化记忆插件。通过事件驱动、混合存储和三层渐进式检索,把你和 AI 一起做过的事压成结构化'长期记忆',在后续会话中按需注入,同时大幅减少 Token 消耗。

它是开源项目,由 @thedotmack 开发。截至 2026 年 2 月 7 日,GitHub Star 超过 2.2 万。官方数据显示,常规场景节省约 90% Token,'无尽模式'最高可达 95%,工具调用上限提升约 20 倍。对于一个'记忆插件'来说,这个量级说明它不只是玩具,而是踩到了真实需求。

整体架构:怎么把碎片操作变成记忆?

思路可以拆成三步:监听生命周期捕获观察记录、本地混合存储、新会话按需注入。

事件驱动:不干扰你的关键动作捕获

内部挂了 5 个生命周期钩子,对用户几乎隐形:

钩子触发时机作用
SessionStart会话启动初始化检索和上下文准备
UserPromptSubmit用户提交问题时记录用户意图和上下文
PostToolUse工具调用完成之后捕获文件读写、代码改动等
Stop任务暂停保存中间状态
SessionEnd会话结束触发总结、压缩与入库

重点记录的是'工具使用带来的变化',比如改了哪些文件、执行了什么命令。这些统称为'观察记录'(Observations),类似时间序列的项目事件日志。

本地混合存储:结构化 + 全文 + 语义

存储设计很务实:

  • SQLite + FTS5:存结构化数据(会话 ID、文件路径、时间戳)和做全文检索。
  • Chroma 向量库:把摘要向量化,处理模糊问题,比如'上周讨论的那个支付风控策略'。

所有数据统一存放在用户本地目录 ~/.claude-mem/ 下,不走云端。这对隐私敏感行业很重要。从工程角度看,部署成本低,查询灵活,且用户可见可控。

记忆压缩:别把原始流水账端给模型

只存不够,还得压。SessionEnd 阶段会调用 Claude Agent SDK,把累计的 Observations 汇总成结构化摘要,包含调研内容、学习成果、已完成工作和后续步骤。不再把完整原始历史塞进上下文,而是注入高度浓缩后的'记忆索引 + 摘要'。

三层渐进式披露:Token 成本怎么砍到 95%?

核心创新是'三层渐进式披露'。不是一开始就把所有历史端给模型,而是分三层按需解锁。

三层结构长什么样?

层级主要内容Token 开销使用场景
第一层:Search摘要级索引与概要约 50–100 / 结果快速定位相关历史
第二层:Timeline会话 / 事件时间轴中等开销理解前后因果
第三层:Get_Observations完整观察记录详情约 500–1000 / 结果深挖实现细节

流程大概是:用户提问 -> 插件先 Search 找相关摘要 -> 若需更多则拉 Timeline -> 若还不够才调 Get_Observations 拉具体操作记录。

为什么能省 Token?

常规做法要么暴力全扔(Token 爆炸),要么手动翻历史(累且易漏)。三层设计把'召回'和'注入'拆开,优先注入压缩后的高价值摘要。常规场景省 90% Token,无尽模式省 95%。因为 Token 压力下降,工具调用上限也能放宽到原来的 20 倍。体感上就是:同样的预算,AI 陪你做更长时间的活,而且不会越用越傻。

实战效果:不同场景的变化

企业团队:复杂项目的'团队记忆库'

在大型代码库或多团队协作中,它能持续记录模块设计演变、跟踪缺陷修复过程,给新人提供可查询的历史上下文。有团队反馈新人上手时间缩短约 40%,代码评审效率提升约 25%。记忆系统让 AI 真正融入了现有协作流程。

个人开发者:长线 side project 的'自动笔记助手'

你可以用自然语言问之前的决策,比如'上周我重新设计过登录流程,当时用了什么鉴权策略?'。插件能回溯选项、方案和代码范围。打开本地 Web 界面(默认 http://localhost:37777),能看到记忆流和会话摘要。对间歇性推进的个人项目尤其友好。

隐私敏感行业:合规边界怎么守?

金融、医疗等行业担心数据上传云端。Claude-Mem 数据全部本地存储,目录可见可控。支持标签机制,可以给某些内容打上'不要记录'类标签,阻止敏感信息被纳入记忆。你可以自定义'能记什么、不能记什么'。

安装与使用体验

/plugin marketplace add thedotmack/claude-mem /plugin install claude-mem 

执行完插件安装后,重启 Claude Code,大部分功能就能直接用上。无需改动现有工作流,不用写额外脚本,也不用部署后端。多数配置有合理默认值,用起来更像开关一个功能。如果想定制,比如不同项目用不同策略,就需要了解一些配置项和阈值设定。

和其他方案对比

方案类型优点缺点适用场景
传统 RAG 系统功能强大,可接多种数据源部署复杂,依赖额外基础设施企业内部知识库
简单文件注入实现容易,维护成本低缺乏智能检索,容易信息过载小项目
手动复制粘贴不需要额外工具非常耗时,无法扩展偶发需求
Claude-Mem本地混合存储 + 渐进式披露依赖 Claude Code 生态,需调阈值Claude 用户

Claude-Mem 走的是一条'中等复杂度'路线:比简单注入强得多,又比全自研 RAG 系统轻量很多。这也是很多人称之为 IDE 内部实用层面目前最接地气的长期记忆方案。

局限与风险

摘要质量取决于底层模型

记忆压缩靠 Claude Agent SDK 来做。极端复杂场景下,摘要可能会出现信息遗漏。所以在关键决策类项目中,仍有必要保留人类写的设计文档,不能完全依赖自动摘要当唯一真相来源。

对版本和生态有一定依赖

作为插件,需要较新的 Claude Code 版本支持。IDE 更新时可能会遇到兼容性问题。企业大规模部署需要在内部有一套插件版本管理和回滚机制。

需要一点'调参意识'

默认配置可以直接用,但要在复杂项目里顺手,多少需要调一下参数,比如检索阈值、注入上限、不同项目是否需要单独命名空间。既要让 AI 记得你,又不要记得太多,把上下文弄成信息垃圾场。

工程视角:Agent 时代的标配能力雏形

把 Claude-Mem 放在更大背景里,AI Agent 时代,记忆将从加分项变成标配。

记忆应该是分层的

第一层轻量索引适合高频调用,第二层带时间序用来理解过程,第三层完整细节用于审计还原。这逻辑其实跟人脑挺像:先想大概、再回忆过程、最后才是翻日记。

本地优先 + 可控隐私

不是什么东西都能放到云上跑。有些国家监管要求数据必须留在本地,有些企业不接受把源代码交给第三方。Claude-Mem 采用本地数据库 + 本地向量库的实践,证明在很多 IDE AI 场景下,这条路是可行的。

社区驱动的插件生态

模型厂商提供了足够开放的插件能力,社区开发者能在此基础上做出高价值增强功能。开放能力加激励社区,比自己闭门造车往往走得更远。

实用建议

如果你现在就在用 Claude Code,可以按下面几步来实践。

先从一个真实项目开始

不要拿 demo 仓库测感受,建议选一个开发周期至少一周以上、有明确功能演进的项目。开启 Claude-Mem 正常工作一段时间,观察是否减少了重复解释的时间,AI 是否能更准确理解当前任务所处的上下文。

刻意用几次带检索的提问方式

尝试这类问法:'帮我接着上次我们讨论用户权限系统的地方继续完善表结构。'、'列一下过去三天我们在支付模块里改过哪些东西。'这些问题能很好地压测记忆系统的检索与注入效果。

对团队:把记忆系统写进开发规范

如果你是技术负责人,可以考虑统一在某些关键项目上启用 Claude-Mem,约定一些可检索问题模版,定期 review 记忆摘要质量。这样,Claude-Mem 不只是某个工程师自己安装的插件,而是变成团队协作流程的一部分。

结语

Claude-Mem 做的事情不神秘,也谈不上黑科技,但很扎实。它把真实痛点抓得很准,用的是现成可靠的工程手段,设计上有节制感。未来几年,让 AI 真正记住你和在正确时机想起正确的事,会变成所有智能工具绕不过去的基础能力。Claude-Mem 做的,是帮我们先给这块拼图拼了一个还不错的第一版样子。

目录

  1. Claude-Mem:给 Claude Code 装上长期记忆
  2. 概述
  3. 痛点:为什么 AI 编程助手必须要“长期记忆”?
  4. 场景有多难受?
  5. 开发者已经开始自救
  6. Claude-Mem 是什么?
  7. 整体架构:怎么把碎片操作变成记忆?
  8. 事件驱动:不干扰你的关键动作捕获
  9. 本地混合存储:结构化 + 全文 + 语义
  10. 记忆压缩:别把原始流水账端给模型
  11. 三层渐进式披露:Token 成本怎么砍到 95%?
  12. 三层结构长什么样?
  13. 为什么能省 Token?
  14. 实战效果:不同场景的变化
  15. 企业团队:复杂项目的“团队记忆库”
  16. 个人开发者:长线 side project 的“自动笔记助手”
  17. 隐私敏感行业:合规边界怎么守?
  18. 安装与使用体验
  19. 和其他方案对比
  20. 局限与风险
  21. 摘要质量取决于底层模型
  22. 对版本和生态有一定依赖
  23. 需要一点“调参意识”
  24. 工程视角:Agent 时代的标配能力雏形
  25. 记忆应该是分层的
  26. 本地优先 + 可控隐私
  27. 社区驱动的插件生态
  28. 实用建议
  29. 先从一个真实项目开始
  30. 刻意用几次带检索的提问方式
  31. 对团队:把记忆系统写进开发规范
  32. 结语
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 前缀和算法详解:一维、二维及哈希优化应用
  • Jetson Orin NX + Fast-LIO2 自主无人机完整部署方案
  • 在 Trae 和 VS Code 中使用第三方 API 配置 Claude、GPT 及 Gemini 模型
  • Python 生成真随机数的三种安全方式及最佳实践
  • 工业制造企业数字化转型:基于AIGC的社媒矩阵运营系统重构
  • MySQL 中为时间字段设置默认当前时间
  • Ubuntu 系统一键安装 ROS 环境完整流程
  • FPGA 摄像头采集处理显示指南:OV5640 到 HDMI 实时显示
  • 基于 Linphone 的 Android 音视频通话开发实战
  • AI 驱动下内存价格暴涨原因及未来趋势分析
  • GTC 2026 前瞻:Rubin 平台与 AI 工厂化演进
  • 从零开始:在本地搭建一个带知识库的 AI 助手(Ollama + Open WebUI)
  • Gitee 本地账号与密码配置步骤
  • Java 内部类同名变量访问详解及 Comparable 与 Comparator 区别
  • DeepSeek R1 7B 部署至 RK3588:RKLLM 转换与 Web 服务实战
  • Python 音乐推荐系统:Django+Echarts+协同过滤算法
  • Linux 动静态库制作与使用:ar 与 ldconfig 详解
  • 本地部署 Kimi K2 模型:llama.cpp、vLLM 与 Docker 方案
  • SDL3 跨平台开发简明教程:基于 C++ 与 CMake 构建应用
  • 向日葵 MCP 接入 AI:无需额外设备支持多平台远程控制

相关免费在线工具

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online

  • Markdown转HTML

    将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online