PythonAI算法

ReMe 与 Mem0 架构对比：AI 记忆管理方案差异

综述由AI生成对比了 ReMe 和 Mem0 两款 AI 记忆管理框架的架构差异。ReMe 侧重于 Agent 上下文管理与文件化工作记忆，通过自动压缩和持久化 Markdown 文件来管理记忆，适合单用户助理及需要上下文压缩的场景。Mem0 定位为 AI 应用的个性化记忆层，采用向量数据库存储结构化事实，支持多用户隔离、知识图谱及丰富的云存储后端，适用于 SaaS 产品及需要用户画像积累的客服场景。两者在触发方式、存储结构、检索能力及集成侵入性上存在显著区别，可根据具体需求选择或结合使用。

微码行者发布于 2026/3/29更新于 2026/5/2323 浏览

一、定位与设计哲学

在深入源码之前，先明确两者的定位差异——这是理解后续所有架构差异的根源。

维度	ReMe	Mem0
一句话定位	Agent 的上下文管理 + 工作记忆框架	AI 应用的个性化记忆层
核心问题	'对话太长，上下文溢出了怎么办？'	'如何记住用户的偏好和事实？'
记忆来源	对话流中自动提取（压缩副产品）	开发者显式调用 `memory.add()`
记忆粒度	文件级（Markdown 文档）	事实级（一条条独立的 fact）
架构风格	框架型（继承、Hook、可选子系统）	服务型（API 调用、托管平台）
开源协议	Apache 2.0	Apache 2.0
背景	AgentScope 团队	Y Combinator S24

ReMe 的哲学：记忆是上下文管理的副产品——对话太长需要压缩，压缩产生的摘要顺便持久化为记忆。记忆的生命周期与对话的生命周期紧密耦合。

Mem0 的哲学：记忆是独立于对话的一等公民——每次交互后主动提取事实，存入独立的记忆库，下次交互前检索出来注入上下文。记忆的生命周期独立于任何具体对话。

二、记忆的写入流程

Mem0：Extract → Search → Decide → Store

Mem0 的记忆写入是一个两阶段 LLM 调用的流程：

# 开发者显式调用 memory.add(messages, user_id="user_123")

内部流程：

第一次 LLM 调用：事实提取 
输入：对话消息 
输出：{"facts": ["Name is John", "Is a Software engineer"]} 
↓ 
对每个 fact 做向量检索，找到相关的已有记忆 
↓ 
第二次 LLM 调用：记忆决策 
输入：新 facts + 已有记忆 
输出：对每条记忆执行 ADD / UPDATE / DELETE / NONE 
↓ 
执行操作：写入向量数据库 + 记录变更历史到 SQLite

核心源码（Memory._add_to_vector_store()）：

# 第一阶段：LLM 提取事实 
system_prompt, user_prompt = get_fact_retrieval_messages(parsed_messages) 
response = .llm.generate_response( 
    messages=[{:,: system_prompt},{:,: user_prompt},], 
    response_format={:},
) 
new_retrieved_facts = json.loads(response)[]


 new_mem  new_retrieved_facts: 
    messages_embeddings = .embedding_model.embed(new_mem,) 
    existing_memories = .vector_store.search( 
        query=new_mem, vectors=messages_embeddings, limit=, filters=search_filters,
    )


function_calling_prompt = get_update_memory_messages( retrieved_old_memory, new_retrieved_facts ) 
response = .llm.generate_response( 
    messages=[{:,: function_calling_prompt}], 
    response_format={:},
)

上下文 token 超限 
↓ 
FbCompactor：压缩上下文（生成摘要替代原始消息） 
↓ 
↓ _compressed_summary（滚动更新） 
FbSummarizer：异步持久化 
↓ 
LLM 按 prompt 指令写入 memory/YYYY-MM-DD.md 
↓ 
FileWatcher 检测变化 → 更新向量索引

维度	Mem0	ReMe
触发方式	开发者显式调用 `memory.add()`	上下文溢出时自动触发
LLM 调用次数	2 次（提取 + 决策）	1 次（压缩/持久化共用）
写入目标	向量数据库（结构化 payload）	Markdown 文件 → FileWatcher → 向量索引
记忆格式	独立的 fact 字符串	按日期组织的文档段落
去重策略	LLM 判断 ADD/UPDATE/DELETE	依赖 FbSummarizer prompt 中的"智能合并"指令

{
  "id":"uuid-xxx",
  "vector":[0.1,0.2,...],
  "payload":{
    "data":"Name is John",
    "user_id":"user_123",
    "agent_id":null,
    "hash":"abc123",
    "created_at":"2025-02-12T...",
    "updated_at":"2025-02-12T..."
  }
}

CREATE TABLE history (
    id TEXT PRIMARY KEY,
    memory_id TEXT,
    old_memory TEXT,
    new_memory TEXT,
    event TEXT,
    created_at DATETIME,
    updated_at DATETIME,
    is_deleted INTEGER,
    actor_id TEXT,
    role TEXT
);

working_dir/
 MEMORY.md ← 长期记忆（用户/Agent 手动维护）
 memory/
  2025-02-12.md ← 每日日志（自动 + 手动）
  2025-02-13.md

维度	Mem0	ReMe
存储介质	向量数据库（Qdrant/Chroma/Pinecone 等 25+ 种）	Markdown 文件 + 可配置向量存储
记忆单元	一条 fact = 向量数据库一条记录	一个文件 = 多个 chunk = 多条向量记录
变更追踪	SQLite 完整变更历史	无（文件被覆盖就丢失旧版本）
人可读性	需要通过 API 查看	直接打开 Markdown 文件
可编辑性	需通过 `memory.update()` API	直接编辑文件，FileWatcher 自动同步

results = memory.search(query="项目语言", user_id="user_123", limit=5)

查询 → Embedding → 向量数据库检索（带 metadata 过滤） 
↓ 
可选：Reranker 重排序 
↓ 
可选：知识图谱实体检索（Neo4j/Kuzu） 
↓ 
合并返回结果

results = memory_search(query="项目语言", max_results=5, min_score=0.1)

查询 → 向量语义搜索（权重 0.7） → BM25 全文检索（权重 0.3） 
↓ 
按 chunk 去重 + 加权融合 + 排序截断 
↓ 
返回 top-N 结果

维度	Mem0	ReMe
检索方式	纯向量 + 可选 Reranker	向量 + BM25 混合
知识图谱	支持（Neo4j/Kuzu/Memgraph）	不支持
过滤能力	丰富（多操作符、逻辑组合）	基础（按文件路径/来源）
精确匹配	依赖向量语义相似度	BM25 擅长精确 token 匹配
多用户隔离	原生支持（user_id/agent_id/run_id）	通过文件目录隔离

已有记忆：["I really like cheese pizza", "User likes to play cricket"] 
新 facts：["Loves chicken pizza", "Loves to play cricket with friends"] 
↓ 
LLM 决策 
结果： 
 "cheese pizza" → UPDATE 为 "Loves cheese and chicken pizza" 
 "play cricket" → UPDATE 为 "Loves to play cricket with friends"

工作流程： 
1. 先 read memory/YYYY-MM-DD.md 
2. 智能合并新信息与现有内容： 
   - 避免重复已记录的信息 
   - 在相关时丰富现有条目的新细节 
   - 在适用时保持时间顺序 
3. 写入更新后的内容

# 用户级记忆（跨 session 持久） 
memory.add("I prefer Python", user_id="user_123")
# Agent 级记忆（Agent 自身的学习） 
memory.add(messages, agent_id="agent_456")
# 运行级记忆（单次 run 内有效） 
memory.add("Current task is data cleaning", run_id="run_789")
# Procedural 记忆（Agent 的行为模式） 
memory.add(messages, agent_id="agent_456", memory_type="procedural_memory")

User --[likes]--> Python 
User --[works_at]--> Google 
Python --[is_a]--> Programming Language

ReMe 项目 
|-- ReMe 类（向量化长期记忆） 
|   |-- PersonalSummarizer 个人记忆 
|   |-- ProceduralSummarizer 程序性记忆 
|   |-- ToolSummarizer 工具记忆 
|   |-- ReMeFb 类（文件化工作记忆） 
|-- MEMORY.md 长期事实 
|-- memory/*.md 每日日志

# Mem0 的典型用法——开发者自己管理上下文 
def chat_with_memories(message, user_id): 
    # 1. 检索记忆 
    relevant_memories = memory.search(query=message, user_id=user_id, limit=3) 
    # 2. 手动注入上下文 
    system_prompt = f"User Memories:\n{memories_str}" 
    # 3. 调用 LLM（上下文管理完全由开发者负责） 
    response = openai_client.chat.completions.create(...) 
    # 4. 保存新记忆 
    memory.add(messages, user_id=user_id)

每次 LLM 推理前（pre_reasoning Hook） 
↓ 
FbContextChecker 检测 token 是否超限 
↓ 
超限 FbCompactor 压缩上下文 
↓ 
同时 FbSummarizer 异步写入 memory/*.md

维度	Mem0	ReMe
上下文压缩	❌ 不支持	✅ 核心能力
自动触发	❌ 需手动调用 add/search	✅ Hook 自动触发
与 Agent 耦合度	低（独立服务）	高（继承/Hook 集成）

config = MemoryConfig(
    llm=LlmConfig(provider="openai", config={"model":"gpt-4o-mini"}),
    embedder=EmbedderConfig(provider="openai"),
    vector_store=VectorStoreConfig(provider="qdrant"),
)
memory = Memory(config=config)

后端	Mem0	ReMe
Qdrant	✅	✅
ChromaDB	✅	✅
Elasticsearch	✅	✅
FAISS	✅	❌
Pinecone	✅	❌
Milvus	✅	❌
pgvector	✅	❌
MongoDB Atlas	✅	❌
Redis	✅	❌
Weaviate	✅	❌
Supabase	✅	❌
SQLite（本地）	❌	✅
JSONL（本地）	❌	✅

from mem0 import Memory 
memory = Memory()
# 完全解耦——在任何框架中都能用 
memory.add("User prefers dark mode", user_id="user_123") 
results = memory.search("UI preferences", user_id="user_123")

from reme import ReMeFb 
class MemoryManager(ReMeFb):
    def __init__(self,...):
        super().__init__( 
            llm_api_key="",# 可选：绕过 ReMe 的 LLM 
            embedding_api_key=key,# 委托 Embedding 给 ReMe...
        )
        # 通过 Hook 集成 
        agent.register_hook("pre_reasoning", MemoryCompactionHook(...))

场景	推荐方案	原因
多用户 SaaS 产品	Mem0	原生多用户隔离，丰富的云存储后端
单用户 AI 助理	ReMe (ReMeFb)	自动上下文管理，文件化记忆透明可控
客服/销售 Agent	Mem0	用户画像积累，跨 session 个性化
开发者 Copilot	ReMe (ReMeFb)	长对话压缩是刚需，代码记忆需要 BM25 精确匹配
需要知识图谱	Mem0	原生 Neo4j/Kuzu 支持
桌面/边缘部署	ReMe	JSONL/SQLite 本地存储，无需云服务
已有 Agent 框架	Mem0	API 调用零侵入，不改架构
从零搭建 Agent	ReMe	框架级集成更深入，上下文管理自动化

  上下文管理  用户画像 
(对话压缩)     (事实提取) 
↑ ↑ 
| | 
ReMe      Mem0 
| | 
↓ ↓ 
文件化工作记忆  结构化向量记忆 
(Markdown + FileWatcher) (向量数据库 + 变更历史)

ReMe 与 Mem0 架构对比：AI 记忆管理方案差异

一、定位与设计哲学

二、记忆的写入流程

Mem0：Extract → Search → Decide → Store

ReMe 与 Mem0 架构对比：AI 记忆管理方案差异

一、定位与设计哲学

二、记忆的写入流程

Mem0：Extract → Search → Decide → Store

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

ReMe：Compress → Summarize → Write File

关键差异

三、记忆的存储结构

Mem0：向量数据库 + SQLite 变更历史

ReMe：Markdown 文件 + 向量索引

关键差异

四、记忆的检索方式

Mem0：向量检索 + 可选 Reranker + 知识图谱

ReMe：向量 + BM25 混合检索

关键差异

五、记忆的去重与更新

Mem0：LLM 驱动的四操作决策

ReMe：Prompt 指令驱动的文件合并

ReMe（ReMe 类）：Draft-Retrieve-Deduplicate

六、记忆的层级与分类

Mem0：三维度记忆空间

ReMe：两套独立子系统

七、上下文管理能力

Mem0：不管理上下文

ReMe：上下文管理是核心

关键差异

八、LLM 与 Embedding 管理

Mem0：自管理所有模型

ReMe：支持外部 LLM 委托

九、向量存储生态

十、集成方式与侵入性

Mem0：零侵入的 API 调用

ReMe：深度集成的框架模式

十一、适用场景对比

十二、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

ReMe（`ReMe` 类）：Draft-Retrieve-Deduplicate