MySQL MVCC 多版本并发控制原理 | 极客日志

SQL算法

MySQL MVCC 多版本并发控制原理

综述由AI生成深入解析 MySQL InnoDB 的 MVCC 机制。核心组件包括隐藏字段（DB_TRX_ID、DB_ROLL_PTR）、Undo Log 版本链及 Read View 快照。文章详细说明了可见性判断规则，区分了 RC 与 RR 隔离级别下 Read View 的生成时机差异，并对比了快照读与当前读的行为。此外，还阐述了 MVCC 对脏读、不可重复读的解决能力及其在幻读场景下的局限性。

萤火微光发布于 2026/3/30更新于 2026/5/2928 浏览

一、为什么需要 MVCC？从一个故事说起

1.1 没有并发控制的世界

想象一个银行账户系统，张三的账户余额是 1000 元。

场景一：同时读写

时刻	线程 A（转账）	线程 B（查询）
T1	读取余额：1000
T2		读取余额：1000
T3	扣款 200，更新为 800
T4		显示余额：1000（旧值！）

线程 B 看到了一个"过时"的数据。这叫做脏读或不可重复读问题。

场景二：同时写

时刻	线程 A（转入 500）	线程 B（扣款 200）
T1	读取余额：1000
T2		读取余额：1000
T3	1000+500=1500，写入
T4		1000-200=800，写入（覆盖了 A！）

最终余额是 800，线程 A 的转入操作被"丢失"了。这叫做更新丢失问题。

1.2 最简单的解决方案：加锁

最直观的解决方案是加锁：谁在操作数据，其他人都等着。

线程 A 拿到锁 → 读 1000 → 改成 800 → 释放锁 ↓ 线程 B 拿到锁 → 读 800 → ...

问题：这太慢了！

读和读之间本来不冲突，也要排队
一个长事务会阻塞所有其他事务
在高并发系统中，性能完全无法接受

1.3 MVCC 的思路：空间换时间

MVCC（Multi-Version Concurrency Control，多版本并发控制）的核心思想是：

不加锁，而是给数据保留多个版本。每个事务看到的是属于自己的"快照"，互不干扰。

就像 Git 一样：

你在 feature-A 分支改代码，我在 feature-B 分支改代码
我们各自看到自己版本的代码，互不影响
最终合并时才需要解决冲突

MVCC 让数据库实现了：

读不阻塞写：你在读旧版本，我可以同时写新版本
写不阻塞读：我在写新数据，你照样能读到你该看到的版本
只有写和写之间才需要加锁

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
SQL 美化和格式化
在线格式化和美化您的 SQL 查询（它支持各种 SQL 方言）。在线工具，SQL 美化和格式化在线工具，online
SQL转CSV/JSON/XML
解析 INSERT 等受限 SQL，导出为 CSV、JSON、XML、YAML、HTML 表格（见页内语法说明）。在线工具，SQL转CSV/JSON/XML在线工具，online
CSV 工具包
CSV 与 JSON/XML/HTML/TSV/SQL 等互转，单页多 Tab。在线工具，CSV 工具包在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

字段名	大小	含义
`DB_TRX_ID`	6 字节	最后修改这行的事务 ID
`DB_ROLL_PTR`	7 字节	回滚指针，指向 undo log 中这行的上一个版本
`DB_ROW_ID`	6 字节	隐藏主键（如果表没有主键才会有）

id	name	DB_TRX_ID	DB_ROLL_PTR
1	张三	100	0x12345678

当前数据（最新版本）
↓ DB_ROLL_PTR
Undo Log（上一个版本）
↓ DB_ROLL_PTR
Undo Log（更早的版本）
↓ DB_ROLL_PTR
Undo Log（最初版本）
↓ NULL

版本链：
┌─────────────────────────────────────┐
│ 当前数据：name='王五', TRX_ID=300    │
└─────────────┬───────────────────────┘
              ↓ ROLL_PTR
┌─────────────────────────────────────┐
│ Undo Log: name='李四', TRX_ID=200   │
└─────────────┬───────────────────────┘
              ↓ ROLL_PTR
┌─────────────────────────────────────┐
│ Undo Log: name='张三', TRX_ID=100   │
└─────────────┴───────────────────────┘
              ↓ ROLL_PTR = NULL（最初版本）

字段	含义
`m_ids`	当前所有活跃（未提交）事务的 ID 列表
`min_trx_id`	`m_ids` 中的最小值（最老的活跃事务）
`max_trx_id`	下一个将要分配的事务 ID（当前最大事务 ID + 1）
`creator_trx_id`	创建这个 Read View 的事务自己的 ID

m_ids = [200, 300] // 当前活跃的事务
min_trx_id = 200   // 活跃事务中最小的
max_trx_id = 401   // 下一个要分配的事务 ID
creator_trx_id = 400 // 自己的 ID

如果 DB_TRX_ID == creator_trx_id → 可见（是我自己改的）

如果 DB_TRX_ID < min_trx_id → 可见（这个事务在我创建 Read View 之前就提交了）

如果 DB_TRX_ID >= max_trx_id → 不可见（这个事务是在我之后才开始的）

如果 min_trx_id <= DB_TRX_ID < max_trx_id
    如果 DB_TRX_ID 在 m_ids 列表中 → 不可见（这个事务还没提交）
    否则 → 可见（这个事务已经提交了）

  读取一行数据
      ↓
  获取该行的 DB_TRX_ID
      ↓
┌───────────────┴───────────────┐
      ↓                       ↓
DB_TRX_ID == 自己？        DB_TRX_ID < min_trx_id？
      ↓                       ↓
  是                       是
【可见】                  【可见】
      ↓                       ↓
  否                       否
└───────────────┬───────────────┘
                ↓
        DB_TRX_ID >= max_trx_id？
                ↓
            是
        【不可见】
                ↓
            否
        DB_TRX_ID 在 m_ids 中？
                ↓
            是
        【不可见】
                ↓
            否
        【可见】

id=1, name='张三', DB_TRX_ID=50, DB_ROLL_PTR=NULL

事务	操作
事务 100	读取 id=1
事务 200	修改 name='李四'
事务 300	读取 id=1

-- 事务 200
BEGIN;
UPDATE user SET name = '李四' WHERE id = 1;
-- 注意：还没有 COMMIT！

当前数据：name='李四', DB_TRX_ID=200, DB_ROLL_PTR → Undo Log
↓ Undo Log: name='张三', DB_TRX_ID=50, DB_ROLL_PTR=NULL

-- 事务 100
BEGIN;
SELECT name FROM user WHERE id = 1;

m_ids = [200]          // 事务 200 正在活跃
min_trx_id = 200
max_trx_id = 301       // 下一个事务 ID
creator_trx_id = 100

-- 事务 200
COMMIT;

-- 事务 300
BEGIN;
SELECT name FROM user WHERE id = 1;

m_ids = []             // 事务 200 已经提交，没有活跃事务了
min_trx_id = ∞         // m_ids 为空，设为无穷大（简化理解）
max_trx_id = 301
creator_trx_id = 300

事务	读取时机	看到的值	原因
事务 100	事务 200 未提交时	张三	200 在活跃列表中，不可见
事务 300	事务 200 已提交后	李四	200 不在活跃列表中，可见

-- 事务 A
BEGIN;
SELECT name FROM user WHERE id = 1; -- 生成 Read View #1
-- ... 等一会儿，事务 B 提交了 ...
SELECT name FROM user WHERE id = 1; -- 生成 Read View #2（新的！）
COMMIT;

-- 事务 A
BEGIN;
SELECT name FROM user WHERE id = 1; -- 生成 Read View #1
-- ... 事务 B 提交了修改 ...
SELECT name FROM user WHERE id = 1; -- 复用 Read View #1（不是新的！）
COMMIT;

隔离级别	Read View 生成时机	同一事务内多次读
READ COMMITTED	每次 SELECT 都生成新的	可能读到不同值
REPEATABLE READ	第一次 SELECT 生成，后续复用	保证读到相同值

问题	是否解决	说明
脏读	✅ 解决	未提交的事务对其他事务不可见
不可重复读	✅ 解决（RR 级别）	Read View 锁定快照
读阻塞写	✅ 解决	读的是历史版本，写的是当前版本
写阻塞读	✅ 解决	同上

-- 事务 A
BEGIN;
SELECT COUNT(*) FROM user WHERE age > 20; -- 结果：5 条
-- 事务 B 插入一条 age=25 的新数据并提交
SELECT COUNT(*) FROM user WHERE age > 20; -- 结果可能还是 5 条（MVCC 保护）
-- 但如果事务 A 执行 UPDATE：
UPDATE user SET status=1 WHERE age > 20; -- 会更新 6 条！包括事务 B 插入的
SELECT COUNT(*) FROM user WHERE age > 20; -- 结果变成 6 条了！

-- 普通的 SELECT 就是快照读
SELECT * FROM user WHERE id = 1;

-- 以下都是当前读，会加锁
SELECT * FROM user WHERE id = 1 FOR UPDATE; -- 加排他锁
SELECT * FROM user WHERE id = 1 LOCK IN SHARE MODE; -- 加共享锁
INSERT INTO user VALUES (...); -- 加排他锁
UPDATE user SET name = 'x' WHERE id = 1; -- 加排他锁
DELETE FROM user WHERE id = 1; -- 加排他锁

类型	读取版本	是否加锁	典型语句
快照读	历史快照	不加锁	`SELECT ...`
当前读	最新版本	加锁	`SELECT ... FOR UPDATE`, `INSERT`, `UPDATE`, `DELETE`

维度	MVCC	乐观锁
层面	数据库引擎层实现	应用层实现
冲突检测	通过版本链判断可见性	通过版本号/时间戳检测
用途	读写并发控制	写写冲突检测
代码	无需修改业务代码	需要在代码中加版本判断

概念	一句话解释
MVCC	多版本并发控制，读写不阻塞
DB_TRX_ID	每行数据记录"谁最后改的我"
DB_ROLL_PTR	指向 Undo Log 中的上一个版本
Undo Log	存储数据的历史版本，形成版本链
Read View	事务的快照，记录活跃事务列表
快照读	普通 SELECT，走 MVCC，不加锁
当前读	FOR UPDATE/INSERT/UPDATE/DELETE，加锁
RC vs RR	RC 每次 SELECT 新建 Read View；RR 只建一次

MySQL MVCC 多版本并发控制原理

一、为什么需要 MVCC？从一个故事说起

1.1 没有并发控制的世界

1.2 最简单的解决方案：加锁

1.3 MVCC 的思路：空间换时间

更多推荐文章

相关免费在线工具

二、MVCC 的核心组件

2.1 隐藏字段：每行数据的"身份证"

2.2 Undo Log：数据的"历史档案馆"

2.3 Read View：事务的"快照时刻"

三、MVCC 的可见性判断（核心！）

3.1 判断规则

3.2 完整的判断流程图

3.3 如果不可见怎么办？

四、实战举例：一步步模拟 MVCC

场景设定

执行过程

总结

五、Read View 的生成时机：RC vs RR

5.1 READ COMMITTED（读已提交，RC）

5.2 REPEATABLE READ（可重复读，RR）

5.3 对比表格

六、MVCC 解决了哪些问题？没解决哪些？

6.1 MVCC 解决的问题

6.2 MVCC 没有解决的问题

6.3 写 - 写冲突

七、快照读 vs 当前读

7.1 快照读（Snapshot Read）

7.2 当前读（Current Read）

八、常见面试问题与回答

问题：请解释一下 MySQL 的 MVCC 机制？

九、常见面试追问

Q1：Undo Log 会无限增长吗？什么时候清理？

Q2：MVCC 和锁是什么关系？

Q3：为什么 InnoDB 默认用 RR 而不是 RC？

Q4：MVCC 和乐观锁有什么区别？

十、总结

更多推荐文章

相关免费在线工具

MySQL MVCC 多版本并发控制原理

一、为什么需要 MVCC？从一个故事说起

1.1 没有并发控制的世界

1.2 最简单的解决方案：加锁

1.3 MVCC 的思路：空间换时间

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、MVCC 的核心组件

2.1 隐藏字段：每行数据的"身份证"

2.2 Undo Log：数据的"历史档案馆"

2.3 Read View：事务的"快照时刻"

三、MVCC 的可见性判断（核心！）

3.1 判断规则

3.2 完整的判断流程图

3.3 如果不可见怎么办？

四、实战举例：一步步模拟 MVCC

场景设定

执行过程

总结

五、Read View 的生成时机：RC vs RR

5.1 READ COMMITTED（读已提交，RC）

5.2 REPEATABLE READ（可重复读，RR）

5.3 对比表格

六、MVCC 解决了哪些问题？没解决哪些？

6.1 MVCC 解决的问题

6.2 MVCC 没有解决的问题

6.3 写 - 写冲突

七、快照读 vs 当前读

7.1 快照读（Snapshot Read）

7.2 当前读（Current Read）

八、常见面试问题与回答

问题：请解释一下 MySQL 的 MVCC 机制？

九、常见面试追问

Q1：Undo Log 会无限增长吗？什么时候清理？

Q2：MVCC 和锁是什么关系？

Q3：为什么 InnoDB 默认用 RR 而不是 RC？

Q4：MVCC 和乐观锁有什么区别？

十、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具