MySQL 索引及其底层数据结构详解 | 极客日志

SQL算法

MySQL 索引及其底层数据结构详解

综述由AI生成MySQL 索引原理及底层数据结构。核心指出 InnoDB 与 MyISAM 基于 B+ 树实现，对比了 B 树、哈希表等结构的优劣，解释了 B+ 树在磁盘 I/O、范围查询及数据一致性上的优势。文章还梳理了主键、唯一、联合等常见索引类型的使用规则，分析了索引失效场景（如函数运算、模糊查询），并提供了区分度优化、覆盖索引及 EXPLAIN 验证等实战技巧，旨在帮助开发者高效设计数据库索引。

DevOpsTeam发布于 2026/3/30更新于 2026/5/2529 浏览

MySQL 索引

索引的定义

MySQL 索引是帮助数据库高效获取数据的排好序的数据结构，核心作用是：

将无序的原始数据，通过特定结构组织成'可快速检索'的形式；
避免全表扫描（Full Table Scan），直接定位目标数据的物理位置；
类比：书籍的目录（通过目录快速找到章节，而非逐页翻找）。

索引的核心价值与代价

核心价值	核心代价
极快的查询速度（SELECT）	写入性能下降（INSERT/UPDATE/DELETE）
减少磁盘 I/O 次数	占用额外磁盘空间（索引文件）
排序/分组操作加速	索引维护成本（数据变更需更新索引）

关键结论：索引是'空间换时间'的设计——用额外的磁盘空间和写入开销，换取查询性能的大幅提升。

MySQL 索引的底层数据结构：为什么是 B+ 树？

MySQL 主流存储引擎（InnoDB/MyISAM）的索引底层均基于B+ 树实现，而非数组、链表、哈希表或红黑树。要理解这一点，需先对比常见数据结构的优劣，再拆解 B+ 树的设计精髓，尤其要搞懂：为什么 MySQL 选择 B+ 树而非 B 树？

常见数据结构对比（为什么不选它们？）

数据结构	优点	缺点（不适合 MySQL 索引）
数组（有序）	二分查找效率高（O(logn)）	插入/删除需移动大量数据，维护成本高
链表	插入/删除便捷	查询需遍历（O(n)），效率极低
哈希表	等值查询极致快（O(1)）	不支持范围查询（如>、<、BETWEEN）；无序
红黑树（二叉树）	插入/查询均为 O(logn)	树高过高（百万数据需 20 层），磁盘 I/O 次数多
B 树（多路平衡树）	树高更低	数据分散在所有节点，范围查询需回溯；叶子节点无链表

问题：为什么用 B+ 树而不用 B 树？

B 树和 B+ 树同属'多路平衡树'，但 B+ 树针对数据库的'磁盘 I/O 特性'和'业务查询场景'做了关键优化，二者的核心差异及选择 B+ 树的原因如下：

数据存储位置：B+ 树数据仅在叶子节点，B 树分散在所有节点

B 树结构：每个节点（包括非叶子节点、叶子节点）都存储'索引值 + 实际数据'，导致非叶子节点能容纳的索引项数量大幅减少，树高更高；示例：16KB 的磁盘页，B 树节点若存储数据，仅能存 10 个索引项，百万数据需 5 层树；
B+ 树结构：非叶子节点仅存储'索引值 + 子节点指针'，不存实际数据，可容纳更多索引项，树高显著降低；示例：同样 16KB 磁盘页，B+ 树非叶子节点可存 1000 个索引项，百万数据仅需 3 层树。

核心优势：树高越低，磁盘 I/O 次数越少（每次访问节点需一次 I/O），查询效率呈指数级提升。

范围查询：B+ 树叶子节点链表，B 树需回溯父节点

B 树范围查询：若要查询 id BETWEEN 100 AND 200，找到 100 后需回溯父节点，再遍历子节点，多次 I/O 且逻辑复杂；

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
SQL 美化和格式化
在线格式化和美化您的 SQL 查询（它支持各种 SQL 方言）。在线工具，SQL 美化和格式化在线工具，online
SQL转CSV/JSON/XML
解析 INSERT 等受限 SQL，导出为 CSV、JSON、XML、YAML、HTML 表格（见页内语法说明）。在线工具，SQL转CSV/JSON/XML在线工具，online
CSV 工具包
CSV 与 JSON/XML/HTML/TSV/SQL 等互转，单页多 Tab。在线工具，CSV 工具包在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

维度	InnoDB（聚簇索引）	MyISAM（非聚簇索引）
叶子节点存储内容	主键索引：直接存储整行数据；二级索引：存储主键值	所有索引：存储数据的物理磁盘地址（偏移量）
索引与数据的关系	数据即索引，索引即数据（聚簇）	索引和数据分开存储（非聚簇）
主键要求	必须有主键（无则自动生成隐藏主键）	无强制主键要求

失效场景	示例 SQL	解决方案
字段类型不匹配	`WHERE phone = 13800138000`（phone 是 VARCHAR）	加引号：`WHERE phone = '13800138000'`
使用函数/运算	`WHERE SUBSTR(name,1,1) = '张'`	改为前缀查询：`WHERE name LIKE '张%'`
模糊查询以%开头	`WHERE name LIKE '%张三'`	改用全文索引，或调整查询逻辑
联合索引违反最左前缀	索引 `(a,b)`，查询 `WHERE b = 1`	调整查询条件（加 a）或索引顺序
OR 条件包含无索引字段	`WHERE a = 1 OR c = 2`（仅 a 有索引）	给 c 加索引，或拆分为两个查询
NULL 值判断（某些场景）	`WHERE age IS NULL`	改用默认值（如 0）代替 NULL

-- 索引`(id, name)`，查询仅需索引即可完成（覆盖索引）
SELECT id, name FROM user WHERE id = 100;
-- 对比：查询 age 需回表（索引仅含 id,name）
SELECT id, name, age FROM user WHERE id = 100;

-- 失效：索引列参与运算
SELECT * FROM order WHERE id + 1 = 100;
-- 有效：调整为常量运算
SELECT * FROM order WHERE id = 99;

-- 分析查询语句的执行计划
EXPLAIN SELECT * FROM user WHERE phone = '13800138000';

MySQL 索引及其底层数据结构详解

MySQL 索引

索引的定义

索引的核心价值与代价

MySQL 索引的底层数据结构：为什么是 B+ 树？

常见数据结构对比（为什么不选它们？）

问题：为什么用 B+ 树而不用 B 树？

数据存储位置：B+ 树数据仅在叶子节点，B 树分散在所有节点

范围查询：B+ 树叶子节点链表，B 树需回溯父节点

更多推荐文章

相关免费在线工具

数据访问一致性：B+ 树所有查询最终落到叶子节点

更新效率：B+ 树非叶子节点无数据，更新成本更低

B+ 树：为磁盘 I/O 优化的多路平衡树

B+ 树的核心特性

InnoDB 和 MyISAM 的 B+ 树差异

哈希索引（Memory 引擎）

MySQL 常见索引类型：适用场景与使用规则

主键索引（PRIMARY KEY）

唯一索引（UNIQUE）

普通索引（INDEX）

联合索引（复合索引）

全文索引（FULLTEXT）

空间索引（SPATIAL）

索引实战避坑与优化技巧

索引失效的常见场景

索引优化核心原则

（1）优先创建'区分度高'的索引

（2）避免过度索引

（3）覆盖索引（Using Index）

（4）避免索引列使用函数/运算

索引有效性验证

总结

更多推荐文章

相关免费在线工具

MySQL 索引及其底层数据结构详解

MySQL 索引

索引的定义

索引的核心价值与代价

MySQL 索引的底层数据结构：为什么是 B+ 树？

常见数据结构对比（为什么不选它们？）

问题：为什么用 B+ 树而不用 B 树？

数据存储位置：B+ 树数据仅在叶子节点，B 树分散在所有节点

范围查询：B+ 树叶子节点链表，B 树需回溯父节点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

数据访问一致性：B+ 树所有查询最终落到叶子节点

更新效率：B+ 树非叶子节点无数据，更新成本更低

B+ 树：为磁盘 I/O 优化的多路平衡树

B+ 树的核心特性

InnoDB 和 MyISAM 的 B+ 树差异

哈希索引（Memory 引擎）

MySQL 常见索引类型：适用场景与使用规则

主键索引（PRIMARY KEY）

唯一索引（UNIQUE）

普通索引（INDEX）

联合索引（复合索引）

全文索引（FULLTEXT）

空间索引（SPATIAL）

索引实战避坑与优化技巧

索引失效的常见场景

索引优化核心原则

（1）优先创建'区分度高'的索引

（2）避免过度索引

（3）覆盖索引（Using Index）

（4）避免索引列使用函数/运算

索引有效性验证

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具