KES 数据库运维核心：资源回收与膨胀防治 | 极客日志

SQL

KES 数据库运维核心：资源回收与膨胀防治

KES 数据库长期运行易出现表与索引膨胀，需通过 REINDEX CONCURRENTLY 不停机重建索引，并理解 MVCC 机制下垃圾回收原理。重点排查未开启 autovacuum、触发阈值过高、长事务持有 xmin 等导致膨胀的根因。通过监控活跃会话、调整表级 autovacuum 参数及切分大批量操作，可有效防治膨胀，保障系统稳定性。

BigDataPan发布于 2026/3/20更新于 2026/7/2947 浏览

在这里插入图片描述

在数据库长期运行过程中，表膨胀与索引膨胀是 KingbaseES（KES）DBA 最常面对的隐形杀手。它们悄无声息地蚕食磁盘空间、拖慢查询性能，严重时甚至威胁系统稳定性。本文从索引重建、垃圾回收原理、长事务阻断、autovacuum 精细化调优四个维度，系统梳理 KES 资源回收的核心机制与实战方法。

一、REINDEX CONCURRENTLY：不停机重建膨胀索引

随着业务 DML 语句持续增长，索引会像表一样发生膨胀。膨胀的索引不仅浪费磁盘空间，还会显著降低查询性能——新构建的索引往往比反复更新的旧索引提供更好的访问效率。

为什么不能直接用 REINDEX？

普通 REINDEX 命令需要 ACCESS EXCLUSIVE 锁，这是最高级别的锁，会阻塞一切业务语句，生产环境中几乎不可接受。

解决方案是使用 REINDEX ... CONCURRENTLY，其锁级别降为 SHARE UPDATE EXCLUSIVE，不阻塞 DML 操作，实现业务无感知的索引重建。

REINDEX CONCURRENTLY 的六个执行阶段

阶段	操作内容	关键说明
① 创建新索引	生成临时索引，命名以 idx_ccnew 开头	此时新索引为空，尚未包含数据
② 构建新索引	全表扫描，填充新索引内容	期间新写入数据同步进入新索引
③ 验证新索引	将构建阶段新插入的数据补充进索引	类似 CREATE INDEX CONCURRENTLY 的逻辑
④ 交换索引	新旧索引互换，旧索引标记为 invalid	业务流量切换至新索引
⑤ 标记旧索引为 dead	indislive、indisready、indisvalid 均置为 false	旧索引彻底退出服务
⑥ 删除旧索引	物理清除旧索引占用的磁盘空间	完成整个重建流程

识别异常残留的无效索引

如果 REINDEX CONCURRENTLY 中途失败，可能留下名称含 _ccnew 的无效索引，需及时清理：

SELECT c.relname AS index_name, sys_size_pretty(sys_relation_size(c.oid))
FROM sys_index i JOIN sys_class c ON i.indexrelid = c.oid 
WHERE c.relname LIKE '%_ccnew'
AND NOT indisvalid 
LIMIT 10;

相关免费在线工具

SQL 美化和格式化
在线格式化和美化您的 SQL 查询（它支持各种 SQL 方言）。在线工具，SQL 美化和格式化在线工具，online
SQL转CSV/JSON/XML
解析 INSERT 等受限 SQL，导出为 CSV、JSON、XML、YAML、HTML 表格（见页内语法说明）。在线工具，SQL转CSV/JSON/XML在线工具，online
CSV 工具包
CSV 与 JSON/XML/HTML/TSV/SQL 等互转，单页多 Tab。在线工具，CSV 工具包在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online

-- 初始状态 表大小：73 MB 索引大小：21 MB
-- 10 进程并发持续更新后 表大小：335 MB 索引大小：48 MB

tuples: 0 removed, 2049809 remain, 999991 are dead but not yet removable
tuples: 501373 removed, 2176172 remain, 999991 are dead but not yet removable

BEGIN;
DECLARE c1 CURSOR FOR SELECT 1 FROM sys_class;
-- 游标不关闭，backend_xmin 持续存在
-- 此期间产生的所有垃圾版本均无法回收
CLOSE c1; -- 关闭后 xmin 才释放

BEGIN;
SELECT pg_sleep(1000); -- 执行期间 backend_xmin 持续持有
-- 语句取消或结束后 xmin 才释放

BEGIN WORK ISOLATION LEVEL REPEATABLE READ;
SELECT 1; -- backend_xmin 持续到 COMMIT / ROLLBACK
END;

-- 第一个长事务（xid: 1668525）未结束时 VACUUM (FREEZE, VERBOSE) t2;
-- 结果：0 frozen pages,年龄无法下降
-- "oldest xmin: 1668525"
-- 结束第一个事务后，第二个长事务（xid: 1788896）仍在 VACUUM (FREEZE, VERBOSE) t2;
-- 结果：年龄有所下降，但仍无法归零
-- 两个长事务全部结束后 VACUUM (FREEZE, VERBOSE) t2;
-- 结果：age = 0,完全冻结成功 ✅

-- 监控持有 xmin 的活跃会话（超过 30 分钟）
SELECT datname, usename, query, xact_start, now() - xact_start AS xact_duration, state 
FROM sys_stat_activity 
WHERE state <> 'idle' 
AND (backend_xid IS NOT NULL OR backend_xmin IS NOT NULL) 
AND now() - xact_start > INTERVAL '30 min' 
ORDER BY xact_start;

-- 监控两阶段提交中未提交的预备事务
SELECT gid, prepared, owner, database, transaction AS xmin 
FROM sys_prepared_xacts 
ORDER BY age(transaction) DESC;

-- 监控复制槽是否因备库长事务阻塞 xmin 推进
SELECT * FROM sys_replication_slots ORDER BY age(xmin) DESC;

-- 开启表级 autovacuum 并设置精细化阈值
ALTER TABLE t2 SET (autovacuum_enabled = true);
ALTER TABLE t2 SET (autovacuum_vacuum_threshold = 1);
ALTER TABLE t2 SET (autovacuum_vacuum_scale_factor = 0);
-- 关键：必须同时设置为 0
-- 同理设置 analyze 相关参数
ALTER TABLE t2 SET (autovacuum_analyze_threshold = 1);
ALTER TABLE t2 SET (autovacuum_analyze_scale_factor = 0);

参数组合	触发条件（10 行表）	实际效果
仅设置 threshold=1（全局 scale=0.2）	1+0.2×10=3 条死亡元组	更新 3 条才触发
threshold=1 + scale_factor=0	1+0×10=1 条死亡元组	更新 2 条即触发
threshold=大数 + scale_factor=1	永远不满足	禁用 autoanalyze

索引膨胀 → REINDEX CONCURRENTLY → 不停机重建
表膨胀 → autovacuum 精细调优 → 及时回收死亡元组
长事务 → 主动监控 + 及时终止 → 解除 xmin 阻断
年龄积累 → VACUUM FREEZE → 防止事务 ID 回卷

KES 数据库运维核心：资源回收与膨胀防治

一、REINDEX CONCURRENTLY：不停机重建膨胀索引

为什么不能直接用 REINDEX？

REINDEX CONCURRENTLY 的六个执行阶段

识别异常残留的无效索引

更多推荐文章

相关免费在线工具

二、垃圾回收原理：为什么表会膨胀？

导致膨胀的八大根因

并发批量更新的膨胀实测

三、长事务：阻止 VACUUM 的隐形拦路虎

三类典型的长事务场景

长事务阻止 VACUUM FREEZE 的实测验证

监控长事务的实用 SQL

四、autovacuum 精细化调优：表级参数设置

表级参数配置示例

触发阈值计算逻辑

全局调优建议清单

五、总结：构建 KES 资源回收的完整防线

更多推荐文章

相关免费在线工具

KES 数据库运维核心：资源回收与膨胀防治

一、REINDEX CONCURRENTLY：不停机重建膨胀索引

为什么不能直接用 REINDEX？

REINDEX CONCURRENTLY 的六个执行阶段

识别异常残留的无效索引

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、垃圾回收原理：为什么表会膨胀？

导致膨胀的八大根因

并发批量更新的膨胀实测

三、长事务：阻止 VACUUM 的隐形拦路虎

三类典型的长事务场景

长事务阻止 VACUUM FREEZE 的实测验证

监控长事务的实用 SQL

四、autovacuum 精细化调优：表级参数设置

表级参数配置示例

触发阈值计算逻辑

全局调优建议清单

五、总结：构建 KES 资源回收的完整防线

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具