PostgreSQL 动态分区裁剪技术：查询性能优化实战

随着数据量从 TB 级向 PB 级演进，数据库查询性能面临严峻挑战。PostgreSQL 凭借其高度可扩展性，在金融、电商等领域广泛应用。但在海量数据场景下，如何通过分区裁剪精准定位目标数据，避免无效扫描，是性能优化的关键突破口。

核心原理与工作流程

PostgreSQL 的分区裁剪分为静态裁剪与动态裁剪两种方式。官方源码 partprune.c 中将其描述为将查询条件转换为 "pruning steps"，在执行时识别需扫描的分区集合。

静态裁剪依赖于编译时已知的常量。当查询语句被解析时，优化器会在计划生成阶段直接排除无关分区。例如按日期范围分区，查询 WHERE order_date = '2026-01-01' 时，能直接定位到对应分区。

动态裁剪则支持运行时过滤。当查询条件涉及参数（如 $1）、子查询或非不可变函数时，PostgreSQL 会在执行阶段根据实际值动态判断。PolarDB 文档进一步将其细分为三个层级：

优化期剪枝：适用于不可变表达式（如常量）
执行期初始剪枝：适用于稳定表达式（如 now()）
执行期运行时剪枝：适用于易变表达式或连接条件

从实现角度看，核心流程包括 SQL 解析生成 AST、调用 gen_partprune_steps() 转换剪枝步骤、通过 perform_pruning_base_step() 确定需扫描分区，最后调整执行计划跳过无关分区。

关键配置与分区策略

总开关控制

enable_partition_pruning 参数是控制分区裁剪功能的总开关。默认值为 on，允许优化器在计划生成和执行阶段尝试裁剪。在参数化查询中，该参数的作用尤为明显：

-- 准备参数化查询
PREPARE get_orders (date, date) AS
SELECT * FROM orders WHERE order_date BETWEEN $1 AND $2;

-- 启用裁剪后，会根据传入参数动态过滤
EXECUTE get_orders('2026-01-01', '2026-01-31');

分区键选择原则

分区键的选择对裁剪效果有决定性影响：

范围分区：适合时间序列或数值范围列（如 order_date），按月或年划分。
列表分区：适合有限数量的离散值（如 region）。
哈希分区：适合均匀分布数据（如用户 ID），但范围查询时存在裁剪局限性。

PostgreSQL 动态分区裁剪技术：查询性能优化实战