从 Query Mapping 到函数缓存，KingbaseES 高级 SQL 调优手段全揭秘

Ne0inhk

28 Feb 2026 — 13 min read

前言

在数据库性能优化这块，SQL 调优绝对是提升系统响应速度、降低资源消耗的核心操作！KingbaseES 作为能兼容 Oracle 的企业级数据库，把从 SQL 语句改写、执行计划干预到结果集缓存的优化全给覆盖到了，一套高级调优工具直接拉满。今天就带大家手把手拆解 Query Mapping、物化视图、并行查询、函数结果集缓存这些关键调优手段，再配上实打实的实战代码，不管你是数据库管理员还是开发同学，都能快速上手这些高性能优化技巧！

一、Query Mapping：不用改代码的 SQL“智能替换”神器

Query Mapping 绝对是 KingbaseES 里灵活性拉满的调优工具！简单说就是提前定义好“源 SQL”和“目标 SQL”的对应关系，你输入的 SQL 只要和源 SQL 匹配，就会自动换成目标 SQL 执行，不用动一行应用代码就能完成性能优化，简直不要太方便！

核心特性与适用场景

支持两种匹配级别：TEXT 级会保留原始语法，连注释都不会丢，还能搭配 HINT 一起用；SEMANTICS 级会做语法语义校验，严谨度直接拉满。
常见用法：把写得不够高效的 SQL 改成等价的高效语句、异构数据库迁移时做语法转换、批量调整查询条件（比如把过滤条件下推，减少中间数据量）。

实战代码示例

1. 先把功能开起来

要想用这个功能，得先在 kingbase.conf 里配置一下，开启后重启数据库就行：

enable_query_rule =on

2. 优化过滤条件，少返回点数据

比如原本查询 id<10，想改成 id<5 来减少结果集大小，直接创建映射规则就行：

-- 创建映射规则：qm1 是规则名，TEXT 级别匹配SELECT create_query_rule('qm1','select id,val from t1 where id<$1',-- 源 SQL（带变量$1）'select id from t1 where id<($1-5)',-- 目标 SQL（对变量做运算）true,-- 规则启用'text'-- 匹配级别);-- 执行源 SQL，会自动触发替换select id,val from t1 where id<10;-- 实际执行的是：select id from t1 where id<5，返回 id=1-4 的数据，少传不少数据！

3. UNION 转 UNION ALL，告别多余去重

如果数据本身不会重复，用 UNION 会多做一次去重操作，特别耗时。用 Query Mapping 自动转换成 UNION ALL，效率直接翻倍：

-- 创建映射规则SELECT create_query_rule('union_opt','select * from t1 union select * from t2','select * from t1 union all select * from t2',true,'semantics');-- 执行查询，自动用 UNION ALL 执行，不用再做无用的去重了select*from t1 unionselect*from t2;

4. 条件下推，优化 UNION 子查询

有时候 UNION 子查询外面还有连接条件，把条件下推到子查询里，能少传很多中间数据，效率提升超明显：

SELECT create_query_rule('push_down','SELECT count(0) FROM t1, (select * from t2 where val>$1 union select * from t1 where val<$2) as v where t1.id=v.id','SELECT count(0) FROM t1, lateral(select * from t2 where val>$1 and t1.id=t2.id union select * from t1 t where t.val<$2 and t.id=t1.id) as v',true,'text');-- 执行优化后的查询，中间结果集小了，速度自然快了SELECTcount(0)FROM t1,(select*from t2 where val>5unionselect*from t1 where val<20)as v where t1.id=v.id;

5. 变量交换与多表关联优化（新增实用示例）

如果想交换查询条件里的变量顺序，或者给多表关联加个精准过滤，也能通过映射规则实现：

-- 变量交换：把 t2.id<$1 和 t2.val=$2 的条件交换变量SELECT create_query_rule('var_swap','select * from t2 where t2.id<$1 and t2.val=$2','select * from t2 where t2.id<$2 and t2.val=$1',true,'text');-- 执行查询，自动交换变量条件，不用改业务代码select*from t2 where t2.id<50and t2.val=5;-- 多表关联过滤优化：增加 t2.id=$2 条件，精准过滤无用数据SELECT create_query_rule('join_filter','select * from t1, t2 where t1.id=t2.id and t1.id<$1 and t2.val=$2','select * from t1, t2 where t1.id=t2.id and t1.id<$1 and t2.val=$2 and t2.id=$2',true,'text');-- 执行多表查询，自动添加过滤条件，返回结果更精准select*from t1, t2 where t1.id=t2.id and t1.id<30and t2.val=5;

常用操作函数

函数名	功能描述
create_query_rule(规则名, 源SQL, 目标SQL, 启用状态, 级别)	创建映射规则
drop_query_rule(规则名)	删除指定规则
enable/disable_query_rule(规则名)	启用/禁用规则

二、物化视图：高频复杂查询的“预计算缓存”

物化视图会把查询结果集实实在在存起来——数据量小就放内存，大了就存磁盘，不用每次查询都重复执行耗时的表连接、聚集操作。特别适合基表数据更新不频繁，但查询又特别频繁的场景，比如统计报表，查一次能快好几倍！

核心原理与限制

存储方式：数据落地存储，支持手动全量刷新或增量刷新，不过 KingbaseES 目前还不支持自动刷新，基表数据变了记得手动刷一下。
适用场景：统计报表查询、多表关联查询、外部表数据缓存（把外部表数据存下来，不用每次都远程读取，省不少时间）。

实战代码示例

1. 创建物化视图（多表关联场景）

先准备两张基表，再创建物化视图存储按区域统计的订单数据，后续查询直接读视图就行：

-- 基表准备createtable order_info(order_id intprimarykey, user_id int, amount numeric, create_time timestamp);createtable user_info(user_id intprimarykey, user_name text, region text);-- 插入测试数据insertinto user_info select generate_series(1,1000),'user_'||generate_series(1,1000),'region_'||(generate_series(1,1000)%10);insertinto order_info select generate_series(1,10000),(random()*1000)::int+1, random()*1000,now()-(random()*30)::interval;-- 创建物化视图：按区域统计订单数量和总金额，预计算好结果create materialized view region_order_stats asselect u.region,count(o.order_id)as order_count,sum(o.amount)as total_amount from user_info u join order_info o on u.user_id = o.user_id groupby u.region;

2. 刷新物化视图（数据更新后）

基表数据变了之后，得刷新物化视图才能拿到最新数据，两种刷新方式按需选：

-- 全量刷新（数据变动大时用，直接重新计算所有数据） refresh materialized view region_order_stats;-- 增量刷新（只更改变动的数据，效率更高，不用等太久） refresh materialized view concurrently region_order_stats;

3. 物化视图加索引，查询更快

为了让物化视图的查询速度再提一档，可以给它创建索引，针对性优化查询条件：

-- 给物化视图的 region 列创建索引，按区域查询时直接走索引createindex idx_region_order_stats_region on region_order_stats(region);-- 查询时会自动使用索引，毫秒级就能返回结果select*from region_order_stats where region='region_0';

4. 性能对比：物化视图 vs 原始查询

直观感受下优化效果，差距真的很明显：

-- 直接查询物化视图（毫秒级响应，预计算的结果直接用）select*from region_order_stats where region='region_0';-- 对比原始查询（需要实时关联两张表计算，耗时直接翻倍）select u.region,count(o.order_id),sum(o.amount)from user_info u join order_info o on u.user_id = o.user_id where u.region='region_0'groupby u.region;

三、并行查询：用多核 CPU 给 SQL 加速

KingbaseES 支持把单个 SQL 语句分给多个 Worker 进程并行执行，能把多核 CPU 的性能充分利用起来。像大表扫描、哈希连接、聚集这些耗时操作，用并行查询能明显提速，有时候甚至能快好几倍！

核心配置与参数

要开启并行查询，先在 kingbase.conf 里配置好这些参数，根据自己的服务器配置调整：

max_worker_processes =16-- 最大后台进程数 max_parallel_workers =8-- 最大并行 Worker 数 max_parallel_workers_per_gather =4-- 每个查询最多能用的并行 Worker 数 min_parallel_table_scan_size =8MB -- 表至少这么大才会触发并行

实战代码示例

1. 并行全表扫描（大表必备）

创建一张 1000 万行的大表，用并行查询加速扫描，不用等半天：

-- 创建大表（1000万行，模拟真实大表场景）createtable big_table(id intprimarykey, content text, create_time timestamp);insertinto big_table select generate_series(1,10000000), md5(random()::text),now()-(random()*100)::interval;analyze big_table;-- 更新统计信息，让优化器知道表有多大-- 用 HINT 指定 4 个 Worker 并行查询，效率直接拉满explainanalyzeselect/*+Parallel(big_table 4)*/*from big_table where create_time >'2024-01-01';

2. 并行哈希连接（大表+小表组合）

大表和小表连接时，用并行哈希连接效率更高，不用串行等一个进程处理：

-- 创建小表createtable small_table(id intprimarykey, category text);insertinto small_table select generate_series(1,1000),'cat_'||(generate_series(1,1000)%20);-- 并行哈希连接查询，大表并行扫描，小表做哈希，连接速度飞快explainanalyzeselect/*+Parallel(big_table 2)*/ b.*, s.category from big_table b join small_table s on b.id = s.id where b.create_time >'2024-01-01';

3. 并行聚集计算（统计数据必备）

统计订单总金额这种操作，用并行聚集能省不少时间，不用单个进程慢慢算：

-- 并行统计 2024 年 1-4 月的订单总金额，多个 Worker 一起算explainanalyzeselect/*+Parallel(order_info 3)*/sum(amount)as total from order_info where create_time between'2024-01-01'and'2024-04-01';

关键注意事项

Worker 进程数不是越多越好：太多进程会互相抢资源、增加通信开销，比如 8 核 CPU 设 4-6 个就差不多了，多了反而变慢。
小结果集别用并行：如果查询返回的数据占表总量 50% 以上，优化器可能会直接选全表扫描，比并行更高效，不用强行开并行。

四、函数结果集缓存：重复调用的函数不用再重复执行

如果函数是 immutable（结果永远不变）或 stable（同一事务中结果不变）类型，KingbaseES 会把它的执行结果缓存起来。同一 SQL 中多次调用相同参数的函数，会直接复用缓存结果，不用重复执行，能省不少 CPU 资源！

核心条件与配置

缓存条件：函数属性是 immutable 或 stable、返回单个值、入参不超过 16 个，满足这些就能缓存。

控制参数：

function_result_cache =on-- 启用函数缓存 function_cache_number =1000-- 最多缓存 1000 个结果

实战代码示例

1. 创建可缓存函数

先创建一个根据用户 ID 获取区域的 stable 类型函数，满足缓存条件：

createorreplacefunction get_user_region(user_id int)returnstextas $$ select region from user_info where user_id = $1; $$ languagesql stable;-- 开启函数缓存，让配置生效set function_result_cache =on;

2. 复用缓存结果（同一 SQL 多次调用）

同一 SQL 中多次调用相同参数的函数，第二次直接用缓存，不用再查数据库：

-- 同一 SQL 中两次调用 get_user_region，参数相同，第二次复用缓存select order_id, get_user_region(user_id)as region1, get_user_region(user_id)as region2 -- 复用缓存，不重复执行函数from order_info where order_id <100;

3. 验证缓存效果（看执行次数就知道）

通过系统表查看函数执行次数，缓存命中后次数不会增加，一眼就能验证效果：

-- 先执行几次查询，触发函数调用select get_user_region(1)from order_info where order_id <10;select get_user_region(1)from order_info where order_id <20;-- 查看函数执行统计，calls 列是执行次数，缓存命中后次数不会变select funcname, calls from sys_stat_user_functions where funcname='get_user_region';

4. 临时禁用函数缓存（特殊场景用）

如果某些场景不想用缓存，也能临时禁用，灵活调整：

-- 禁用函数缓存set function_result_cache =off;-- 再次执行查询，函数会重复执行，不会复用之前的缓存select get_user_region(1)from order_info where order_id <10;

五、其他高级调优手段补充

1. 分区表执行计划优化

如果分区表的子表数量很多，生成执行计划会变慢，用这个参数控制一下，快速生成计划：

-- 子表数超过 30 时，启用快速生成执行计划，不用等太久set partition_table_limit =30;

2. 逻辑优化规则（kdb_rbo 插件）

启用 kdb_rbo 插件，能自动优化 count(distinct)、合并子查询公共表达式，不用手动改 SQL：

-- kingbase.conf 配置，添加插件（需要重启数据库） shared_preload_libraries ='kdb_rbo'-- 启用 count(distinct) 优化（阈值 0.1，根据实际情况调整）set kdb_rbo.attribute_distinct_value_threshold =0.1;-- 启用子查询公共表达式合并，减少重复计算set kdb_rbo.enable_merge_comm_expr =on;

3. SQL 监控与调优报告

通过 sys_sqltune 插件，能自动生成 SQL 调优建议报告，不用手动分析，省心又高效：

-- 创建插件create extension sys_sqltune;-- 生成指定 SQL 的调优报告，直接给出优化建议select PERF.QUICK_TUNE_BY_SQL('select * from big_table where create_time > ''2024-01-01''');-- 把报告保存到文件，方便后续查看select PERF.QUICK_TUNE_BY_SQL_TO_FILE('select * from big_table where create_time > ''2024-01-01''','TEXT','/tmp/sql_tune_report.txt');

六、调优手段选型指南

调优手段	核心优势	适用场景
Query Mapping	不用改应用代码，替换灵活	SQL 语法转换、批量优化低效语句
物化视图	预计算缓存，查询速度极快	静态报表、高频复杂查询、外部表缓存
并行查询	利用多核 CPU，加速大数据处理	大表扫描、哈希连接、聚集计算
函数结果集缓存	复用计算结果，减少 CPU 消耗	高频调用的 immutable/stable 函数

总结

KingbaseES 这些高级 SQL 调优手段，从语句改写、结果缓存到硬件资源利用，全链路都覆盖到了。实际优化的时候，建议先通过 SQL 监控找到性能瓶颈，再根据数据特征选对应的工具——比如静态报表用物化视图，动态查询用 Query Mapping，大数据量处理用并行查询。把这些手段合理组合起来，数据库的吞吐量和响应速度肯定能明显提升！

金仓官方网址：https://www.kingbase.com.cn
金仓社区链接：https://bbs.kingbase.com.cn/

前言

一、Query Mapping：不用改代码的 SQL“智能替换”神器

核心特性与适用场景

实战代码示例

1. 先把功能开起来

2. 优化过滤条件，少返回点数据

3. UNION 转 UNION ALL，告别多余去重

4. 条件下推，优化 UNION 子查询

5. 变量交换与多表关联优化（新增实用示例）

常用操作函数

二、物化视图：高频复杂查询的“预计算缓存”

核心原理与限制

实战代码示例

1. 创建物化视图（多表关联场景）

2. 刷新物化视图（数据更新后）

3. 物化视图加索引，查询更快

4. 性能对比：物化视图 vs 原始查询

三、并行查询：用多核 CPU 给 SQL 加速

核心配置与参数

实战代码示例

1. 并行全表扫描（大表必备）

2. 并行哈希连接（大表+小表组合）

3. 并行聚集计算（统计数据必备）

关键注意事项

四、函数结果集缓存：重复调用的函数不用再重复执行

核心条件与配置

实战代码示例

1. 创建可缓存函数

2. 复用缓存结果（同一 SQL 多次调用）

3. 验证缓存效果（看执行次数就知道）

4. 临时禁用函数缓存（特殊场景用）

五、其他高级调优手段补充

1. 分区表执行计划优化

2. 逻辑优化规则（kdb_rbo 插件）

3. SQL 监控与调优报告

六、调优手段选型指南

总结

Read more

个人开发者“接私活”降维打击：我是如何用 Nuct + Cursor 快速交付项目的 🚀

🚀 Expo React Native 微信支付集成全攻略

在APP中使用expo-react-native-wechat-v2快速集成微信支付

探索Vortex开源GPGPU：RISC-V SIMT架构(4-2)，TCU 矩阵计算(2)