KingbaseES 高级 SQL 调优：Query Mapping、物化视图与函数缓存 | 极客日志

SQL算法

KingbaseES 高级 SQL 调优：Query Mapping、物化视图与函数缓存

KingbaseES 提供了多种高级 SQL 调优手段。Query Mapping 允许在不修改应用代码的情况下通过规则自动替换低效 SQL；物化视图将复杂查询结果预计算并存储，适合高频统计场景；并行查询利用多核 CPU 加速大表扫描与连接操作；函数结果集缓存可复用 immutable 或 stable 函数的执行结果以减少 CPU 消耗。此外还包括分区表优化及插件增强。实际应用中需根据数据特征选择合适的组合策略以提升数据库吞吐量与响应速度。

热情发布于 2026/3/24更新于 2026/7/2121K 浏览

KingbaseES 高级 SQL 调优：Query Mapping、物化视图与函数缓存

前言

KingbaseES 作为能兼容 Oracle 的企业级数据库，提供了从 SQL 语句改写、执行计划干预到结果集缓存的优化手段。本文介绍 Query Mapping、物化视图、并行查询、函数结果集缓存等关键调优手段。

一、Query Mapping：SQL'智能替换'

Query Mapping 允许提前定义源 SQL 和目标 SQL 的对应关系，输入 SQL 匹配后自动替换执行，无需修改应用代码。

核心特性与适用场景

支持两种匹配级别：TEXT 级保留原始语法和注释；SEMANTICS 级进行语法语义校验。
常见用法：将低效 SQL 改写为等价高效语句、异构数据库迁移时做语法转换、批量调整查询条件。

实战代码示例

1. 开启功能

在 kingbase.conf 中配置并重启数据库：

enable_query_rule = on

2. 优化过滤条件

创建映射规则减少结果集大小：

CREATE QUERY RULE('qm1', 'SELECT id, val FROM t1 WHERE id < $1', 'SELECT id FROM t1 WHERE id < ($1 - 5)', true, 'text');
-- 实际执行的是：SELECT id FROM t1 WHERE id < 5
SELECT id, val FROM t1 WHERE id < 10;

3. UNION 转 UNION ALL

避免不必要的去重操作：

CREATE QUERY RULE('union_opt', 'SELECT * FROM t1 UNION SELECT * FROM t2', 'SELECT * FROM t1 UNION ALL SELECT * FROM t2', true, 'semantics');
SELECT * FROM t1 UNION SELECT * FROM t2;

4. 条件下推

将条件下推到子查询中减少中间数据量：

CREATE QUERY RULE('push_down', , , , );
 ()  t1, (   t2  val       t1  val  )  v  t1.id  v.id;

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
SQL 美化和格式化
在线格式化和美化您的 SQL 查询（它支持各种 SQL 方言）。在线工具，SQL 美化和格式化在线工具，online
SQL转CSV/JSON/XML
解析 INSERT 等受限 SQL，导出为 CSV、JSON、XML、YAML、HTML 表格（见页内语法说明）。在线工具，SQL转CSV/JSON/XML在线工具，online
CSV 工具包
CSV 与 JSON/XML/HTML/TSV/SQL 等互转，单页多 Tab。在线工具，CSV 工具包在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

-- 变量交换
CREATE QUERY RULE('var_swap', 'SELECT * FROM t2 WHERE t2.id < $1 AND t2.val = $2', 'SELECT * FROM t2 WHERE t2.id < $2 AND t2.val = $1', true, 'text');
SELECT * FROM t2 WHERE t2.id < 50 AND t2.val = 5;

-- 多表关联过滤优化
CREATE QUERY RULE('join_filter', 'SELECT * FROM t1, t2 WHERE t1.id = t2.id AND t1.id < $1 AND t2.val = $2', 'SELECT * FROM t1, t2 WHERE t1.id = t2.id AND t1.id < $1 AND t2.val = $2 AND t2.id = $2', true, 'text');
SELECT * FROM t1, t2 WHERE t1.id = t2.id AND t1.id < 30 AND t2.val = 5;

函数名	功能描述
create_query_rule(规则名，源 SQL, 目标 SQL, 启用状态，级别)	创建映射规则
drop_query_rule(规则名)	删除指定规则
enable/disable_query_rule(规则名)	启用/禁用规则

CREATE TABLE order_info(order_id INT PRIMARY KEY, user_id INT, amount NUMERIC, create_time TIMESTAMP);
CREATE TABLE user_info(user_id INT PRIMARY KEY, user_name TEXT, region TEXT);

INSERT INTO user_info SELECT GENERATE_SERIES(1, 1000), 'user_' || GENERATE_SERIES(1, 1000), 'region_' || (GENERATE_SERIES(1, 1000) % 10);
INSERT INTO order_info SELECT GENERATE_SERIES(1, 10000), (RANDOM() * 1000)::INT + 1, RANDOM() * 1000, NOW() - (RANDOM() * 30)::INTERVAL;

CREATE MATERIALIZED VIEW region_order_stats AS
SELECT u.region, COUNT(o.order_id) AS order_count, SUM(o.amount) AS total_amount 
FROM user_info u JOIN order_info o ON u.user_id = o.user_id 
GROUP BY u.region;

-- 全量刷新
REFRESH MATERIALIZED VIEW region_order_stats;
-- 增量刷新
REFRESH MATERIALIZED VIEW CONCURRENTLY region_order_stats;

CREATE INDEX idx_region_order_stats_region ON region_order_stats(region);
SELECT * FROM region_order_stats WHERE region = 'region_0';

max_worker_processes = 16
max_parallel_workers = 8
max_parallel_workers_per_gather = 4
min_parallel_table_scan_size = 8MB

CREATE TABLE big_table(id INT PRIMARY KEY, content TEXT, create_time TIMESTAMP);
INSERT INTO big_table SELECT GENERATE_SERIES(1, 10000000), MD5(RANDOM()::TEXT), NOW() - (RANDOM() * 100)::INTERVAL;
ANALYZE big_table;

EXPLAIN ANALYZE SELECT /*+Parallel(big_table 4)* FROM big_table WHERE create_time > '2024-01-01';

CREATE TABLE small_table(id INT PRIMARY KEY, category TEXT);
INSERT INTO small_table SELECT GENERATE_SERIES(1, 1000), 'cat_' || (GENERATE_SERIES(1, 1000) % 20);

EXPLAIN ANALYZE SELECT /*+Parallel(big_table 2)* b.*, s.category 
FROM big_table b JOIN small_table s ON b.id = s.id 
WHERE b.create_time > '2024-01-01';

EXPLAIN ANALYZE SELECT /*+Parallel(order_info 3)* SUM(amount) AS total 
FROM order_info WHERE create_time BETWEEN '2024-01-01' AND '2024-04-01';

function_result_cache = on
function_cache_number = 1000

CREATE OR REPLACE FUNCTION get_user_region(user_id INT) RETURNS TEXT AS $$
    SELECT region FROM user_info WHERE user_id = $1;
$$ LANGUAGE SQL STABLE;

SET function_result_cache = on;

SELECT order_id, get_user_region(user_id) AS region1, get_user_region(user_id) AS region2 
FROM order_info WHERE order_id < 100;

SELECT funcname, calls FROM sys_stat_user_functions WHERE funcname = 'get_user_region';

SET function_result_cache = off;

SET partition_table_limit = 30;

-- kingbase.conf 配置
shared_preload_libraries = 'kdb_rbo'

-- 启用 count(distinct) 优化
SET kdb_rbo.attribute_distinct_value_threshold = 0.1;
-- 启用子查询公共表达式合并
SET kdb_rbo.enable_merge_comm_expr = on;

CREATE EXTENSION sys_sqltune;

SELECT PERF.QUICK_TUNE_BY_SQL('SELECT * FROM big_table WHERE create_time > ''2024-01-01''');
SELECT PERF.QUICK_TUNE_BY_SQL_TO_FILE('SELECT * FROM big_table WHERE create_time > ''2024-01-01''', 'TEXT', '/tmp/sql_tune_report.txt');

调优手段	核心优势	适用场景
Query Mapping	不用改应用代码，替换灵活	SQL 语法转换、批量优化低效语句
物化视图	预计算缓存，查询速度极快	静态报表、高频复杂查询、外部表缓存
并行查询	利用多核 CPU，加速大数据处理	大表扫描、哈希连接、聚集计算
函数结果集缓存	复用计算结果，减少 CPU 消耗	高频调用的 immutable/stable 函数

KingbaseES 高级 SQL 调优：Query Mapping、物化视图与函数缓存

前言

一、Query Mapping：SQL'智能替换'

核心特性与适用场景

实战代码示例

1. 开启功能

2. 优化过滤条件

3. UNION 转 UNION ALL

4. 条件下推

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

5. 变量交换与多表关联优化

常用操作函数

二、物化视图：高频复杂查询的预计算缓存

核心原理与限制

实战代码示例

1. 创建物化视图

2. 刷新物化视图

3. 物化视图加索引

4. 性能对比

三、并行查询：利用多核 CPU 加速

核心配置与参数

实战代码示例

1. 并行全表扫描

2. 并行哈希连接

3. 并行聚集计算

关键注意事项

四、函数结果集缓存

核心条件与配置

实战代码示例

1. 创建可缓存函数

2. 复用缓存结果

3. 验证缓存效果

4. 临时禁用函数缓存

五、其他高级调优手段补充

1. 分区表执行计划优化

2. 逻辑优化规则（kdb_rbo 插件）

3. SQL 监控与调优报告

六、调优手段选型指南

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具