Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句 | 极客日志

SQLjava算法

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

Apache IoTDB 支持通过 GROUP BY 和 HAVING 子句实现时序数据的分组聚合与结果过滤。GROUP BY 支持路径层级、时间区间及标签维度分组，适用于设备监控、工厂数据采集等场景。HAVING 子句用于在分组后对聚合结果进行二次筛选，与 WHERE 子句形成互补。文章通过 SQL 示例展示了如何结合两者进行交通流量分析等复杂查询，帮助开发者优化时序数据处理流程。

FrontendX发布于 2026/2/10更新于 2026/7/2442 浏览

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

引言

在工业物联网场景中，某设备监控系统每秒产生超过 2 万条包含温度、压力、振动幅度的多维时序数据。若直接存储原始数据，单日存储量将突破 200GB。通过 IoTDB 的分组聚合（GROUP BY）与聚合结果过滤（HAVING）子句的协同使用，保证分析结果的精准性。

不同于传统数据库的聚合操作，IoTDB 针对时序数据的特性进行了深度优化，支持时间窗口、设备层级、标签等多维分组方式，并可通过 HAVING 子句实现聚合结果的精准过滤。

一、分组聚合（GROUP BY）

1.1 路径层级分组聚合

在时间序列层级结构中，路径层级分组聚合查询用于对某一层级下同名的序列进行聚合查询。

使用 GROUP BY LEVEL = INT 来指定需要聚合的层级，并约定 ROOT 为第 0 层。若统计 "root.ln" 下所有序列则需指定 level 为 1。路径层次分组聚合查询支持使用所有内置聚合函数。对于 sum, avg, min_value, max_value, extreme 五种聚合函数，需保证所有聚合的时间序列数据类型相同。其他聚合函数没有此限制。

练习 1：不同 database 下均存在名为 status 的序列 如 "root.ln.wf01.wt01.status", "root.ln.wf02.wt02.status", 以及 "root.sgcc.wf03.wt01.status", 如果需要统计不同 database 下 status 序列的数据点个数，使用以下查询：

SELECT COUNT(status) FROM root.** GROUP BY LEVEL = 1;

练习 2：统计不同设备下 status 序列的数据点个数 可以规定 level = 3：

SELECT COUNT(status) FROM root.** GROUP BY LEVEL = 3;

注意：这时会将 database ln 和 sgcc 下名为 wt01 的设备视为同名设备聚合在一起。

练习 3：统计不同 database 下的不同设备中 status 序列的数据点个数

SELECT COUNT(status) FROM root.** GROUP BY LEVEL = 1, 3;

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online

SELECT MAX_VALUE(temperature) FROM root.** GROUP BY LEVEL = 0;

SELECT COUNT(*) FROM root.ln.** GROUP BY LEVEL = 2;

SELECT COUNT(status) FROM root.ln.wf01.wt01 GROUP BY ((2017-11-01T00:00:00, 2017-11-07T23:00:00], 1d), LEVEL = 1;

SELECT COUNT(status) FROM root.ln.wf01.wt01 GROUP BY ([2017-11-01 00:00:00, 2017-11-07 23:00:00), 3h, 1d), LEVEL = 1;

CREATE DATABASE root.factory1;
CREATE TIMESERIES root.factory1.d1.temperature WITH DATATYPE=FLOAT TAGS(city='Beijing', workshop='w1');
CREATE TIMESERIES root.factory1.d2.temperature WITH DATATYPE=FLOAT TAGS(city='Beijing', workshop='w1');
CREATE TIMESERIES root.factory1.d3.temperature WITH DATATYPE=FLOAT TAGS(city='Beijing', workshop='w2');
CREATE TIMESERIES root.factory1.d4.temperature WITH DATATYPE=FLOAT TAGS(city='Beijing', workshop='w2');
CREATE TIMESERIES root.factory1.d5.temperature WITH DATATYPE=FLOAT TAGS(city='Shanghai', workshop='w1');
CREATE TIMESERIES root.factory1.d6.temperature WITH DATATYPE=FLOAT TAGS(city='Shanghai', workshop='w1');
CREATE TIMESERIES root.factory1.d7.temperature WITH DATATYPE=FLOAT TAGS(city='Shanghai', workshop='w2');
CREATE TIMESERIES root.factory1.d8.temperature WITH DATATYPE=FLOAT;
CREATE TIMESERIES root.factory1.d9.temperature WITH DATATYPE=FLOAT;
INSERT INTO root.factory1.d1(time, temperature) VALUES (1000, 104.0), (3000, 104.2), (5000, 103.3), (7000, 104.1);
INSERT INTO root.factory1.d2(time, temperature) VALUES (1000, 104.4), (3000, 103.7), (5000, 103.3), (7000, 102.9);
INSERT INTO root.factory1.d3(time, temperature) VALUES (1000, 103.9), (3000, 103.8), (5000, 102.7), (7000, 106.9);
INSERT INTO root.factory1.d4(time, temperature) VALUES (1000, 103.9), (5000, 102.7), (7000, 106.9);
INSERT INTO root.factory1.d5(time, temperature) VALUES (1000, 112.9), (7000, 113.0);
INSERT INTO root.factory1.d6(time, temperature) VALUES (1000, 113.9), (3000, 113.3), (5000, 112.7), (7000, 112.3);
INSERT INTO root.factory1.d7(time, temperature) VALUES (1000, 101.2), (3000, 99.3), (5000, 100.1), (7000, 99.8);
INSERT INTO root.factory1.d8(time, temperature) VALUES (1000, 50.0), (3000, 52.1), (5000, 50.1), (7000, 50.5);
INSERT INTO root.factory1.d9(time, temperature) VALUES (1000, 50.3), (3000, 52.1);

SELECT AVG(temperature) FROM root.factory1.** GROUP BY TAGS(city);

SELECT AVG(temperature) FROM root.factory1.** GROUP BY TAGS(city, workshop);

SELECT AVG(temperature) FROM root.factory1.** GROUP BY ([1000, 10000), 5s), TAGS(city, workshop);

对比项	WHERE 子句	HAVING 子句
执行阶段	分组前执行（行级过滤）	分组后执行（组级过滤）
引用对象	原始列或常量	聚合函数结果
索引适用性	可利用 B+ 树索引加速	无法直接使用索引
典型场景	数据预筛选	聚合结果二次筛选

-- 错误示例
SELECT COUNT(s1) FROM root.** GROUP BY ([1, 3), 1ms) HAVING SUM(s1) > s1;
SELECT COUNT(s1) FROM root.** GROUP BY ([1, 3), 1ms) HAVING s1 > 1;

-- 错误示例
SELECT COUNT(s1) FROM root.** GROUP BY ([1, 3), 1ms), LEVEL = 1 HAVING SUM(d1.s1) > 1;
SELECT COUNT(d1.s1) FROM root.** GROUP BY ([1, 3), 1ms), LEVEL = 1 HAVING SUM(s1) > 1;

SELECT COUNT(s1) FROM root.** GROUP BY ([1, 11), 2ms), LEVEL = 1 HAVING COUNT(s2) > 2;

SELECT COUNT(s1), COUNT(s2) FROM root.** GROUP BY ([1, 11), 2ms) HAVING COUNT(s2) > 1 ALIGN BY DEVICE;

SELECT intersection_id, AVG(speed) AS avg_speed, COUNT(*) FILTER (WHERE status='congestion') AS congestion_count 
FROM root.city.traffic 
WHERE time >= '2023-12-01 00:00:00' AND time <= '2023-12-07 23:59:59'
GROUP BY TIME(5m), intersection_id 
HAVING avg_speed < 30 AND congestion_count > 1.5;

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

引言

一、分组聚合（GROUP BY）

1.1 路径层级分组聚合

更多推荐文章

相关免费在线工具

1.2 与时间区间分段聚合混合使用

1.3 标签分组聚合

1.4 单标签聚合查询

1.5 多标签分组聚合查询

1.6 基于时间区间的标签聚合查询

二、聚合结果过滤（HAVING）

2.1 HAVING 与 WHERE 的本质区别

2.2 注意事项

2.3 正确使用案例

三、智慧城市交通流量分析实战案例

3.1 需求分析

3.2 GROUP BY 与 HAVING 协同查询实现

3.3 结果可视化方案

四、总结

更多推荐文章

相关免费在线工具

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

引言

一、分组聚合（GROUP BY）

1.1 路径层级分组聚合

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 与时间区间分段聚合混合使用

1.3 标签分组聚合

1.4 单标签聚合查询

1.5 多标签分组聚合查询

1.6 基于时间区间的标签聚合查询

二、聚合结果过滤（HAVING）

2.1 HAVING 与 WHERE 的本质区别

2.2 注意事项

2.3 正确使用案例

三、智慧城市交通流量分析实战案例

3.1 需求分析

3.2 GROUP BY 与 HAVING 协同查询实现

3.3 结果可视化方案

四、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具