Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

引言

在工业物联网场景中，某设备监控系统每秒产生超过 2 万条包含温度、压力、振动幅度的多维时序数据。若直接存储原始数据，单日存储量将突破 200GB。通过 IoTDB 的分组聚合（GROUP BY）与聚合结果过滤（HAVING）子句的协同使用，保证分析结果的精准性。

Apache IoTDB 时序数据库【系列篇章】：

No.	文章地址
1	Apache IoTDB（1）：时序数据库介绍与单机版安装部署指南
2	Apache IoTDB（2）：时序数据库 IoTDB 集群安装部署的技术优势与适用场景分析
3	Apache IoTDB（3）：时序数据库 IoTDB Docker 部署从单机到集群的全场景部署与实践指南
4	Apache IoTDB（4）：深度解析时序数据库 IoTDB 在 Kubernetes 集群中的部署与实践指南
5	Apache IoTDB（5）：深度解析时序数据库 IoTDB 中 AINode 工具的部署与实践
6	Apache IoTDB（6）：深入解析数据库管理操作——增删改查与异构数据库实战指南
7	Apache IoTDB（7）：设备模板管理——工业物联网元数据标准化的破局之道
8	Apache IoTDB（8）：时间序列管理——从创建到分析的实战指南
9	Apache IoTDB（9）：数据库操作——数据写入从 CLI 到集群部署的六种实战
10	Apache IoTDB（10）：数据库操作——从查询到优化的全链路实践指南
11	Apache IoTDB（11）：分段聚合深度解析——从原理到实战的完整指南

本文将从案例，系统剖析这两个子句的协同工作机制。不同于传统数据库的聚合操作，IoTDB 针对时序数据的特性进行了深度优化，支持时间窗口、设备层级、标签等多维分组方式，并可通过 HAVING 子句实现聚合结果的精准过滤。

一、分组聚合（GROUP BY）

1.1 路径层级分组聚合

在时间序列层级结构中，路径层级分组聚合查询用于对某一层级下同名的序列进行聚合查询。

使用 GROUP BY LEVEL = INT 来指定需要聚合的层级，并约定 ROOT 为第 0 层。若统计 "root.ln" 下所有序列则需指定 level 为 1。路径层次分组聚合查询支持使用所有内置聚合函数。对于 sum, avg, min_value, max_value, extreme 五种聚合函数，需保证所有聚合的时间序列数据类型相同。其他聚合函数没有此限制。

示例 1：不同 database 下均存在名为 status 的序列，如 "root.ln.wf01.wt01.status", "root.ln.wf02.wt02.status", 以及 "root.sgcc.wf03.wt01.status", 如果需要统计不同 database 下 status 序列的数据点个数，使用以下查询：

SELECT COUNT(status) FROM root.** GROUP BY LEVEL = 1

结果展示统计信息。

示例 2：统计不同设备下 status 序列的数据点个数，可以规定 level = 3

 (status)  root.   LEVEL

对比项	WHERE 子句	HAVING 子句
执行阶段	分组前执行（行级过滤）	分组后执行（组级过滤）
引用对象	原始列或常量	聚合函数结果
索引适用性	可利用 B+ 树索引加速	无法直接使用索引
典型场景	数据预筛选	聚合结果二次筛选

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

引言

一、分组聚合（GROUP BY）

1.1 路径层级分组聚合

更多推荐文章

相关免费在线工具

1.2 与时间区间分段聚合混合使用

1.3 标签分组聚合

1.4 单标签聚合查询

1.5 多标签分组聚合查询

1.6 基于时间区间的标签聚合查询

二、聚合结果过滤（HAVING）

2.1 HAVING 与 WHERE 的本质区别

2.2 注意事项

2.3 正确使用案例

三、智慧城市交通流量分析实战案例

3.1 需求分析

3.2 GROUP BY 与 HAVING 协同查询实现

3.3 结果可视化方案

四、总结

更多推荐文章

相关免费在线工具

Apache IoTDB 深度解析时序数据聚合的 GROUP BY 与 HAVING 子句

引言

一、分组聚合（GROUP BY）

1.1 路径层级分组聚合

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 与时间区间分段聚合混合使用

1.3 标签分组聚合

1.4 单标签聚合查询

1.5 多标签分组聚合查询

1.6 基于时间区间的标签聚合查询

二、聚合结果过滤（HAVING）

2.1 HAVING 与 WHERE 的本质区别

2.2 注意事项

2.3 正确使用案例

三、智慧城市交通流量分析实战案例

3.1 需求分析

3.2 GROUP BY 与 HAVING 协同查询实现

3.3 结果可视化方案

四、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具