HBase架构深度解析：HMaster、RegionServer与ZooKeeper三驾马车

Ne0inhk

21 Mar 2026 — 10 min read

HBase架构深度解析：HMaster、RegionServer与ZooKeeper三驾马车

一、HBase架构全景图
二、三大核心组件职责
三、HBase的数据存储单元：Region
四、HBase的读写流程
- 4.1 读数据流程
- 4.2 写数据流程
五、HBase的关键机制
六、架构设计亮点
七、面试高频问题
八、总结

🌺The Begin🌺点点关注，收藏不迷路🌺

关键词：HBase架构、HMaster、RegionServer、ZooKeeper、Region分裂、数据存储、分布式数据库

HBase作为一款分布式、可扩展、面向列的NoSQL数据库，其架构设计充分体现了分布式系统的核心思想。理解HBase的架构，是掌握其工作原理、进行性能调优和问题排查的基础。

今天，我们将深入剖析HBase的三大核心组件——HMaster、RegionServer和ZooKeeper，以及它们如何协同工作，构建出一个高可用、高扩展的分布式存储系统。

一、HBase架构全景图

HDFS底层存储

RegionServer集群

HMaster集群

ZooKeeper集群

客户端

1. 请求路由2. 返回RegionServer地址3. 直接读写数据3. 直接读写数据

监控管理

数据持久化

选举/协调

监控

RS3内部

Region3-1

Region3-2

Region3-3

RS2内部

Region2-1

Region2-2

RS1内部

Region1-1

Region1-2

Region1-3

Client

ZK Server1

ZK Server2

ZK Server3

Active HMaster

Standby HMaster

RegionServer1

RegionServer2

RegionServer3

DataNode1

DataNode2

DataNode3

二、三大核心组件职责

2.1 组件职责总览

组件	主要职责	类比
HMaster	管理元数据、DDL操作、负载均衡、故障恢复	公司的总经理
RegionServer	处理数据读写、管理Region	一线业务经理
ZooKeeper	集群协调、状态监控、元数据入口	公司的秘书处

2.2 HMaster：集群的"大脑"

HMaster是HBase集群的主节点，负责管理整个集群的元数据和状态。

root（HMaster核心职责）

DDL操作

创建表

删除表

修改表结构

Region管理

分配Region到RegionServer

监控Region状态

负载均衡

故障恢复

检测RegionServer宕机

重新分配Region

元数据管理

维护表结构信息

记录Region位置

HMaster的高可用：

// HMaster的高可用架构// 集群中可以有多个HMaster，但只有一个Active，其他为Standby// Active HMaster的职责：- 处理所有管理操作 - 分配Region- 负载均衡 // Standby HMaster的职责：- 同步Active的状态 - 监控Active的健康状态 -Active宕机时接管服务 // 切换过程由ZooKeeper协调

2.3 RegionServer：数据的"执行者"

RegionServer负责实际的数据读写操作，是HBase中最繁忙的组件。

RegionServer内部结构

Region2

Region1

Region
RowKey范围: 101-200

RegionServer

Region
RowKey范围: 001-100

MemStore
内存写缓存

StoreFile
HFile

WAL
预写日志

MemStore

StoreFile

WAL

RegionServer的核心组件：

组件	作用	特点
Region	表的分片，包含一段RowKey范围的数据	数据分布的基本单位
MemStore	内存写缓存	先写内存，后刷写到磁盘
StoreFile/HFile	磁盘存储文件	最终数据持久化格式
WAL	预写日志	故障恢复的关键

2.4 ZooKeeper：集群的"协调者"

ZooKeeper在HBase中扮演着至关重要的协调角色。

root（ZooKeeper核心职责）

集群状态维护

记录RegionServer存活状态

监控服务器心跳

元数据入口

存储hbase:meta表位置

客户端通过ZK找到meta表

HMaster选举

协调Active/Standby切换

保证唯一Active

分布式协调

维护集群配置

同步集群状态

ZooKeeper中存储的关键信息：

# ZooKeeper中HBase的znode结构 /hbase /meta-region-server # meta表所在的RegionServer /master # Active HMaster地址 /backup-masters # Standby HMaster列表 /region-in-transition # 正在迁移的Region /rs # 所有RegionServer列表 /rs1 /rs2 /rs3

三、HBase的数据存储单元：Region

3.1 Region是什么？

Region是HBase表数据分布的基本单位。一个HBase表根据RowKey的范围被分成多个Region，每个Region包含这个区域内所有数据。

HBase表

Region划分

Region1
RowKey: 001-100

User表
RowKey: 用户ID

Region2
RowKey: 101-200

Region3
RowKey: 201-300

Region4
RowKey: 301-400

3.2 Region的内部结构

// 每个Region包含的内容Region{// 1. RowKey范围 startKey:"001" endKey:"100"// 2. 包含的列族Map<ColumnFamily,Store> stores;// 3. 每个Store对应一个列族Store{MemStore memStore;// 内存缓存List<StoreFile> storeFiles;// 磁盘文件}// 4. WAL预写日志WAL wal;}

3.3 Region的分配与迁移

Region分配过程

1. 决定Region数量2. 分配Region到RS3. 更新

客户端创建表

HMaster

创建Region

分配

RegionServer1
分配Region A,B

RegionServer2
分配Region C,D

RegionServer3
分配Region E,F

ZooKeeper记录位置

四、HBase的读写流程

4.1 读数据流程

HDFSRegionServerZooKeeper客户端HDFSRegionServerZooKeeper客户端1. 获取meta表位置2. 返回meta表所在RS3. 查询meta表获取目标Region位置4. 返回目标Region所在RS5. 直接读取数据6. 先从MemStore读7. 再从StoreFile读8. 返回数据9. 返回最终结果

读流程要点：

客户端先从ZooKeeper获取hbase:meta表的位置
从meta表查询目标RowKey所在的Region和RegionServer
直接连接目标RegionServer读取数据
读数据时，先查MemStore（内存），再查StoreFile（磁盘）

4.2 写数据流程

HDFSRegionServerZooKeeper客户端HDFSRegionServerZooKeeper客户端异步刷盘1. 获取meta表位置2. 返回meta表所在RS3. 查询meta表获取目标Region位置4. 返回目标Region所在RS5. 直接写入数据6. 写入WAL（顺序写）7. 写入MemStore8. 返回写入成功9. MemStore达到阈值刷写成StoreFile

写流程要点：

先写WAL（保证数据不丢）
再写MemStore（内存）
返回客户端成功
异步将MemStore刷写到HDFS成为StoreFile

五、HBase的关键机制

5.1 Region分裂

随着数据增长，Region会不断变大，当达到阈值时触发分裂：

分裂后

分裂前

达到分裂阈值

大Region
RowKey: 000-999
100GB

触发分裂

Region1
RowKey: 000-499
50GB

Region2
RowKey: 500-999
50GB

可能分配到不同RegionServer

实现负载均衡

分裂触发条件：

单个Region的StoreFile大小超过hbase.hregion.max.filesize（默认10GB）
由RegionServer自行决定，不需要HMaster参与

5.2 负载均衡

// HMaster定期执行负载均衡publicclassLoadBalancer{publicvoidbalance(){// 1. 获取所有RegionServer的负载Map<RegionServer,Integer> loads =getRegionServerLoads();// 2. 计算平均负载double avgLoad =calculateAverage(loads);// 3. 找出过载和低载的RegionServerList<RegionServer> overloaded =findOverloaded(loads, avgLoad);List<RegionServer> underloaded =findUnderloaded(loads, avgLoad);// 4. 将过载RS的Region迁移到低载RSfor(RegionServer from : overloaded){for(RegionServerto: underloaded){moveRegion(from,to);}}}}

5.3 故障恢复

当RegionServer宕机时：

数据恢复

Region重新分配

日志分割

故障检测

1. 检测到RS1心跳超时2. 通知其他RS2. 通知其他RS3. 分割RS1的WAL3. 分割RS1的WAL4. 获取Region列表5. 重新分配5. 重新分配6. 从WAL恢复数据6. 从WAL恢复数据

ZooKeeper

HMaster

RS2

RS3

分割WAL

RS1管理的Region

恢复MemStore

六、架构设计亮点

6.1 无单点故障设计

组件	高可用方案
HMaster	Active-Standby模式，ZooKeeper协调切换
RegionServer	数据存储在HDFS，故障时Region重新分配
ZooKeeper	集群模式，多数节点存活即可服务
HDFS	数据多副本，NameNode HA

6.2 读写分离设计

读路径

写路径

写请求

MemStore
内存

HFile
磁盘

读请求

BlockCache
读缓存

6.3 数据本地性

// HBase充分利用数据本地性// 当Region在某个RegionServer上时，它会优先读取本地的HDFS数据// 但如果Region迁移了，新的RegionServer可能需要远程读数据// 通过Compaction机制，可以逐步将数据转为本地

七、面试高频问题

Q1：HBase有哪些核心组件？各有什么作用？

答：三大核心组件：

HMaster：管理元数据、DDL操作、负载均衡、故障恢复
RegionServer：处理数据读写、管理Region
ZooKeeper：集群协调、状态监控、元数据入口

Q2：RegionServer宕机后会发生什么？

答：

ZooKeeper检测到心跳超时
HMaster启动故障恢复流程
将宕机RS的WAL进行分割
将其管理的Region重新分配到其他RS
其他RS从WAL恢复数据

Q3：HBase的读写流程是怎样的？

答：

读流程：ZK → meta表 → 目标RS → 先读MemStore → 再读StoreFile
写流程：ZK → meta表 → 目标RS → 写WAL → 写MemStore → 返回成功

Q4：HMaster的高可用是如何实现的？

答：通过ZooKeeper协调Active-Standby模式：

多个HMaster实例，只有一个Active
ZK记录Active的地址
Active宕机时，Standby通过ZK选举成为新的Active

Q5：Region是什么？如何分布？

答：Region是HBase表数据分布的基本单位，根据RowKey范围划分。每个Region包含一段连续RowKey的数据，分布在不同的RegionServer上，实现负载均衡和水平扩展。

八、总结

8.1 架构核心要点

root（HBase架构精髓）

HMaster

元数据管理

负载均衡

故障恢复

RegionServer

数据读写

Region管理

MemStore/StoreFile

ZooKeeper

集群协调

状态监控

元数据入口

8.2 数据流向

写：Client → RegionServer → WAL → MemStore → HFile
读：Client → RegionServer → MemStore/BlockCache → HFile

8.3 一句话总结

HBase通过HMaster管控、RegionServer执行、ZooKeeper协调的三驾马车，构建了一个高可用、可扩展的分布式KV数据库。

掌握了HBase的架构，你就掌握了理解其所有行为的基础，无论是性能调优、问题排查还是二次开发，都能得心应手！

思考题：HBase 2.0中引入了Procedure V2框架，它对HMaster的故障恢复有什么改进？欢迎在评论区讨论！

🌺The End🌺点点关注，收藏不迷路🌺

HBase架构深度解析：HMaster、RegionServer与ZooKeeper三驾马车

Ne0inhk

HBase架构深度解析：HMaster、RegionServer与ZooKeeper三驾马车

一、HBase架构全景图

二、三大核心组件职责

2.1 组件职责总览

2.2 HMaster：集群的"大脑"

2.3 RegionServer：数据的"执行者"

2.4 ZooKeeper：集群的"协调者"

三、HBase的数据存储单元：Region

3.1 Region是什么？

3.2 Region的内部结构

3.3 Region的分配与迁移

四、HBase的读写流程

4.1 读数据流程

4.2 写数据流程

五、HBase的关键机制

5.1 Region分裂

5.2 负载均衡

5.3 故障恢复

六、架构设计亮点

6.1 无单点故障设计

6.2 读写分离设计

6.3 数据本地性

七、面试高频问题

Q1：HBase有哪些核心组件？各有什么作用？

Q2：RegionServer宕机后会发生什么？

Q3：HBase的读写流程是怎样的？

Q4：HMaster的高可用是如何实现的？

Q5：Region是什么？如何分布？

八、总结

8.1 架构核心要点

8.2 数据流向

8.3 一句话总结

Read more

macOS配置openclaw+deepseek大模型+飞书小助手

Flutter 组件 random_color 的适配鸿蒙Harmony 实战 - 驾驭视觉美学随机化、实现鸿蒙端高阶灵动 UI 调色盘与动态主题生成方案

鸿蒙金融理财全栈项目——安全合规与用户体验优化

【AIGC】如何通过ChatGPT提示词Prompt定制个性学习计划

HBase架构深度解析：HMaster、RegionServer与ZooKeeper三驾马车

一、HBase架构全景图

二、三大核心组件职责

2.1 组件职责总览

2.2 HMaster：集群的"大脑"

2.3 RegionServer：数据的"执行者"

2.4 ZooKeeper：集群的"协调者"

三、HBase的数据存储单元：Region

3.1 Region是什么？

3.2 Region的内部结构

3.3 Region的分配与迁移

四、HBase的读写流程

4.1 读数据流程

4.2 写数据流程

五、HBase的关键机制

5.1 Region分裂

5.2 负载均衡

5.3 故障恢复

六、架构设计亮点

6.1 无单点故障设计

6.2 读写分离设计

6.3 数据本地性

七、面试高频问题

Q1：HBase有哪些核心组件？各有什么作用？

Q2：RegionServer宕机后会发生什么？

Q3：HBase的读写流程是怎样的？

Q4：HMaster的高可用是如何实现的？

Q5：Region是什么？如何分布？

八、总结

8.1 架构核心要点

8.2 数据流向

8.3 一句话总结

Read more

macOS配置openclaw+deepseek大模型+飞书小助手

Flutter 组件 random_color 的适配 鸿蒙Harmony 实战 - 驾驭视觉美学随机化、实现鸿蒙端高阶灵动 UI 调色盘与动态主题生成方案

鸿蒙金融理财全栈项目——安全合规与用户体验优化

【AIGC】如何通过ChatGPT提示词Prompt定制个性学习计划

Flutter 组件 random_color 的适配鸿蒙Harmony 实战 - 驾驭视觉美学随机化、实现鸿蒙端高阶灵动 UI 调色盘与动态主题生成方案