1. HDFS 属于什么架构
高可用的分布式架构。
2. HDFS 部署后哪些进程?按启动顺序说明
NameNode, DataNode, SecondaryNameNode。
3. 文件存储计算(副本数为 3)
- 文件大小:180M
- 实际存储:540M (180M × 3)
- 块数量:2 个逻辑块(默认 128M),物理存储实例共 6 个(2 × 3 副本)。
- Map Task 数量:若文件支持分割则为 2 个;若为压缩格式且不支持分割则为 1 个。
4. 副本放置策略
就近分配(Rack Awareness)。
5. SecondaryNameNode (SNN) 职责
合并 NameNode 的 edit logs 到 fsimage 文件中。
6. Hadoop fs 命令别名
等同于 hdfs dfs。
7. Shuffle 机制理解
在 Map 和 Reduce 中间进行数据重组和洗牌操作。
8. YARN 主要进程
NodeManager, ResourceManager。
9. jps 命令作用
查看 Java 进程及其对应信息。
10. HDFS 与 YARN 界面默认端口
- HDFS NameNode Web UI: 50070
- YARN ResourceManager Web UI: 8088 (注:端口号可修改)
11. 查看进程资源占用命令
top
12. 查看系统负载命令
使用 top 右上角的 load average,分别代表 1 分钟、5 分钟、15 分钟的系统平均负载。
13. top 命令其他功能
可查看系统的 CPU、内存、运行时间、交换分区、执行的线程等信息。

