Hadoop HDFS 新增节点与删除节点

Hadoop HDFS 新增节点与删除节点

服役新数据节点

需求基础:

随着公司业务的增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点。

准备新节点:
第一步:复制或创建一台新的虚拟机出来
将我们纯净的虚拟机(只配置了动态网络的虚拟机)复制一台出来,作为我们新的节点

下面的配置详细过程可以参考这篇博客,这里只列出大致步骤

第二步:修改mac地址以及IP地址

修改onboot=yes,修改mac地址

vim /etc/sysconfig/network-scripts/ifcfg-eth0

setup设置静态ip,直接选用newDevice,静态ip设为192.168.100.204

第三步:关闭防火墙,关闭selinux
关闭防火墙、开机不自启防火墙

service iptables stop
chkconfig iptables off

关闭selinux

vim /etc/selinux/config

第四步:更改主机名(hadoop04)
更改主机名命令

vim /etc/sysconfig/network

第五步:四台机器更改主机名与IP地址映射
四台机器都要修改hosts文件

vim /etc/hosts
192.168.100.201 hadoop01.Hadoop.com  hadoop01
192.168.100.202 hadoop02.Hadoop.com  hadoop02
192.168.100.203 hadoop03.Hadoop.com  hadoop03
192.168.100.204 hadoop04.Hadoop.com  hadoop04

第六步:hadoop04服务器关机重启并生成公钥与私钥
hadoop04执行以下命令关机重启

reboot

hadoop04执行以下命令生成公钥与私钥

ssh-keygen -t  rsa

hadoop04执行以下命令将hadoop04的私钥拷贝到hadoop01服务器

ssh-copy-id  hadoop01

hadoop01执行以下命令,将authorized_keys拷贝给hadoop04

cd /root/.ssh/
scp authorized_keys  hadoop04:$PWD

第七步:hadoop04安装jdk
hadoop04统一两个路径

mkdir -p /export/softwares/
mkdir -p /export/servers/

然后解压jdk安装包,配置环境变量,或将集群中的java安装目录拷贝一份,并配置环境变量。
第八步:解压Hadoop安装包

hadoop01执行以下命令将Hadoop安装包拷贝到hadoop04服务器

cd /export/softwares/
scp hadoop-2.6.0-cdh5.14.0-自己编译后的版本.tar.gz hadoop04:$PWD

在hadoop04服务器上面解压Hadoop安装包到/export/servers

第九步:将hadoop01关于Hadoop的配置文件全部拷贝到hadoop04
hadoop01执行以下命令,将Hadoop的配置文件全部拷贝到hadoop04服务器上面

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/
scp ./* hadoop04:$PWD

服役新节点具体步骤

第一步:创建dfs.hosts文件
在hadoop01也就是namenode所在的机器的/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop目录下创建dfs.hosts文件

[root@hadoop01 Hadoop]# cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
[root@hadoop01 Hadoop]# touch dfs.hosts
[root@hadoop01 Hadoop]# vim dfs.hosts

添加如下主机名称(包含新服役的节点)

hadoop01
hadoop02
hadoop03
hadoop04

第二步:hadoop01编辑hdfs-site.xml添加以下配置
在namenode的hdfs-site.xml配置文件中增加dfs.hosts属性
hadoop01执行以下命令

cd /export/servers/Hadoop-2.6.0-cdh5.14.0/etc/Hadoop
vim hdfs-site.xml
<property>
	<name>dfs.hosts</name>
	<value>/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/dfs.hosts</value>
</property>

第三步:刷新namenode

hadoop01执行以下命令刷新namenode

hdfs dfsadmin -refreshNodes
www.zeeklog.com  - Hadoop HDFS 新增节点与删除节点

第四步:更新resourceManager节点
hadoop01执行以下命令刷新resourceManager

yarn rmadmin -refreshNodes
www.zeeklog.com  - Hadoop HDFS 新增节点与删除节点

第五步:namenode的slaves文件增加新服务节点主机名称
hadoop01编辑slaves文件,并添加新增节点的主机,更改完后,slaves文件不需要分发到其他机器上面去
hadoop01执行以下命令编辑slaves文件

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/Hadoop
vim slaves
hadoop01
hadoop02
hadoop03
hadoop04

第六步:单独启动新增节点

hadoop04服务器执行以下命令,启动datanode和nodemanager

cd /export/servers/hadoop-2.6.0-cdh5.14.0/
sbin/hadoop-daemon.sh start datanode
sbin/yarn-daemon.sh start nodemanager

第七步:浏览器查看
(windows上需要起别名192.168.100.201起别名hadoop01)

http://hadoop01:50070/dfshealth.html#tab-overview

http://hadoop01:8088/cluster

(如果新增的节点报红,那就重启集群,并检查之前的步骤是否有做错的。)

第八步:使用负载均衡命令,让数据均匀负载所有机器

hadoop01执行以下命令

cd /export/servers/hadoop-2.6.0-cdh5.14.0/
sbin/start-balancer.sh

退役旧数据节点

第一步:创建dfs.hosts.exclude配置文件
在namenod的cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop目录下创建dfs.hosts.exclude文件,并添加需要退役的主机名称

hadoop01执行以下命令

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
touch dfs.hosts.exclude
vim dfs.hosts.exclude

文件内容:

hadoop04

第二步:编辑namenode所在机器的hdfs-site.xml
编辑namenode所在的机器的hdfs-site.xml配置文件,添加以下配置
hadoop01执行以下命令

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
vim hdfs-site.xml
<property>
	<name>dfs.hosts.exclude</name>
	<value>/export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/dfs.hosts.exclude</value>
</property>

第三步:刷新namenode,刷新resourceManager
在namenode所在的机器执行以下命令,刷新namenode,刷新resourceManager

hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes

第四步:查看web浏览界面
浏览器访问
http://hadoop01:50070/dfshealth.html#tab-datanode

www.zeeklog.com  - Hadoop HDFS 新增节点与删除节点


第五步:节点退役完成,停止该节点进程
等待退役节点状态为decommissioned(所有块已经复制完成),停止该节点及节点资源管理器。
注意:如果副本数是3,服役的节点小于等于3,是不能退役成功的,需要修改副本数后才能退役。

www.zeeklog.com  - Hadoop HDFS 新增节点与删除节点

hadoop01执行以下命令,停止该节点进程

cd /export/servers/hadoop-2.6.0-cdh5.14.0
sbin/hadoop-daemon.sh stop datanode
sbin/yarn-daemon.sh stop nodemanager

第六步:从include文件中删除退役节点
namenode所在节点也就是hadoop01执行以下命令删除退役节点

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
vim dfs.hosts

文件内容:

hadoop01
hadoop02
hadoop03

namenode所在节点也就是hadoop01执行以下命令刷新namenode和resourceManager

hdfs dfsadmin -refreshNodes
yarn rmadmin -refreshNodes

第七步:从namenode的slave文件中删除退役节点
namenode所在机器也就是hadoop01执行以下命令从slaves文件中删除退役节点

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
vim slaves
hadoop01
hadoop02
hadoop03

第八步:如果数据负载不均衡,执行以下命令进行均衡负载
hadoop01执行以下命令进行均衡负载

cd /export/servers/hadoop-2.6.0-cdh5.14.0/
sbin/start-balancer.sh