一:背景
在传统方式下部署 Hadoop:
- 需要准备多台虚拟机
- 手动配置网络、主机名、SSH 免密
- 重复安装 JDK、Hadoop
- 环境不可复用
而使用 Docker 的优势:
✅ 环境隔离
✅ 一台机器模拟多节点
✅ 可快速销毁重建
✅ 镜像可复用
✅ 非常适合学习与实验
在真实生产中,例如在基于 Apache Hadoop 的数据平台环境中,也常结合容器化与编排技术使用。
二:部署
1)创建基础镜像
退出容器并提交为新的镜像
[root@hadoop ~]# exit
[root@hadoop108 ~]# docker commit 容器 ID centos:hadoop
[root@hadoop108 ~]# docker images
创建软件目录
[root@hadoop ~]# mkdir -p /opt/module /opt/software
配置 SSH 服务并启动
[root@hadoop ~]# vim /etc/ssh/sshd_config Port 22 PermitRootLogin yes
[root@hadoop ~]# systemctl start sshd.service
[root@hadoop ~]# systemctl enable sshd.service
[root@hadoop ~]# systemctl status sshd.service
在容器内安装必要工具
[root@hadoop ~]# yum install -y vim net-tools openssh-server openssh-clients rsync
进入容器
[root@hadoop108 ~]# docker exec -it centos7 /bin/bash
查看运行中的容器
[root@hadoop108 ~]# docker ps
运行 CentOS 容器(带特权模式,用于启动 systemd 服务)
[root@hadoop108 ~]# docker run --privileged=true --name centos7 -h hadoop -itd centos:7 /usr/sbin/init
查看镜像列表
[root@hadoop108 ~]# docker images
搜索并拉取 CentOS 镜像
[root@hadoop108 ~]# docker search centos
[root@hadoop108 ~]# docker pull centos:7
配置 Docker 镜像加速器
[root@hadoop108 ~]# vim /etc/docker/daemon.json


