基于 VMware 与 CentOS 7 的 Hadoop 集群部署指南

基于 VMware 与 CentOS 7 的 Hadoop 集群部署指南 | 极客日志

ping www.baidu.com

# 停止当前运行的防火墙服务
sudo systemctl stop firewalld
# 禁止防火墙服务开机自启
sudo systemctl disable firewalld

ssh localhost

chmod 0600 ~/.ssh/authorized_keys

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

# -t rsa 指定密钥类型为 RSA
# -P '' 指定私钥的密码为空，实现免密
# -f ~/.ssh/id_rsa 指定密钥文件的存放位置
ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

# -y 选项表示对所有提示自动回答 yes
sudo yum install -y java-1.8.0-openjdk-devel

# 将 "name" 替换为实际的用户名
name ALL=(ALL:ALL) ALL

visudo

su - root

sudo yum install -y java-1.8.0-openjdk-devel

sudo nmtui

cat /etc/resolv.conf

sudo systemctl restart NetworkManager

sudo mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup

wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

sudo yum clean all
sudo yum makecache

sudo yum install -y java-1.8.0-openjdk-devel

java -version

# 使用阿里云镜像源
wget https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

# -z: 处理 gzip 压缩
# -x: 解压
# -v: 显示过程
# -f: 指定文件
# -C: 指定解压目录
sudo tar -zxvf hadoop-3.3.6.tar.gz -C /usr/local/

cd /usr/local/
sudo mv hadoop-3.3.6/ hadoop

sudo vi /etc/profile

export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile

cd /usr/local/hadoop/etc/hadoop/

sudo vi hdfs-site.xml

<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>

sudo vi core-site.xml

<property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
</property>

sudo vi hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

hdfs namenode -format

start-dfs.sh
start-yarn.sh

sudo useradd hadoop
sudo passwd hadoop

sudo vi /usr/local/hadoop/etc/hadoop/hadoop-env.sh

export HDFS_NAMENODE_USER="hadoop"
export HDFS_DATANODE_USER="hadoop"
export HDFS_SECONDARYNAMENODE_USER="hadoop"
export YARN_RESOURCEMANAGER_USER="hadoop"
export YARN_NODEMANAGER_USER="hadoop"

su hadoop
hdfs namenode -format

# 需要在 root 或有 sudo 权限的用户下执行
find /usr/lib/jvm -name java-1.8.0-openjdk*

# 示例路径，应替换为实际找到的路径
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.412.b08-1.el7_9.x86_64

# 在 root 或有 sudo 权限的用户下执行
sudo chown -R hadoop:hadoop /usr/local/hadoop

su hadoop
hdfs namenode -format

start-dfs.sh
start-yarn.sh

hdfs dfs -ls /test
hdfs dfs -cat /test/test.txt

wget https://files.grouplens.org/datasets/movielens/ml-latest-small.zip
unzip ml-latest-small.zip
cd ml-latest-small

# 确保是 hadoop 用户
start-dfs.sh
start-yarn.sh

基于 VMware 与 CentOS 7 的 Hadoop 集群部署指南

前言

第一章：基础环境搭建——虚拟机与操作系统的准备

1.1 系统镜像下载

1.2 创建新的 VMware 虚拟机

1.3 配置虚拟机硬件资源

1.4 启动虚拟机并安装 CentOS 7

第二章：系统基础配置

2.1 网络连通性测试

2.2 关闭防火墙

2.3 配置 SSH 免密登录

第三章：核心依赖安装与问题排查——JDK

3.1 首次尝试安装 JDK 与权限问题

3.2 解决 sudo 权限问题

3.3 再次尝试安装与网络 DNS 问题

3.4 配置 DNS 服务器

3.5 优化软件源并成功安装 JDK

第四章：Hadoop 安装与伪分布式配置

4.1 下载并解压 Hadoop

4.2 配置 Hadoop 环境变量

4.3 修改 Hadoop 核心配置文件

第五章：启动集群与问题排查

5.1 首次启动尝试与用户问题

5.2 解决 root 用户启动问题

5.3 切换用户后的 JAVA_HOME 路径问题

5.4 日志目录权限问题

5.5 成功启动并验证集群

第六章：Hadoop 核心概念与后续步骤

6.1 Hadoop 核心构成

6.2 准备实际应用：MovieLens 数据集

总结

更多推荐文章

相关免费在线工具

基于 VMware 与 CentOS 7 的 Hadoop 集群部署指南

前言

第一章：基础环境搭建——虚拟机与操作系统的准备

1.1 系统镜像下载

1.2 创建新的 VMware 虚拟机

1.3 配置虚拟机硬件资源

1.4 启动虚拟机并安装 CentOS 7

第二章：系统基础配置

2.1 网络连通性测试

2.2 关闭防火墙

2.3 配置 SSH 免密登录

第三章：核心依赖安装与问题排查——JDK

3.1 首次尝试安装 JDK 与权限问题

3.2 解决 sudo 权限问题

3.3 再次尝试安装与网络 DNS 问题

3.4 配置 DNS 服务器

3.5 优化软件源并成功安装 JDK

第四章：Hadoop 安装与伪分布式配置

4.1 下载并解压 Hadoop

4.2 配置 Hadoop 环境变量

4.3 修改 Hadoop 核心配置文件

第五章：启动集群与问题排查

5.1 首次启动尝试与用户问题

5.2 解决 root 用户启动问题

5.3 切换用户后的 JAVA_HOME 路径问题

5.4 日志目录权限问题

5.5 成功启动并验证集群

第六章：Hadoop 核心概念与后续步骤

6.1 Hadoop 核心构成

6.2 准备实际应用：MovieLens 数据集

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具