VMware 与 CentOS 7 环境下的 Hadoop 伪分布式集群部署实战

VMware 与 CentOS 7 环境下的 Hadoop 伪分布式集群部署实战 | 极客日志

ping www.baidu.com

# 停止当前运行的防火墙服务
sudo systemctl stop firewalld
# 禁止防火墙服务开机自启
sudo systemctl disable firewalld

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys

ssh localhost

sudo yum install -y java-1.8.0-openjdk-devel

visudo

su - root

your_username ALL=(ALL:ALL) ALL

sudo nmtui

sudo systemctl restart NetworkManager

wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
sudo yum clean all
sudo yum makecache

java -version

wget https://mirrors.aliyun.com/apache/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

tar -zxvf hadoop-3.3.6.tar.gz -C /usr/local/

cd /usr/local/
mv hadoop-3.3.6 hadoop

export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile

<property>
    <name>dfs.replication</name>
    <value>1</value>
</property>

<property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
</property>

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk

start-dfs.sh
start-yarn.sh

hdfs namenode -format

sudo useradd hadoop
sudo passwd hadoop

export HDFS_NAMENODE_USER="hadoop"
export HDFS_DATANODE_USER="hadoop"
export YARN_RESOURCEMANAGER_USER="hadoop"
export YARN_NODEMANAGER_USER="hadoop"

find /usr/lib/jvm -name java-1.8.0-openjdk*

sudo chown -R hadoop:hadoop /usr/local/hadoop

su hadoop
hdfs namenode -format
start-dfs.sh
start-yarn.sh

hdfs dfs -mkdir /test
echo "Hello Hadoop" > test.txt
hdfs dfs -put test.txt /test
hdfs dfs -ls /test
hdfs dfs -cat /test/test.txt

wget https://files.grouplens.org/datasets/movielens/ml-latest-small.zip
unzip ml-latest-small.zip
cd ml-latest-small

VMware 与 CentOS 7 环境下的 Hadoop 伪分布式集群部署实战

一、基础环境搭建

1.1 系统镜像下载

1.2 创建新的 VMware 虚拟机

1.3 配置虚拟机硬件资源

更多推荐文章

相关免费在线工具

1.4 启动虚拟机并安装 CentOS 7

二、系统基础配置

2.1 网络连通性测试

2.2 关闭防火墙

2.3 配置 SSH 免密登录

三、核心依赖安装与问题排查——JDK

3.1 首次尝试安装与权限问题

3.2 解决 sudo 权限问题

3.3 配置 DNS 服务器

3.4 优化软件源并安装

四、Hadoop 安装与伪分布式配置

4.1 下载并解压 Hadoop

4.2 配置环境变量

4.3 修改核心配置文件

五、启动集群与问题排查

5.1 首次启动尝试

5.2 解决用户权限问题

5.3 修正 JAVA_HOME 路径

5.4 日志目录权限

5.5 验证集群状态

六、Hadoop 核心概念与后续步骤

6.1 Hadoop 核心构成

6.2 准备实际应用

总结

更多推荐文章

相关免费在线工具

VMware 与 CentOS 7 环境下的 Hadoop 伪分布式集群部署实战

一、基础环境搭建

1.1 系统镜像下载

1.2 创建新的 VMware 虚拟机

1.3 配置虚拟机硬件资源

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.4 启动虚拟机并安装 CentOS 7

二、系统基础配置

2.1 网络连通性测试

2.2 关闭防火墙

2.3 配置 SSH 免密登录

三、核心依赖安装与问题排查——JDK

3.1 首次尝试安装与权限问题

3.2 解决 sudo 权限问题

3.3 配置 DNS 服务器

3.4 优化软件源并安装

四、Hadoop 安装与伪分布式配置

4.1 下载并解压 Hadoop

4.2 配置环境变量

4.3 修改核心配置文件

五、启动集群与问题排查

5.1 首次启动尝试

5.2 解决用户权限问题

5.3 修正 JAVA_HOME 路径

5.4 日志目录权限

5.5 验证集群状态

六、Hadoop 核心概念与后续步骤

6.1 Hadoop 核心构成

6.2 准备实际应用

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具