Hadoop 安装与使用指南：Ubuntu Kylin 环境下的单机及伪分布式部署 | 极客日志

Javajava

Hadoop 安装与使用指南：Ubuntu Kylin 环境下的单机及伪分布式部署

Hadoop 安装配置涉及 Linux 环境准备、用户权限设置、SSH 免密登录、JDK 环境变量配置以及 Hadoop 核心组件的部署。本文以 Ubuntu Kylin 16.04 LTS 为例，详细演示了从虚拟机搭建到单机模式测试，再到伪分布式集群初始化的全过程。重点包括配置文件修改、NameNode 格式化、HDFS 启动验证及 MapReduce 示例运行，确保读者能独立完成 Hadoop 环境的构建与基础功能验证。

晚风叙旧发布于 2026/2/27更新于 2026/7/2148 浏览

Hadoop 安装与使用指南

一、Linux 虚拟机准备

本文基于 Ubuntu Kylin 16.04 LTS 进行演示。相比新版，该版本对虚拟机资源消耗更低，运行更流畅，适合实验环境。推荐使用 VMware 作为虚拟化软件，其易用性优于 VirtualBox。

二、创建 Hadoop 用户

如果安装 Ubuntu 时未使用 hadoop 用户，建议新建一个专门用于大数据开发的用户。

首先创建新用户并指定 Shell：

sudo useradd -m hadoop -s /bin/bash

设置密码（可简单设为 hadoop）：

sudo passwd hadoop

为便于后续部署，将用户加入 sudo 组赋予管理员权限：

sudo adduser hadoop sudo

三、系统更新与工具安装

切换到 hadoop 用户登录后，先更新软件源，确保能顺利安装依赖：

sudo apt-get update

安装 Vim 编辑器以便修改配置文件：

sudo apt-get install vim

安装过程中若提示确认，输入 y 即可。

四、SSH 无密码登录配置

SSH 简介与作用

SSH（Secure Shell）是建立在应用层和传输层基础上的安全协议，用于远程登录和其他网络服务。在 Hadoop 集群中，NameNode 需要通过 SSH 启动所有节点的守护进程，而 Hadoop 本身不支持交互式密码输入，因此必须配置免密登录。

安装与配置步骤

Ubuntu 默认已安装 SSH 客户端，只需安装服务端：

sudo apt-get install openssh-server

测试连接本机：

ssh localhost

首次连接会提示确认指纹，输入 yes 后需输入密码。为了后续自动化管理，我们需要生成密钥并配置免密：

exit
cd ~/.ssh
ssh-keygen -t rsa
cat ./id_rsa.pub >> ./authorized_keys

再次执行 ssh localhost 即可无需密码直接登录。

五、Java 环境搭建

Hadoop 基于 Java 开发，运行需要 JDK 支持。Hadoop 3.3.5 要求 JDK 1.8 或更高版本。

假设下载的文件为 jdk-8u371-linux-x64.tar.gz 并位于 /home/hadoop/Downloads/。

创建目录并解压：

 /usr/lib
  jvm
 ~
 Downloads
 tar -zxvf ./jdk-8u371-linux-x64.tar.gz -C /usr/lib/jvm

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

vim ~/.bashrc

export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_371
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:$PATH

source ~/.bashrc

java -version

sudo tar -zxf ~/Downloads/hadoop-3.3.5.tar.gz -C /usr/local
cd /usr/local/
sudo mv ./hadoop-3.3.5/ ./hadoop
sudo chown -R hadoop ./hadoop

./bin/hadoop version

cd /usr/local/hadoop
mkdir input
cp ./etc/hadoop/*.xml ./input
./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.5.jar grep ./input ./output 'dfs[a-z.]+'
cat ./output/*

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>A base for other temporary directories.</description>
    </property>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
    </property>
</configuration>

cd /usr/local/hadoop
./bin/hdfs namenode -format

./sbin/start-dfs.sh

./bin/hdfs dfs -mkdir -p /user/hadoop
./bin/hdfs dfs -mkdir input
./bin/hdfs dfs -put ./etc/hadoop/*.xml input

./bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.5.jar grep input output 'dfs[a-z.]+'

./bin/hdfs dfs -cat output/*

./bin/hdfs dfs -rm -r output

./sbin/stop-dfs.sh

Hadoop 安装与使用指南：Ubuntu Kylin 环境下的单机及伪分布式部署

Hadoop 安装与使用指南

一、Linux 虚拟机准备

二、创建 Hadoop 用户

三、系统更新与工具安装

四、SSH 无密码登录配置

SSH 简介与作用

安装与配置步骤

五、Java 环境搭建

更多推荐文章

相关免费在线工具

六、单机模式安装

七、伪分布式模式安装

1. 修改配置文件

2. 初始化与启动

3. 文件操作与测试

小结

更多推荐文章

相关免费在线工具

Hadoop 安装与使用指南：Ubuntu Kylin 环境下的单机及伪分布式部署

Hadoop 安装与使用指南

一、Linux 虚拟机准备

二、创建 Hadoop 用户

三、系统更新与工具安装

四、SSH 无密码登录配置

SSH 简介与作用

安装与配置步骤

五、Java 环境搭建

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

六、单机模式安装

七、伪分布式模式安装

1. 修改配置文件

2. 初始化与启动

3. 文件操作与测试

小结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具