Ubuntu 下安装 Hadoop 伪分布式环境详细步骤

请自行安装 Ubuntu 系统。

如果在安装 Ubuntu 的时候不是用的'hadoop'用户，这时需要增加一个名为 hadoop 的用户。首先打开终端窗口，输入如下命令创建新用户：

sudo useradd -m hadoop -s /bin/bash

接着使用如下命令设置密码，按提示输入两次密码：

sudo passwd hadoop

可为 hadoop 用户增加管理员权限，方便部署，避免一些对新手来说比较困难的权限问题：

sudo adduser hadoop sudo

最后注销当前用户（点击屏幕右上角的齿轮，选择注销），返回登陆界面。在登陆界面中选择刚创建的 hadoop 用户进行登陆。

用 hadoop 用户登录后，我们要先更新一下 apt，后续我们会使用 apt 安装软件。打开终端窗口，输入如下命令：

sudo apt-get update

执行这个命令时，会让你输入 hadoop 用户的密码。

后续需要更改一些配置文件，我这里使用的是 vim，使用如下命令进行安装 vim：

sudo apt-get install vim

安装软件时根据提示输入 Y。

集群、单节点模式都需要用到 SSH 登陆，Ubuntu 默认已安装了 SSH client，但还需要安装 SSH server，命令如下：

sudo apt-get install openssh-server

安装后，使用如下命令登陆本机：

ssh localhost

输入该命令会有如下提示 (SSH 首次登陆提示)，这时按照提示输入 yes。然后按提示输入密码，这样就登陆到本机了。

但是这样登陆每次都需要输入密码，所以我们需要配置成 SSH 无密码登陆。首先退出刚才的 ssh，就回到了我们原先的终端窗口，然后利用 ssh-keygen 生成密钥，并将密钥加入到授权中：

exit
# 退出刚才的 ssh localhost
cd ~/.ssh/
# 若没有该目录，请先执行一次 ssh localhost
ssh-keygen -t rsa
# 会有提示，都按回车就可以
cat ./id_rsa.pub >> ./authorized_keys
# 加入授权

我这里使用的共享方式安装的 JDK。首先点击虚拟机设置，点击选项，再点击共享文件夹，选择总是启用或者是在下次关机或挂起前一直启用。

点击添加，出现如下图所示：

然后点击下一步，添加共享文件夹向导，选择浏览，选择主机路径，设置名称（名称可不改，看自己命名习惯），再点击下一步，再点击完成，最后点击确定，共享文件夹就设置成功了。

更多推荐文章