CentOS 如何安装 Hadoop:

准备工作
在开始安装 Hadoop 之前,我们需要确保系统满足以下要求:
- 操作系统:CentOS 7 或更高版本
- 硬件要求:至少 4GB 内存,推荐 8GB 或以上
- JDK:Hadoop 需要Java运行环境,推荐安装 JDK 1.8 或更高版本
- 网络环境:确保网络畅通,以便下载 Hadoop 安装包
安装 JDK
下载 JDK 安装包
访问 Oracle 官网下载 JDK 1.8 或更高版本的安装包,选择适合自己系统的版本。
安装 JDK
将下载的 JDK 安装包上传到服务器,解压到指定目录,
/usr/local/jdk1.8.0_251。编辑
/etc/profile文件,添加以下内容:export JAVA_HOME=/usr/local/jdk1.8.0_251 export PATH=$PATH:$JAVA_HOME/bin
使配置生效:
source /etc/profile
验证 JDK 安装:
java -version
如果输出类似
java version "1.8.0_251"的信息,则表示 JDK 安装成功。
安装 Hadoop
下载 Hadoop 安装包
访问 Apache Hadoop 官网下载适合自己系统的 Hadoop 安装包。
安装 Hadoop
将下载的 Hadoop 安装包上传到服务器,解压到指定目录,
/usr/local/hadoop-3.3.4。
编辑
/etc/profile文件,添加以下内容:export HADOOP_HOME=/usr/local/hadoop-3.3.4 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
使配置生效:
source /etc/profile
验证 Hadoop 安装:
hadoop version
如果输出类似
Hadoop 3.3.4的信息,则表示 Hadoop 安装成功。
配置 Hadoop
配置环境变量
编辑
/etc/profile文件,添加以下内容:export HADOOP_HOME=/usr/local/hadoop-3.3.4 export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
使配置生效:
source /etc/profile
配置 Hadoop 配置文件
将 Hadoop 配置文件模板复制到
/usr/local/hadoop-3.3.4/etc/hadoop目录下:cp /usr/local/hadoop-3.3.4/etc/hadoop/core-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/core-site.xml cp /usr/local/hadoop-3.3.4/etc/hadoop/hdfs-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/hdfs-site.xml cp /usr/local/hadoop-3.3.4/etc/hadoop/yarn-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/yarn-site.xml cp /usr/local/hadoop-3.3.4/etc/hadoop/mapred-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/mapred-site.xml
编辑
core-site.xml文件,配置 Hadoop 的工作目录:<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration>编辑
hdfs-site.xml文件,配置 HDFS 的工作目录:<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>编辑
yarn-site.xml文件,配置 YARN 的工作目录:<configuration> <property> <name>yarn.resourcemanager.hostname</name> <value>localhost</value> </property> </configuration>编辑
mapred-site.xml文件,配置 MapReduce 的工作目录:<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
格式化 HDFS
在配置完成后,我们需要格式化 HDFS:

hdfs namenode -format
启动 Hadoop 服务
启动 NameNode:
start-dfs.sh
启动 ResourceManager:
start-yarn.sh
启动 HistoryServer:
mr-jobhistory-daemon.sh start historyserver
验证 Hadoop 是否启动成功
在浏览器中访问 http://localhost:50070 查看 HDFS Web 界面,访问 http://localhost:8088 查看 ResourceManager Web 界面,访问 http://localhost:19888 查看HistoryServer Web 界面。
FAQs:
问题:如何查看 Hadoop 的进程?
解答:使用以下命令查看 Hadoop 进程:
jps
输出结果中包含 NameNode、ResourceManager、DataNode、NodeManager、SecondaryNameNode 等进程,表示 Hadoop 服务已启动。
问题:如何停止 Hadoop 服务?
解答:使用以下命令停止 Hadoop 服务:
stop-dfs.sh stop-yarn.sh mr-jobhistory-daemon.sh stop historyserver
停止服务后,再次使用
jps命令查看进程,确认 Hadoop 进程已停止。

