在CentOS上安装和配置Hadoop是一个相对复杂的过程,需要多个步骤来完成,下面将详细介绍如何在CentOS上安装Hadoop,并包括一些常见问题的解答。
安装环境准备
1、虚拟机设置:在三台虚拟机上安装CentOS系统,使用NET模式连接有线网络。
2、软件下载:从官方网站下载JDK和Hadoop安装包。
3、工具准备:在Windows上安装XShell5,用于连接虚拟机。
JDK安装及配置
1、解压JDK:将JDK安装包解压至/software
目录。
```bash
tar zxvf jdk8u161linuxx64.tar.gz C /software/
```
2、配置环境变量:编辑/etc/profile
文件,添加以下内容:
```bash
export JAVA_HOME=/software/jdk1.8.0_161
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
```
3、刷新配置:使配置生效。
```bash
source /etc/profile
```
4、验证安装:检查Java版本。
```bash
java version
```
Hadoop安装及配置
1、解压Hadoop:将Hadoop安装包解压至/software
目录。
```bash
tar zxvf hadoop2.7.3.tar.gz C /software/
```
2、配置Hadoop环境变量:在/etc/profile
文件中添加以下内容:
```bash
export HADOOP_HOME=/software/hadoop2.7.3
export PATH=$HADOOP_HOME/bin:$PATH
```
3、刷新配置:使配置生效。
```bash
source /etc/profile
```
集群配置
1、配置hosts文件:编辑/etc/hosts
文件,添加各服务器的静态IP和主机名。
```txt
192.168.1.2 master
192.168.1.3 slave1
192.168.1.4 slave2
```
2、配置HDFS:编辑coresite.xml
文件,设置NameNode地址。
```xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
</configuration>
```
3、配置YARN:编辑yarnsite.xml
文件,设置ResourceManager地址。
```xml
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
</configuration>
```
4、配置MapReduce:编辑mapredsite.xml
文件,设置MapReduce框架为YARN。
```xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
```
SSH免密码登录配置
1、生成密钥对:在主节点上生成SSH密钥对。
```bash
sshkeygen t rsa
```
2、拷贝公钥:将公钥复制到从节点的authorized_keys
文件中。
```bash
sshcopyid user@slave1
sshcopyid user@slave2
```
FAQs
1、Q: 为什么需要配置SSH免密码登录?
A: 配置SSH免密码登录是为了方便在集群中的主节点和从节点之间进行无障碍通信和操作,这对于管理和自动化脚本执行非常重要。
2、Q: Hadoop启动时报“Connection refused”错误怎么办?
A: 这种错误通常是由于Hadoop服务未正确启动或配置文件有误导致的,首先检查Hadoop相关的日志文件以获取更多信息,然后确保所有配置文件(如coresite.xml
、hdfssite.xml
等)中的端口号和主机名设置正确,如果问题仍然存在,尝试重启Hadoop服务。