HCRM博客

CentOS系统下Hadoop安装指南

CentOS 如何安装 Hadoop:

CentOS系统下Hadoop安装指南-图1

准备工作

在开始安装 Hadoop 之前,我们需要确保系统满足以下要求:

  1. 操作系统:CentOS 7 或更高版本
  2. 硬件要求:至少 4GB 内存,推荐 8GB 或以上
  3. JDK:Hadoop 需要Java运行环境,推荐安装 JDK 1.8 或更高版本
  4. 网络环境:确保网络畅通,以便下载 Hadoop 安装包

安装 JDK

  1. 下载 JDK 安装包

    访问 Oracle 官网下载 JDK 1.8 或更高版本的安装包,选择适合自己系统的版本。

  2. 安装 JDK

    将下载的 JDK 安装包上传到服务器,解压到指定目录,/usr/local/jdk1.8.0_251

    编辑 /etc/profile 文件,添加以下内容:

    export JAVA_HOME=/usr/local/jdk1.8.0_251
    export PATH=$PATH:$JAVA_HOME/bin

    使配置生效:

    source /etc/profile

    验证 JDK 安装:

    java -version

    如果输出类似 java version "1.8.0_251" 的信息,则表示 JDK 安装成功。

安装 Hadoop

  1. 下载 Hadoop 安装包

    访问 Apache Hadoop 官网下载适合自己系统的 Hadoop 安装包。

  2. 安装 Hadoop

    将下载的 Hadoop 安装包上传到服务器,解压到指定目录,/usr/local/hadoop-3.3.4

    CentOS系统下Hadoop安装指南-图2

    编辑 /etc/profile 文件,添加以下内容:

    export HADOOP_HOME=/usr/local/hadoop-3.3.4
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    使配置生效:

    source /etc/profile

    验证 Hadoop 安装:

    hadoop version

    如果输出类似 Hadoop 3.3.4 的信息,则表示 Hadoop 安装成功。

配置 Hadoop

  1. 配置环境变量

    编辑 /etc/profile 文件,添加以下内容:

    export HADOOP_HOME=/usr/local/hadoop-3.3.4
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    使配置生效:

    source /etc/profile
  2. 配置 Hadoop 配置文件

    将 Hadoop 配置文件模板复制到 /usr/local/hadoop-3.3.4/etc/hadoop 目录下:

    cp /usr/local/hadoop-3.3.4/etc/hadoop/core-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/core-site.xml
    cp /usr/local/hadoop-3.3.4/etc/hadoop/hdfs-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/hdfs-site.xml
    cp /usr/local/hadoop-3.3.4/etc/hadoop/yarn-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/yarn-site.xml
    cp /usr/local/hadoop-3.3.4/etc/hadoop/mapred-site.xml.template /usr/local/hadoop-3.3.4/etc/hadoop/mapred-site.xml

    编辑 core-site.xml 文件,配置 Hadoop 的工作目录:

    <configuration>
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://localhost:9000</value>
        </property>
    </configuration>

    编辑 hdfs-site.xml 文件,配置 HDFS 的工作目录:

    <configuration>
        <property>
            <name>dfs.replication</name>
            <value>1</value>
        </property>
    </configuration>

    编辑 yarn-site.xml 文件,配置 YARN 的工作目录:

    <configuration>
        <property>
            <name>yarn.resourcemanager.hostname</name>
            <value>localhost</value>
        </property>
    </configuration>

    编辑 mapred-site.xml 文件,配置 MapReduce 的工作目录:

    <configuration>
        <property>
            <name>mapreduce.framework.name</name>
            <value>yarn</value>
        </property>
    </configuration>

格式化 HDFS

在配置完成后,我们需要格式化 HDFS:

CentOS系统下Hadoop安装指南-图3

hdfs namenode -format

启动 Hadoop 服务

  1. 启动 NameNode:

    start-dfs.sh
  2. 启动 ResourceManager:

    start-yarn.sh
  3. 启动 HistoryServer:

    mr-jobhistory-daemon.sh start historyserver

验证 Hadoop 是否启动成功

在浏览器中访问 http://localhost:50070 查看 HDFS Web 界面,访问 http://localhost:8088 查看 ResourceManager Web 界面,访问 http://localhost:19888 查看HistoryServer Web 界面。

FAQs:

  1. 问题:如何查看 Hadoop 的进程?

    解答:使用以下命令查看 Hadoop 进程:

    jps

    输出结果中包含 NameNode、ResourceManager、DataNode、NodeManager、SecondaryNameNode 等进程,表示 Hadoop 服务已启动。

  2. 问题:如何停止 Hadoop 服务?

    解答:使用以下命令停止 Hadoop 服务:

    stop-dfs.sh
    stop-yarn.sh
    mr-jobhistory-daemon.sh stop historyserver

    停止服务后,再次使用 jps 命令查看进程,确认 Hadoop 进程已停止。

本站部分图片及内容来源网络,版权归原作者所有,转载目的为传递知识,不代表本站立场。若侵权或违规联系Email:zjx77377423@163.com 核实后第一时间删除。 转载请注明出处:https://blog.huochengrm.cn/pc/51276.html

分享:
扫描分享到社交APP
上一篇
下一篇
发表列表
请登录后评论...
游客游客
此处应有掌声~
评论列表

还没有评论,快来说点什么吧~