CentOS Impala 搭建指南

简介
Impala 是一个基于 Hadoop 的实时查询引擎,可以在 Hadoop 文件系统上执行 SQL 查询,本文将详细介绍如何在 CentOS 系统上搭建 Impala 集群。
环境准备
- 操作系统:CentOS 7.x
- Hadoop 集群:Hadoop 2.x
- Java 环境:Java 1.8
- 数据库:MySQL(可选)
安装步骤
安装 Java
# 安装 Java sudo yum install java-1.8.0-openjdk -y # 检查 Java 版本 java -version
安装 Hadoop

# 安装 Hadoop sudo yum install hadoop -y # 配置 Hadoop sudo vi /etc/hadoop/hadoop-env.sh # 添加以下内容 export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk.x86_64
安装 Impala
# 安装 Impala sudo yum install impala -y # 配置 Impala sudo vi /etc/impala/conf/impala-env.sh # 添加以下内容 export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk.x86_64 sudo vi /etc/impala/conf/impala-server.properties # 修改以下内容 # queryserver.log.dir=/var/log/impala/queryserver # queryserver.log.level=INFO # queryserver.host=localhost # queryserver.port=21050
启动 Impala 服务
# 启动 Impala 服务 sudo impala-server start # 检查 Impala 服务状态 sudo impala-shell -q "show clusters"
配置 MySQL(可选)
# 安装 MySQL sudo yum install mysql -y # 安装 MySQL 连接器 sudo yum install mysql-connector-java -y # 配置 MySQL sudo vi /etc/impala/conf/impala-env.sh # 添加以下内容 export MYSQL_HOME=/usr/lib64/mysql export PATH=$PATH:$MYSQL_HOME/bin sudo vi /etc/impala/conf/impala-server.properties # 修改以下内容 # mysql.driver=/usr/lib64/mysql-connector-java-5.1.46-bin.jar # mysql.host=localhost # mysql.port=3306 # mysql.user=root # mysql.password=root # mysql.database=impala
测试 Impala
# 使用 impala-shell 连接 Impala impala-shell # 执行 SQL 查询 use default; show tables;
FAQs
问题:如何查看 Impala 集群状态?

解答: 在终端执行以下命令查看 Impala 集群状态:
sudo impala-shell -q "show clusters"
问题:如何修改 Impala 服务端口?
解答: 修改
/etc/impala/conf/impala-server.properties文件中的queryserver.port属性,queryserver.port=21051

