CentOS 测试 Hive:环境搭建与基本操作指南

简介
Hive 是一个建立在 Hadoop 之上的数据仓库工具,可以将结构化数据文件映射为一张数据库表,并提供简单的 SQL 查询功能,本文将介绍如何在 CentOS 系统上搭建 Hive 环境,并进行基本操作。
环境准备
- 操作系统:CentOS 7.x
- Hadoop:Hadoop 3.x
- Java:Java 8 或更高版本
- Hive:Hive 3.x
环境搭建
安装 Java
sudo yum install java-1.8.0-openjdk
配置 Java 环境变量
sudo vi /etc/profile
在文件末尾添加以下内容:
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.292.b10-0.el7_9.x86_64 export PATH=$PATH:$JAVA_HOME/bin
保存并退出,然后执行以下命令使配置生效:
source /etc/profile
安装 Hadoop
sudo yum install hadoop
配置 Hadoop
编辑 /etc/hadoop/hadoop-env.sh 文件,设置 JAVA_HOME:

JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.292.b10-0.el7_9.x86_64
编辑 /etc/hadoop/core-site.xml 文件,添加以下内容:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration> 编辑 /etc/hadoop/hdfs-site.xml 文件,添加以下内容:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration> 格式化 HDFS
sudo -u hdfs hadoop fs -format
启动 Hadoop
sudo systemctl start hadoop-hdfs sudo systemctl start hadoop-yarn
安装 Hive
sudo yum install hive
配置 Hive
编辑 /etc/hive/hive-site.xml 文件,添加以下内容:
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.cj.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUsername</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>root</value>
</property>
</configuration> 创建 Hive 用户
sudo useradd hive sudo passwd hive
切换到 Hive 用户
su - hive
基本操作
启动 Hive 服务

hive
创建数据库
CREATE DATABASE testdb;
使用数据库
USE testdb;
创建表
CREATE TABLE test_table (id INT, name STRING);
插入数据
INSERT INTO TABLE test_table VALUES (1, 'Alice');
查询数据
SELECT * FROM test_table;
FAQs
Q1:如何查看 Hive 版本信息?
A1:在 Hive 命令行中输入以下命令:
show variables like 'hive.version';
Q2:如何将 Hive 数据导出到 CSV 文件?
A2:使用以下命令将数据导出到 CSV 文件:
SELECT * FROM test_table INTO OUTFILE '/path/to/your/file.csv' ROWS SEPARATOR '\n';
