您当前的位置:首页 > 互联网百科 > 大数据

Hive3.1.0入门:安装部署详解

时间:2020-03-28 15:11:31  来源:  作者:

微信公众号: 大数据开发运维架构

关注可了解更多大数据相关的资讯。问题或建议,请公众号留言;

如果您觉得“大数据开发运维架构”对你有帮助,欢迎转发朋友圈


一、概述

 

这里简单说明一下,Hive是建立在Hadoop上的,通过HiveQL来实现对Hadoop下的数据管理。Hive属于数据仓库的范畴,适合用来对一段时间内的数据进行分析查询,例如,用来计算趋势或者网站的日志。Hive不应该用来进行实时的查询。因为它需要很长时间才可以返回结果。

 

软件版本信息:

Hadoop3.1.1

JDK1.8

HIVE3.1.0

 

二、安装步骤

 

1.可从官网下载Hive各个版本的安装包和源码包,我这里下载的是Apache-hive-3.1.0-bin.tar.gz,下载地址: http://archive.apache.org/dist/hive/

 

2.把apache-hive-1.2.1-bin.tar.gz上传到linux的/data/目录下,并进行解压,命令如下:

[root@worker2 data]# tar -zxvf apache-hive-3.1.0-bin.tar.gz
[root@worker2 data]# mv apache-hive-3.1.0-bin  hive-3.1.0

 

3.修改conf目录下配置文件

 

1).hive-env.sh文件

[root@worker2 conf]# cp hive-env.sh.template hive-env.sh
[root@worker2 conf]# vi hive-env.sh 

 

在hive-env.sh文件添加如下内容:

#JDK
 export JAVA_HOME= /opt/jdk1.8.0_112
 #指定hadoop目录
 export HADOOP_HOME=/usr/hdp/3.1.4.0-315/hadoop
 #指定conf配置路径
 export HIVE_CONF_DIR=/data/hive-3.1.0/conf
 #指定依赖的lib
 export HIVE_AUX_JARS_PATH=/data/hive-3.1.0/lib

2).hive 的日志默认在/tmp/${user}/hive.log目录下(user用户名下),修改hive的log存放日志到/data/hive-3.1.0/logs,执行命令:

   mv hive-log4j2.properties.template  hive-log4j2.properties

修改hive-log4j2.properties如下内容:

 property.hive.log.dir=/data/hive-3.1.0/logs

3).hive-site.xml文件,主要是配置hive元数据库连接信息、数据在hdfs存储目录信息等;

[root@worker2 conf]# mv hive-default.xml.template  hive-site.xml
[root@worker2 conf]# vi   hive-site.xml

在hive-site.xml文件添加如下内容:

<configuration>
 <property>
 <name>javax.jdo.option.ConnectionURL</name>
 <value>jdbc:MySQL://master.hadoop.ljs:3306/hive?createDatabaseIfNotExist=true&characterEncoding=UTF-8&useSSL=false</value>
 </property>
 <property>
       <name>hive.metastore.schema.verification</name>
       <value>false</value>
   </property>
 <property>
 <name>javax.jdo.option.ConnectionDriverName</name>
 <value>com.mysql.cj.jdbc.Driver</value>
 </property>
 
 <property>
 <name>javax.jdo.option.ConnectionUserName</name>
 <value>hive</value>
 </property>
 
 <property>
 <name>javax.jdo.option.ConnectionPassword</name>
 <value>123456a?</value>
 </property>
 <property>
     <name>datanucleus.schema.autoCreateAll</name>
     <value>true</value>
  </property>
     <property>
     <name>hive.metastore.warehouse.dir</name>
     <value>/user/hive/warehouse</value>
  </property>
  <property>
     <name>hive.server2.webui.host</name>
     <value>192.168.0.103</value>
  </property>
  <property>
     <name>hive.server2.webui.port</name>
     <value>10002</value>
  </property>
 </configuration>

4.配置完成后,初始化mysql元数据库,初始化之前,需要把对应版本的mysql驱动包放到hive/lib目录下:

[root@worker2 lib]# pwd
/data/hive-3.1.0/lib
[root@worker2 lib]# ll *mysql-connector*
-rwxrwxrwx 1 root root 1004838 3月  21 22:13 mysql-connector-java-5.1.46.jar

使用schemaTool初始化mysql数据库

schematool -dbType mysql -initSchema

5.配置环境变量,在/etc/profile中添加如下内容:

export HADOOP_HOME=/usr/hdp/3.1.4.0-315/hadoop
export HIVE_HOME=/data/hive-3.1.0
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HBASE_HOME/bin:$HIVE_HOME/bi

使配置生效:

source /etc/profile

6.启动Hive

#run  metastore
hive --service metastore &
#run hiveserver2
hive --service hiveserver2  --hiveconf hive.root.logger=INFO,console &

报错信息处理:

 

1.报错信息:

Hive3.1.0入门:安装部署详解

 

 

这里hive的guava包与hadoop中的guava版本不一致,直接从hadoop/lib下拷贝对应的guava包,覆盖掉hive/lib下的即可。

[root@worker2 lib]# ll *guava*
-rw-r--r-- 1 root root 2308517 7月  10 2018 guava-19.0.jar
-rw-r--r-- 1 root root  971309 7月  10 2018 jersey-guava-2.25.1.jar
[root@worker2 lib]# cp /usrp/3.1.4.0-315/hadoop/lib/guava-28.0-jre.jar  ./
[root@worker2 lib]# rm -rf  guava-19.0.jar
[root@worker2 lib]# ll *guava*
-rw-r--r-- 1 root root 2746681 3月  21 22:17 guava-28.0-jre.jar
-rw-r--r-- 1 root root  971309 7月  10 2018 jersey-guava-2.25.1.jar

2.报错信息:

Hive3.1.0入门:安装部署详解

 

 

这里需要在hdfs的配置文件core-site.xml中加上代理用户,添加配置如下:

  <property>
      <name>hadoop.proxyuser.hive.groups</name>
      <value>*</value>
    </property>

    <property>
      <name>hadoop.proxyuser.hive.hosts</name>
      <value>*</value>
    </property>

如果觉得我的文章能帮到您,请关注微信公众号“大数据开发运维架构”,并转发朋友圈,谢谢支持!!!



Tags:Hive3.1.0   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
这里简单说明一下,Hive是建立在Hadoop上的,通过HiveQL来实现对Hadoop下的数据管理。Hive属于数据仓库的范畴,适合用来对一段时间内的数据进行分析查询,例如,用来计算趋势或者网站的日志。Hive不应该用来进行实时的查询。因...【详细内容】
2020-03-28  Tags: Hive3.1.0  点击:(116)  评论:(0)  加入收藏
▌简易百科推荐
前言什么是数据脱敏数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护常用脱敏规则替换、重排、加密、截断、掩码良好的数据脱敏实施1、尽...【详细内容】
2021-12-28  linyb极客之路    Tags:数据脱敏   点击:(3)  评论:(0)  加入收藏
张欣安科瑞电气股份有限公司 上海嘉定 201801 摘要:随着电力行业各系统接入,海量数据涌现,如何利用电网信息化中大量数据,对客户需求进行判断分析,服务于营销链条,提升企业市场竞...【详细内容】
2021-12-14  安科瑞张欣    Tags:大数据   点击:(10)  评论:(0)  加入收藏
1、什么是数据分析结合分析工具,运用数据分析思维,分析庞杂数据信息,为业务赋能。 2、数据分析师工作的核心流程:(1)界定问题:明确具体问题是什么;●what 发生了什么(是什么)●why 为...【详细内容】
2021-12-01  逆风北极光    Tags:大数据   点击:(26)  评论:(0)  加入收藏
在实际工作中,我们经常需要整理各个业务部门发来的数据。不仅分散,而且数据量大、格式多。单是从不同地方汇总整理这些原始数据就花了大量的时间,更不用说还要把有效的数据收集...【详细内容】
2021-11-30  百数    Tags:数据   点击:(21)  评论:(0)  加入收藏
数据作为新的生产要素,其蕴含的价值日益凸显,而安全问题却愈发突出。密码技术,是实现数据安全最经济、最有效、最可靠的手段,对数据进行加密,并结合有效的密钥保护手段,可在开放环...【详细内容】
2021-11-26  炼石网络    Tags:数据存储   点击:(17)  评论:(0)  加入收藏
导读:网易大数据平台的底层数据查询引擎,选用了Impala作为OLAP查询引擎,不但支撑了网易大数据的交互式查询与自助分析,还为外部客户提供了商业化的产品与服务。今天将为大家分享...【详细内容】
2021-11-26  DataFunTalk    Tags:大数据   点击:(15)  评论:(0)  加入收藏
导读:数据挖掘是一种发现知识的手段。数据挖掘要求数据分析师通过合理的方法,从数据中获取与挖掘项目相关的知识。作者:赵仁乾 田建中 叶本华 常国珍来源:华章科技数据挖掘是一...【详细内容】
2021-11-23  华章科技  今日头条  Tags:数据挖掘   点击:(20)  评论:(0)  加入收藏
今天再给大家分享一个不错的可视化大屏分析平台模板DataColour。 data-colour 可视化分析平台采用前后端分离模式,后端架构设计采用微服务架构模式。 前端技术:Angularjs、Jq...【详细内容】
2021-11-04  web前端进阶    Tags:DashboardClient   点击:(40)  评论:(0)  加入收藏
在Kubernetes已经成了事实上的容器编排标准之下,微服务的部署变得非常容易。但随着微服务规模的扩大,服务治理带来的挑战也会越来越大。在这样的背景下出现了服务可观测性(obs...【详细内容】
2021-11-02  大数据推荐杂谈    Tags:Prometheus   点击:(40)  评论:(0)  加入收藏
同一产品对老客户的要价竟然比新客户要高?这是当下“大数据杀熟”的直接结果。近年来,随着平台经济的蓬勃发展,大数据在为用户服务之外,也引发了多种不合理现象。为了有效遏制“...【详细内容】
2021-10-29    海外网   Tags:大数据   点击:(31)  评论:(0)  加入收藏
相关文章
    无相关信息
最新更新
栏目热门
栏目头条