当前位置：移动技术网 > 科技>人工智能>云计算 > Hive使用概述以及环境配置

Hive使用概述以及环境配置

2018年03月05日 | 移动技术网科技 | 我要评论

本文概述：

Hive产生背景

Hive是什么

为什么要使用Hive

Hive部署架构

Hive与RDBMS的关系、区别

Hive的优缺点

Hive适用场景

Hive环境搭建

Hive产生背景：

MapReduce编程的不便性

传统Rdbms人员的需要

Hive是什么：

由Facebook开源，最初用于解决海量结构化的日志数据统计问题

构建在Hadoop之上的数据仓库

Hive定义了一种类SQL查询语言：HQL（类似SQL，但不完全相同）

通常用于进行离线数据处理（采用MapReduec）

可以认为是一个HQL=>MR的语言翻译器

底层支持多种不同的执行引擎

支持多种不同的压缩格式、存储格式以及自定义函数

为什么要使用Hive：

简单，容易上手（提供类似SQL查询语言HQL）

为超大数据集设计的计算、扩展能力（MR作为计算引擎，HDFS作为存储系统）

统一的元数据管理（可与Pig、Presto、Impala、SparkSQL等共享元数据）

Hive的体系架构

Hive部署架构

测试环境

生产环境

Hive与RDBMS的关系、区别

Hive的优缺点

优点：容易上手易用

缺点：并不能提供低延时或者实时性比较高的需求（各种启动、销毁进程的时间要长）

Hive适用场景

日志分析

海量结构化数据离线分析

Hive环境搭建

环境搭建之前先查看本地是否已经安装mysql 数据库

1、下载

2、配置hive-site.xml文件

进入hive的conf目录下，拷贝文件hive-default.xml.template命名为hive-site.xml

cp hive-default.xml.template hive-site.xml

添加如下内容：


  	//39行
hive.exec.scratchdir
 	    /home/hadoop/app/hive/tmp/hive
hive用于存储不同阶段map/reduce的执行计划及存储中间输出结果的目录

//79行
hive.downloaded.resources.dir
/home/hadoop/app/hive/tmp/${hive.session.id}_resources
            hive下载资源的存储目录
       
 //1685行
       	     hive.querylog.location
             /home/hadoop/app/hive/tmp/hive
      	     hive结构日志存储目录
    	
   	//3976行
       	 hive.server2.logging.operation.log.location
      	 /home/hadoop/app/hive/tmp/hive/operation_logs
      	 hive的操作日志目录
	
    //84行
        hive.scratch.dir.permission
        700
        hive访问hadoop文件权限设置
   	
   //529行
        javax.jdo.option.ConnectionPassword
        P@ssw0rd
        元数据存储的数据库的密码
    	
    //1044行
       	 javax.jdo.option.ConnectionUserName
       	 root
       	 元数据存储数据库的用户名
    	
    //545行
        javax.jdo.option.ConnectionURL
       	jdbc:mysql://localhost:3306/hive_metadatacreateDatabaseIfNotExist=true&characterEncoding=utf8
        元数据存储的数据库的url
    	
   //1020行
        javax.jdo.option.ConnectionDriverName
        com.mysql.jdbc.Driver
       	元数据存储的数据库的驱动
    	
    //741行
        datanucleus.schema.autoCreateAll
        true
       	 开启自动创建（生产环境中不推荐使用）
    
    //746行
        hive.metastore.schema.verification
        false
    
  
    //2445行
    	 hive.optimize.sort.dynamic.partition
    	 false
    
    //2775行
    hive.support.concurrency
        true
   
   找不到的话，在任意位置添加上即可
   	hive.enforce.bucketing
   	true
   
   //250行
   	hive.exec.dynamic.partition.mode
   	nonstrict
   
   //2870行
   	hive.txn.manager
   	org.apache.hadoop.hive.ql.lockmgr.DbTxnManager
   
   //2964行
   hive.compactor.initiator.on
   	true
   
   //2974行
   hive.compactor.worker.threads
   1
   
   找不到的话，在任意位置添加上即可
   	hive.in.test
   	true
   
   
    //1195
   	hive.cli.print.current.db
   	true

3、lib下面添加mysql依赖包

mysql-connector-java-5.1.7-bin

4、添加hive配置

#hive

export HIVE_HOME=/home/hadoop/app/hive

export PATH=$ZK_HOME/bin:$PATH

5、启动hive

hiveserver2

beeline -u jdbc:hive2://

成功之后mysql下会多出一个hive数据库

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

云计算将带来商业模式革命概念股“千里挑一”

　　国金证券通信行业首席分析师陈运红：云计算将带来商业模式革命概念股“千里挑一” 　　江怡曼　　提到云计... [阅读全文]
虚拟化和云计算路向何方？

　　我们正处于一个有趣的历史节点。VMware公司的成功源于我们拥有的非常引人注目的价值主张——解决客户端-服务器时代的不... [阅读全文]
企业级虚拟化平台是云计算必由之路

　　6月20日，IBM新一代企业基础云平台研讨会在北京举行。IBM大中华区系统与科技部Power Systems高级产品经理谷建发表了主题演讲。谷... [阅读全文]
打造免费云平台十大与云有关开源项目

　　开源项目由于其开放、免费、自由灵活等特点深受广大开发者的喜爱。近年涌现了很多开源免费的东西深受欢迎。而云计算则是近段时间最热的科技名词，云计算... [阅读全文]
Oracle刘松：客户体验管理与社会化云服务平台

10月26日消息，由工信部信息化推进司指导，中国计算机用户协会与中国网上银行促进联盟主办的“2012年网银联盟大会暨电子银行创新颁奖典... [阅读全文]
胡斌：做大数据最终是要为公司带来变化的

10月24日“中国TMT国际商会月度英雄汇”在北京召开。胡斌在圆桌对话“大数据时代的机遇与挑战”中... [阅读全文]
确保云安全的五种服务器配置方法

　　越来越多的数据中心已经搬到了各种各样的云上，服务器配置是必须考虑的问题。　　云计算将是收缩数据中心的关键，显然这可能带来一些安全问题... [阅读全文]
跨入云计算时代传统服务器走将向何处？

　　云的出现，正在改变我们对于传统IT的观念认识。云并不像它的概念一样虚无缥缈，而是以各种形式出现在我们面前，而最让人耳熟能详的莫过于云存储和云计... [阅读全文]
解读透明计算：是云计算升级还是产业界革命

　　你知道云计算吗？不少读者可能会说，嗯，我听说过，但是具体是怎么定义还是不太了解。虽然概念上不是很明白，但起码云计算到现在已经是人尽皆知。不过就... [阅读全文]
十二大技巧保障云计算安全

　　1、确认现有的基础控制　　基础控制是企业安全理念的核心。它们包含了将近60个保护您企业最重要资产的安全控制。它们专注在确保云技术对您... [阅读全文]

网友评论


验证码：

Hive使用概述以及环境配置

2018年03月05日 | 移动技术网科技 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论