0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据入门分享:Hive应用场景

454398 来源:加米谷学院 作者:加米谷 2020-12-08 12:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在大数据的发展当中,大数据技术生态的组件,也在不断地拓展开来,而其中的Hive组件,作为Hadoop的数据仓库工具,可以实现对Hadoop集群当中的大规模数据进行相应的数据处理。今天我们的大数据入门分享,就主要来讲讲,Hive应用场景。

关于Hive,首先需要明确的一点就是,Hive并非数据库,Hive所提供的数据存储、查询和分析功能,本质上来说,并非传统数据库所提供的存储、查询、分析功能。

Hive数据仓库工具将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。通过类SQL语句实现快速MapReduce统计,使MapReduce编程变得更加简单易行。

Hive应用场景

总的来说,Hive是十分适合数据仓库的统计分析和Windows注册表文件。

Hive在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS(Hive superimposes structure on data in HDFS),并允许使用类似于SQL语法进行数据查询。

Hive更适合于数据仓库的任务,主要用于静态的结构以及需要经常分析的工作。Hive与SQL相似促使其成为Hadoop与其他BI工具结合的理想交集。

Hive使用

Hive在Hadoop之上,使用Hive的前提是先要安装Hadoop。

Hive要分析的数据存储在HDFS,Hive为数据创建的表结构(schema),存储在RDMS(relevant database manage system关系型数据库管理系统,比如mysql)。

Hive构建在基于静态批处理的Hadoop之上,Hadoop通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销。因此,Hive并不能够在大规模数据集上实现低延迟快速的查询,例如,Hive在几百MB的数据集上执行查询一般有分钟级的时间延迟。

Hive查询操作过程严格遵守Hadoop MapReduce的作业执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduce作业提交到Hadoop集群上,Hadoop监控作业执行过程,然后返回作业执行结果给用户。Hive的最佳使用场合是大数据集的批处理作业,例如,网络日志分析。

Hive优缺点

优点:

操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。

Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。

Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。

Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。

缺点:

1.Hive的HQL表达能力有限

(1)迭代式算法无法表达递归算法

(2)数据挖掘方面不擅长(数据挖掘和算法机器学习

2.Hive的效率比较低

(1)Hive自动生成的MapReduce作业,通常情况下不够智能化

(2)Hive调优比较困难,粒度较粗(快)

关于大数据培训,Hive应用场景,以上就为大家做了大致的介绍了。在大数据应用场景下,Hive更多是作为Hadoop的一个数据仓库工具,并不直接存储数据,但是却不可或缺。
编辑:hfy

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大数据
    +关注

    关注

    64

    文章

    9093

    浏览量

    144047
  • hive
    +关注

    关注

    0

    文章

    12

    浏览量

    4149
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Neway电机方案在电机控制的应用场景

    Neway电机方案在电机控制的应用场景Neway电机方案在电机控制领域的应用场景广泛且效果显著,其核心优势在步进电机、伺服电机控制及CNC机床主轴驱动等场景中得到了充分验证。一、步进电机与伺服电机
    发表于 01-04 10:10

    请问C语言中整形溢出对哪些应用场景影响较大?

    C语言中整形溢出对哪些应用场景影响较大
    发表于 12-24 08:24

    请问MOSFET在电源管理中有哪些应用场景

    MOSFET在电源管理中有哪些应用场景
    发表于 12-23 07:07

    CW32L083系列微控制器有哪些应用场景

    CW32L083系列微控制器有哪些应用场景
    发表于 12-16 07:52

    Switch的应用场景

    Switch的应用场景如下: 调用一到多个函数 设置变量值或者返回一个值 执行一到多个代码片段 如果case标签很多,在switch的前两个使用场景中,使用查找表可以更高效的完成。例如下面的两种
    发表于 12-12 07:28

    蓝牙网关是什么?都有哪些功能?应用场景有哪些?

    点,更构建起“设备互联-数据流转-智能管控”的完整链路,成为物联网生态中不可或缺的核心组件。本文将系统解析蓝牙网关的核心价值、技术架构、应用场景、现存挑战及未来趋势,为读者呈现这一关键技术的全貌
    发表于 12-11 15:21

    智能指纹锁CW32系列有哪些应用场景

    智能指纹锁CW32系列有哪些应用场景
    发表于 12-05 06:34

    CW32L083有哪些应用场景

    CW32L083有哪些应用场景
    发表于 11-24 07:37

    请问CW32L011有哪些应用场景

    请问CW32L011有哪些应用场景
    发表于 11-17 06:25

    CW32L0系列都有哪些应用场景?有哪些优势?

    目前芯源的低功耗MCU比较火爆,就是CW32L0系列都有哪些应用场景?有哪些优势?
    发表于 11-14 06:03

    湖北大数据集团到访维智科技参观交流

    近日,湖北大数据集团有限公司党委书记、董事长汪小波率队到访维智科技。双方围绕时空数据融合、公共数据授权运营及行业应用场景开发等议题展开深入探讨。
    的头像 发表于 11-03 10:02 748次阅读

    传感器数据采集的应用场景有哪些

    传感器数据采集的应用场景广泛覆盖工业、农业、医疗、交通、环保、消费电子等多个领域,其核心是通过实时感知物理世界的数据,为决策、控制或优化提供依据。以下是具体的应用场景分类及案例: 一、
    的头像 发表于 07-14 15:54 2225次阅读

    milvus向量数据库的主要特性和应用场景

    Milvus 是一个开源的向量数据库,专门为处理和分析大规模向量数据而设计。它适用于需要高效存储、检索和管理向量数据的应用场景,如机器学习、人工智能、计算机视觉和自然语言处理等。
    的头像 发表于 07-04 11:36 1224次阅读
    milvus向量<b class='flag-5'>数据</b>库的主要特性和应<b class='flag-5'>用场景</b>

    电力智慧场站核心功能与应用场景详解

    电力智慧场站是基于物联网、大数据和人工智能技术的智能化电力运维系统,主要实现对汇流箱、环网柜、压板等关键设备的实时监测与智能分析,提升电力系统的安全性、可靠性和运维效率。以下是其主要功能和应用场景的详细介绍。
    的头像 发表于 06-28 09:44 1299次阅读

    UWB应用场景

    鸿合智远|捷扬微-产品简介介绍:UWB应用场景
    的头像 发表于 05-12 10:05 1199次阅读
    UWB应<b class='flag-5'>用场景</b>