0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

HBase是什么 HBase八大应用场景介绍

美信半导体 来源:未知 作者:工程师飞燕 2018-11-11 11:05 次阅读

HBase概述

HBase是一个分布式存储、数据库引擎,可以支持千万的QPS、PB级别的存储,这些都已经在生产环境验证,并且在广大的公司已经验证。特别是阿里、小米、京东、滴滴内部都有数千、上万台的HBase集群。选择一个技术的首要条件是对齐大公司,大公司会投入大量的人力去维护、改进、贡献社区。

关于NewSQL与NoSQL的关系

技术总是不断向前发展的,如今都在提NewSQL,其实NewSQL在笔者看来是NoSQL之上的一个封装,一个子场景。NoSQL中的大表,典型就是提供了KV1V2……Vn,其中每个V可以是1b,也可以是100MB。可以说是一个元的存在,就类似于数字世界的01,可以任意组合。在以HBase为代表的NoSQL中,HBase可以组合出任意的场景,NewSQL可以是之上加了SQL层或者更近一层添加事务的子场景。

关于计算与存储分离

在云上,对于引擎最为核心的就是存储计算分离,存储可以按需计费,起码得弹性伸缩。计算则按节点存储提供。如果完全按照QPS计费,要么费用高得吓人,要么难以满足更多的场景,比如存储10M,到底算一次QPS,还是多少次。 由于HBase天生就是存储计算分离,天然比较适配云上的架构,可以说到了云上,HBase更加具有优势。

HBase场景

HBase可以说是一个数据库,也可以说是一个存储。拥有双重属性的HBase天生就具备广阔的应用场景。在最近的一些版本中,引入了OffHeap降低gc影响,优化链路延迟,提供Replica等可以满足在线的需求。引入MOB,可以存储10M左右的对象,完全适应了对象存储。另外由于自身的并发能力、存储能力,可以说是具有最为竞争力的引擎。

对象存储:我们知道不少的头条类、新闻类的的新闻、网页、图片存储在HBase之中,一些病毒公司的病毒库也是存储在HBase之中。

时序数据:HBase之上有OpenTSDB模块,可以满足时序类场景的需求。

推荐画像:特别是用户的画像,是一个比较大的稀疏矩阵,蚂蚁的风控就是构建在HBase之上。

时空数据:主要是轨迹、气象网格之类,滴滴打车的轨迹数据主要存在HBase之中,另外在技术所有大一点的数据量的车联网企业,数据都是存在HBase之中。

CubeDB OLAP:Kylin一个cube分析工具,底层的数据就是存储在HBase之中,不少客户自己基于离线计算构建cube存储在hbase之中,满足在线报表查询的需求。

消息/订单:在电信领域、银行领域,不少的订单查询底层的存储,另外不少通信、消息同步的应用构建在HBase之上。

Feeds流:典型的应用就是xx朋友圈类似的应用。

NewSQL:之上有Phoenix的插件,可以满足二级索引、SQL的需求,对接传统数据需要SQL非事务的需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Hbase
    +关注

    关注

    0

    文章

    26

    浏览量

    11099
  • nosql
    +关注

    关注

    0

    文章

    38

    浏览量

    9919

原文标题:技术直播 | 借助Maxim的模拟技术优化设计

文章出处:【微信号:Maxim_Integrated,微信公众号:美信半导体】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    再谈全局网HBase八大用场景

    摘要: HBase可以说是一个数据库,也可以说是一个存储。拥有双重属性的HBase天生就具备广阔的应用场景。在2.0中,引入了OffHeap降低了延迟,可以满足在线的需求。引入MOB,可以存储10M
    发表于 04-11 11:14

    HBase性能优化方法总结

    HBase是Hadoop生态系统中的一个组件,是一个分布式、面向列的开源数据库,可以支持数百万列、超过10亿行的数据存储,因此,对HBase性能提出了一定的要求,那么如何进行HBase性能优化呢
    发表于 04-20 17:16

    阿里HBase的数据管道设施实践与演进

    ,数据仓会产生报表,然后去训练路由算法。淘宝客服淘宝客服的一个退款应用场景如上图。这是一个逆向链接,把退款、纠纷、退款物流、退款费用等实时的写入到HBase里,HBase会实时的写入queue里
    发表于 05-29 20:34

    企业打开云HBase的正确方式,来自阿里云云数据库团队的解读

    的社区之一。在大批知名公司的推动下,以及结合HBase自身的能力,HBase用场景非常广泛,例如Cube分析、推荐画像、对象存储、消息/订单存储、时序数据、Feeds流、时空数据、NewSQL等多个领域
    发表于 05-31 15:57

    HBase read replicas 功能介绍系列

    摘要: 主要介绍HBase 在读可用性这块做的read replica 功能的大概介绍,包括:基本使用,读写流程的大概链路,设计的折中等等。HBase read replicas1.概
    发表于 06-12 16:02

    兑吧:从自建HBase迁移到阿里云HBase实战经验

    维度和指标的统计HBase在"推啊"使用场景HBase在推啊主要用于流式数据统计,存储用户画像的相关数据,属于实时统计模块中主要存储。实时统计时,对用户的行为数据根据不同维度不同指
    发表于 06-19 17:32

    关于Hbase的全面介绍

    Hbase原理与使用
    发表于 07-25 14:58

    Linux的HBase安装步骤

    # /usr/hbase-0.94.16/bin/start-hbase.sh
    发表于 07-25 06:50

    HBase安装与操作指南

    HBase初识、CentOS66中HBase安装与HBase Shell简单使用
    发表于 09-20 14:51

    关于HBase的学习笔记

    初识HBase(一些HBase学习笔记)
    发表于 04-21 15:07

    hbase shell创建命名空间

    一.hbase shell创建命名空间hbase shellcreate_namespace "gofish"二.python实现hbase增删改查# -*- coding
    发表于 07-28 06:45

    基于HBase行键面向海量交通数据的HBase时空索引

    针对HBase无法直接建立时空索引所带来的交通数据查询性能问题,基于HBase行键设计了面向海量交通数据的HBase时空索引。首先利用Geohash降维方法将二维空间位置数据转化为一维编码,再与时间
    发表于 12-06 15:23 0次下载
    基于<b class='flag-5'>HBase</b>行键面向海量交通数据的<b class='flag-5'>HBase</b>时空索引

    hbase工作原理_hbase超详细介绍

    HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建大规模结构化的存储集群。hbase工作原理如下所述...
    发表于 12-27 14:17 1.8w次阅读
    <b class='flag-5'>hbase</b>工作原理_<b class='flag-5'>hbase</b>超详细<b class='flag-5'>介绍</b>

    hbase常用操作命令大全

    HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行
    发表于 12-27 15:10 2452次阅读

    Hbase的基础性介绍与入门

    无论是 NoSQL,还是大数据领域,HBase 都是非常"炙热"的一门数据库。本文将对 HBase 做一些基础性的介绍,旨在入门。
    的头像 发表于 03-15 17:21 1190次阅读
    <b class='flag-5'>Hbase</b>的基础性<b class='flag-5'>介绍</b>与入门