0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为PB级时序数据库Gauss DB,助力海量数据处理

秃头也爱科技 来源:秃头也爱科技 作者:秃头也爱科技 2022-10-15 19:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

  近年来,时序数据的应用更为广泛,包括物联网、金融领域、监控领域、医学领域、农业生产领域等各方面,都在大量使用时序数据,通过数据来研究对象的趋势性、规律性、异常性;并且在 5G人工智能的浪潮下,时序数据作为大数据、机器学习、实时预测的基础数据,作用更加显著。因此,对时序数据的研究与应用应当更为深入。

  近 5 年来,时序数据库发展十分迅猛,各大互联网企业包括 Google、阿里、Amazon 都推出自己的时序数据。

PB1.png

图 1 DB-Engines 统计不同类别数据库关注度趋势

  图 1 为 DB-Engines 统计从2018年1月到2019 年 12 月截至 24 月各类数据库的关注度趋势,可以看到时序数据库关注度同比 2017 年 12 月上涨 77.3%,相比第二名的图形数据库上涨近两倍。图 2 为 DB-Engines 统计从2013年12月到2019 年 12 月截至 6年来业内流行的时序数据库的关注度和使用度排名。

PB2.png

图 2 DB-Engines 统计时序数据库关注度趋势

  从图中可以看到,从 2015 年开始,各种时序数据库如雨后春笋般涌现。

  GaussDB(for Influx)时序数据库依靠华为在数据存储领域多年的实践经验,整合华为云的计算、存储、服务保障和安全等方面的能力,在架构、性能和数据压缩等方面进行了突破性的技术创新,达到了较好的效果,对内支撑了华为云基础设施服务,对外以服务的形式开放,帮助上云企业解决相关业务问题。

  GaussDB(for Influx) 具有支持亿级时间线、极致写入性能、低存储成本、高性能多维聚合查询和极致弹性扩缩容等5大特性。以下为特性的大致介绍:

PB3.png

  由于在时序数据库系统中,无时无刻存在大量并发查询和写入操作,因此合理控制内存的使用量就显得十分重要。而GaussDB(for Influx)便在这一问题上做了进一步优化:

  l 在内存分配与回收上,使用内存池复用技术降低内存碎片,并实现算法动态调整GC频率,加快内存回收。

  l 在单查询上,实行Quota控制,避免单查询耗尽内存。

  l 在缓存中,针对不同节点规格提供不同最优配置。

2 、极致写入性能

  GaussDB(for Influx)支持每天万亿条数据写入,在工程实现上有以下优化:

  l 利用所有节点并行写入,充分发挥集群优势。

  l Shard节点采用针对场景优化的LSM-Tree布局

  l 在大规模写入场景下,GaussDB(for Influx)的写入性能线性扩展度大于80%。

3 、低存储成本

  GaussDB(for Influx)对数据采用列式存储,相同类型的数据被集中存储,更有利于数据压缩。采用自研的时序数据自适应压缩算法,在压缩前对数据进行抽样分析,根据数据量、数据分布以及数据类型选择最合适的数据压缩算法。同时提供了时序数据的分级存储,支持用户自定义冷热数据,实现数据的冷热分离。热数据相对数据量小,访问频繁,被存储在性能更好、成本较高的存储介质上;冷数据相对数据量大,访问概率低,保存时间较久,被存储在成本较低的存储介质上,进而达到节约存储成本的目的。

4 、高性能多维聚合查询

  在提升聚合查询整体性能方面,GaussDB(for Influx)做了如下优化:

  l 采用MPP架构:一条查询语句可以在多节点及多核并发执行。

  l 向量化查询引擎:在查询结果数据量很大时,GaussDB(for Influx)内部实现了向量化查询引擎,每次迭代批量返回数据,大大减少了额外开销。

  l 增量聚合引擎:基于滑动窗口的聚合查询,大部分从聚合结果缓存中直接命中,仅需要聚合增量数据部分即可。

  l 多维倒排索引:支持多维多条件组合查询,加快数据查询中过滤无关数据。

5 、极致弹性扩缩容

  在时序数据库的运行过程中,随着业务量的增加,常常需要对数据库进行在线扩容,以满足业务的要求。

  l 传统数据库中的数据存储在本地,扩容后往往需要迁移数据。当数据量达到一定规模时,数据迁移所耗费的时间往往按天计算,给运维带来了很大的困难。

  l GaussDB(for Influx)相比于传统的数据库,最大的特点就是将计算与存储分离,能够轻松实现分钟级扩容。

  此外,在能源、制造、IOT、互联网等行业的监控统计及分析的应用场景中,时序洞察提供了针对时序数据的可视化功能。在监控领域,我们常看到能实时反映整个系统运行情况的绚丽监控大屏,这便是数据库的监控看板功能,可以高效地运用监控数据辅助定位故障、性能调优、容量规划;可以查看各产品的监控数据走势及对比;跨产品展示关键指标的实时数据、历史数据和整体走势。业务人员可以根据该信息对业务进行及时调整。

  通过对时序数据库的发展分析,时序数据库的发展空间巨大,但也存在很多问题,GaussDB(for Influx)针对其存在的问题,都进行了针对性的创新与发展,可以说GaussDB(for Influx)为时序数据库的发展提供了巨大推动力。

审核编辑 黄昊宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    217

    文章

    35782

    浏览量

    260674
  • 数据库
    +关注

    关注

    7

    文章

    3993

    浏览量

    67715
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    数据库数据恢复—服务器异常断电导致Oracle数据库故障的数据恢复案例

    Oracle数据库故障: 某公司一台服务器上部署Oracle数据库。服务器意外断电导致数据库报错,报错内容为“system01.dbf需要更多的恢复来保持一致性”。该Oracle数据库
    的头像 发表于 07-24 11:12 434次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—服务器异常断电导致Oracle<b class='flag-5'>数据库</b>故障的<b class='flag-5'>数据</b>恢复案例

    企业MySQL数据库管理指南

    在当今数字化时代,MySQL作为全球最受欢迎的开源关系型数据库,承载着企业核心业务数据的存储与处理。作为数据库管理员(DBA),掌握MySQL的企业
    的头像 发表于 07-09 09:50 504次阅读

    数据库数据恢复—MongoDB数据库文件丢失的数据恢复案例

    MongoDB数据库数据恢复环境: 一台操作系统为Windows Server的虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 工作人员在MongoDB服务仍
    的头像 发表于 07-01 11:13 454次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—MongoDB<b class='flag-5'>数据库</b>文件丢失的<b class='flag-5'>数据</b>恢复案例

    数据库数据恢复—SQL Server数据库被加密如何恢复数据

    SQL Server数据库故障: SQL Server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。
    的头像 发表于 06-25 13:54 497次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>被加密如何恢复<b class='flag-5'>数据</b>?

    MySQL数据库是什么

    开发、企业应用和大数据场景。以下是其核心特性和应用场景的详细说明: 核心特性 关系型数据库模型 数据以 表(Table) 形式组织,表由行(记录)和列(字段)构成。 通过 主键、外键 实现表间关联,支持复杂查询和事务
    的头像 发表于 05-23 09:18 911次阅读

    数据库数据恢复——MongoDB数据库文件拷贝后服务无法启动的数据恢复

    MongoDB数据库数据恢复环境: 一台Windows Server操作系统虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 管理员在未关闭MongoDB服务的
    的头像 发表于 04-09 11:34 648次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复——MongoDB<b class='flag-5'>数据库</b>文件拷贝后服务无法启动的<b class='flag-5'>数据</b>恢复

    TDengine 发布时序数据分析 AI 智能体 TDgpt,核心代码开源

    组成部分,标志着时序数据库在原生集成 AI 能力方面迈出了关键一步。 TDgpt 是内嵌于 TDengine 中的时序数据分析 AI 智能体,具备时序数据预测、异常检测、数据补全、分类
    的头像 发表于 03-27 10:30 558次阅读
    TDengine 发布<b class='flag-5'>时序数据</b>分析 AI 智能体 TDgpt,核心代码开源

    数据库数据恢复—SQL Server附加数据库提示“错误 823”的数据恢复案例

    SQL Server数据库附加数据库过程中比较常见的报错是“错误 823”,附加数据库失败。 如果数据库有备份则只需还原备份即可。但是如果没有备份,备份时间太久,或者其他原因导致备份
    的头像 发表于 02-28 11:38 818次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server附加<b class='flag-5'>数据库</b>提示“错误 823”的<b class='flag-5'>数据</b>恢复案例

    MySQL数据库的安装

    MySQL数据库的安装 【一】各种数据库的端口 MySQL :3306 Redis :6379 MongoDB :27017 Django :8000 flask :5000 【二】MySQL 介绍
    的头像 发表于 01-14 11:25 857次阅读
    MySQL<b class='flag-5'>数据库</b>的安装

    数据库是哪种数据库类型?

    数据库是一种部署在虚拟计算环境中的数据库,它融合了云计算的弹性和可扩展性,为用户提供高效、灵活的数据库服务。云数据库主要分为两大类:关系型数据库
    的头像 发表于 01-07 10:22 791次阅读

    时序数据库TDengine 2024年保持高增长,实现收入翻倍

    近日,时序数据库 (Time Series Database) TDengine 正式公布了 2024 年重大成就和发展成绩盘点。在这一年中,TDengine 以持续创新的技术能力、迅猛增长的市场
    的头像 发表于 01-02 13:50 792次阅读
    <b class='flag-5'>时序数据库</b>TDengine 2024年保持高增长,实现收入翻倍

    康谋分享 | 如何应对ADAS/AD海量数据处理挑战?

    如何有效处理ADAS/AD海量数据并从中获得见解?IVEX数据处理流程可自动从原始传感器数据等输入中识别出值得关注的事件和场景,推动
    的头像 发表于 12-25 10:05 4267次阅读
    康谋分享 | 如何应对ADAS/AD<b class='flag-5'>海量</b><b class='flag-5'>数据处理</b>挑战?

    数据库数据恢复—Mysql数据库表记录丢失的数据恢复流程

    Mysql数据库故障: Mysql数据库表记录丢失。 Mysql数据库故障表现: 1、Mysql数据库表中无任何数据或只有部分
    的头像 发表于 12-16 11:05 996次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—Mysql<b class='flag-5'>数据库</b>表记录丢失的<b class='flag-5'>数据</b>恢复流程

    数据库数据恢复—MYSQL数据库ibdata1文件损坏的数据恢复案例

    mysql数据库故障: mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库
    的头像 发表于 12-09 11:05 1045次阅读

    群晖PB高密度存储,满足海量数据存储、备份与存档

    很多大型企业,或是有海量数据存储需求的企业,对于PB数据存储一直寻求运行稳定、安全高效且高性价比的解决方案。PB
    的头像 发表于 12-07 18:08 1938次阅读
    群晖<b class='flag-5'>PB</b><b class='flag-5'>级</b>高密度存储,满足<b class='flag-5'>海量</b><b class='flag-5'>数据</b>存储、备份与存档