0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

QuestDB时序数据库性能居然领先ClickHouse和InfluxDB这么多

话说科技 2021-06-01 14:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Vlad Ilyushchenko,QuestDB的CTO

在QuestDB (https://questdb.io/, https://github.com/questdb/questdb),我们已经建立了一个专注于性能的开源时间序列数据库。我们创建QuestDB初衷是为了将我们在超低延迟交易方面的经验以及我们在该领域开发的技术方法带到各种实时数据处理用途中。

QuestDB的旅程始于2013年的原型设计,我们在去年HackerNews发布会期间(https://news.ycombinator.com/item?id=23975807)发表的一篇文章中描述了2013年之后所发生的变化。我们的用户在金融服务、物联网、应用监控和机器学习领域都部署了QuestDB,使时间序列分析变得快速、高效和便捷。

什么是存储时间序列数据的最佳方式?

在项目的早期阶段,我们受到了基于矢量的append-only系统(如kdb+)的启发,因为这种模型带来了速度和简洁代码路径的优势。QuestDB的数据模型使用了我们称之为基于时间的数组,这是一种线性数据结构。这允许QuestDB在数据获取过程中把数据切成小块,并以并行方式处理所有数据。以错误的时间顺序到达的数据在被持久化到磁盘之前会在内存中进行处理和重新排序。因此,数据在到达数据库中之前已经按时间排序。因此,QuestDB不依赖计算密集的索引来为任何时间序列的查询重新排序数据。

这种liner模型与其他开源数据库(如InfluxDB或TimescaleDB)中的LSM树或基于B树的存储引擎不同。

除了更好的数据获取能力,QuestDB的数据布局使CPU能够更快地访问数据。我们的代码库利用最新CPU架构的SIMD指令,对多个数据元素并行处理同类操作。我们将数据存储在列中,并按时间进行分区,以在查询时从磁盘中提取最小的数据量。

2106011125241910431403.png

数据被存储在列中,并按时间进行分区

QuestDB与ClickHouse、InfluxDB和TimescaleDB相比如何?

我们看到时间序列基准测试套件(TSBS https://github.com/timescale/tsbs)经常出现在关于数据库性能的讨论,因此我们决定提供对QuestDB和其他系统进行基准测试的能力。TSBS是一个Go程序集,用于生成数据集,然后对读写性能进行基准测试。该套件是可扩展的,因此可以包括不同的用例和查询类型,并在不同系统之间进行比较。

以下是我们在AWS EC2 m5.8xlarge实例上使用多达14个worker的纯cpu用例的基准测试结果,该实例有16个内核。

210601112524164559475.png

TSBS结果比较了QuestDB、InfluxDB、ClickHouse和TimescaleDB的最大获取吞吐量。

我们使用4个worker达到最大的摄取性能,而其他系统需要更多的CPU资源来达到最大的吞吐量。QuestDB用4个线程达到了95.9万行/秒。我们发现InfluxDB需要14个线程才能达到最大的摄取率(334k行/秒),而TimescaleDB用4个线程达到145k行/秒。ClickHouse以两倍于QuestDB的线程达到914k行/秒。

当在4个线程上运行时,QuestDB比ClickHouse快1.7倍,比InfluxDB快6.5倍,比TimescaleDB快6.6倍。

210601112523974694536.png

使用4个线程的TSBS基准测试结果:QuestDB、InfluxDB、ClickHouse和TimescaleDB每秒获取的行数。

当我们使用AMD Ryzen5处理器再次运行该套件时,我们发现,我们能够使用5个线程达到每秒143万行的最大吞吐量。与我们在AWS上的参考基准m5.8xlarge实例所使用的英特尔至强Platinum相比:

2106011125221500359221.png

比较QuestDB TSBS在AWS EC2与AMD Ryzen5上的负载结果

你应该如何存储乱序的时间序列数据?

事实证明,在摄取过程中对 "乱序"(O3)的数据进行重新排序特别具有挑战性。这是一个新的方法,我们想在这篇文章中详细介绍一下。我们对如何处理失序摄取的想法是增加一个三阶段的方法。

1.保持追加模式,直到记录不按顺序到达为止

2.在内存中对暂存区的未提交的记录进行排序

3.在提交时对分类的无序数据和持久化的数据进行核对和合并

前两个步骤很直接,也很容易实现,依然只是处理追加的数据,这一点没变。只有在暂存区有数据的时候,昂贵的失序提交才会启动。这种设计的好处是,输出是向量,这意味着我们基于向量的阅读器仍然是兼容的。

这种预提交的排序和合并方式给数据获取增加了一个额外的处理阶段,同时也带来了性能上的损失。不过,我们还是决定探索这种方法,看看我们能在多大程度上通过优化失序提交来减少性能损耗。

我们如何分类、合并和提交无序的时间序列数据

处理一个暂存区给了我们一个独特的机会来全面分析数据,在这里我们可以完全避免物理合并,并通过快速和直接的memcpy或类似的数据移动方法来替代。由于我们的基于列的存储,这种方法可以被并行化。我们可以采用SIMD和非时序数据访问,这对我们来说是很重要的。

我们通过优化版本的radix排序对来自暂存区的时间戳列进行排序,所产生的索引被用于并行对暂存区的其余列进行排序。

210601112522633858319.png

并行得将列进行排序

现在排序的暂存区是相对于现有分区数据进行映射的。从一开始可能并不明显,但我们正试图为以下三种类型的每一种建立所需的操作和维度。

210601112522831457341.png

失序(O3)排序和合并方案

当以这种方式合并数据集时,前缀和后缀组可以是持续的数据、失序的数据,或者没有数据。合并组(Merge Group)是最繁忙的,因为它可以被持久化的数据、失序的数据、失序的数据和持久化的数据占据,或者没有数据。

当明确了如何分组和处理暂存区的数据时,一个工人池就会执行所需的操作,在少量的情况下调用memcpy,其他都转向SIMD优化的代码。通过前缀、合并和后缀拆分,提交的最大活度(增加CPU容量的易感性)可以通过partition_affected x number_of_columns x 3得到。

时间序列数据应该多久进行一次排序和合并?

能够快速复制数据是一个不错的选择,但我们认为在大多数时间序列获取场景中可以避免大量的数据复制。假设大多数实时失序的情况是由传递机制和硬件抖动造成的,我们可以推断出时间戳分布将在一定区间范围。

例如,如果任何新的时间戳值有很大概率落在先前收到的值的10秒内,那么边界就是10秒,我们称这个为滞后边界。

当时间戳值遵循这种模式时,推迟提交可以使失序提交成为正常的追加操作。失序系统可以处理任何种类的延迟,但如果延迟的数据在指定的滞后边界内到达,它将被优先快速处理。

如何比较时间序列数据库的性能

我们已经在TimescaleDB的TSBS GitHub仓库中开启了一个合并请求(Questdb基准支持 https://github.com/timescale/tsbs/issues/157),增加了针对QuestDB运行基准测试的能力。同时,用户可以克隆我们的基准测试fork(https://github.com/questdb/tsbs),并运行该套件以查看自己的结果。

tsbs_generate_data --use-case="cpu-only" --seed=123 --scale=4000 `。

--timestamp-start="2016-01-01T00:00:00Z" --timestamp-end="2016-01-02T00:00:00Z" \

--log-interval="10s" --format="influx" > /tmp/bigcpu

tsbs_load_questdb --file /tmp/bigcpu --workers 4

构建具有授权许可的开源数据库

在进一步推动数据库性能的同时,使开发人员能够轻松地开始使用我们的产品,这一点每天都激励着我们。这就是为什么我们专注于建立一个坚实的开发者社区,他们可以通过我们的开源分销模式参与并改进产品。

除了使QuestDB易于使用之外,我们还希望使其易于审计、审查,提交代码或其他的项目贡献。QuestDB的所有源代码都在GitHub(https://github.com/questdb/questdb)上以Apache 2.0许可证提供,我们欢迎对此产品的各种贡献,包括在GitHub上创建issue或者提交代码。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    系统讲解MySQL数据库慢查询优化思路

    调优、以及常见性能问题的排查路径。让你遇到数据库性能问题时知道该查什么、怎么查、怎么改、改完怎么验证。
    的头像 发表于 05-30 13:53 92次阅读

    生产环境数据库连接池耗尽的全流程排查与性能优化实战

    数据库连接池是应用程序与数据库之间的缓存连接组件。连接池在应用程序启动时创建一组数据库连接,应用程序从连接池获取连接,使用完毕后归还连接池而非关闭连接,避免反复建立和关闭连接的性能开销
    的头像 发表于 03-27 15:58 499次阅读

    Oracle数据库ASM实例无法挂载的数据恢复案例

    一个Oracle数据库故障表现为ASM磁盘组掉线,ASM实例无法挂载(mount)。数据库管理员自行进行简单修复,未能成功,随后联系北亚数据恢复中心恢复数据
    的头像 发表于 02-24 15:19 298次阅读
    Oracle<b class='flag-5'>数据库</b>ASM实例无法挂载的<b class='flag-5'>数据</b>恢复案例

    艾体宝干货 | 模型数据库解决的到底是什么问题?

    数据库选型的专业讨论中,“模型数据库”已逐步成为热点概念,但行业对其认知仍存在偏差——要么被曲解为“无所不能的万能数据库”,要么被简化为“图数据
    的头像 发表于 02-03 16:08 470次阅读

    国产数据库的AI战事

    国产数据库硝烟再起,Vastbase V100构筑企业智能基座
    的头像 发表于 10-24 20:45 4583次阅读
    国产<b class='flag-5'>数据库</b>的AI战事

    工业上面为什么有这么多通讯协议?

    编程语言还多。 那问题来了——为什么工业上会有这么多通讯协议?难道不能像电脑一样,统一一个以太网协议就行了吗?今天, 深圳市钡铼技术有限公司  带你从技术和历史的角度,看看背后的原因。 一、历史造就了“协议时代” 工业通讯的发展,其实是从“各自为政”开始的。上世纪八九
    的头像 发表于 10-21 17:55 884次阅读
    工业上面为什么有<b class='flag-5'>这么多</b>通讯协议?

    华纳云为游戏数据库选择高性能NVMe SSD存储

    游戏数据库对速度、可靠性和可扩展性有极高要求。随着在线游戏的发展,开发者越来越依赖NVMe SSD存储来提供服务器租用和服务器托管解决方案。本文将指导您了解为游戏数据库选择高性能NVMe SSD存储
    的头像 发表于 09-30 16:03 1273次阅读

    数据库性能瓶颈分析与SQL优化实战案例

    作为一名在一线摸爬滚打8年的运维工程师,我见过太多因为数据库性能问题而半夜被叫醒的场景。今天分享几个真实的优化案例,希望能帮你避开这些坑。
    的头像 发表于 08-27 14:31 889次阅读

    数据库性能优化指南

    作为一名在大厂摸爬滚打多年的运维老兵,我见过太多因为数据库性能问题导致的生产事故。今天分享一套完整的数据库优化方法论,从SQL层面到硬件配置,帮你彻底解决性能瓶颈!
    的头像 发表于 08-18 11:21 985次阅读

    数据库数据恢复—服务器异常断电导致Oracle数据库故障的数据恢复案例

    Oracle数据库故障: 某公司一台服务器上部署Oracle数据库。服务器意外断电导致数据库报错,报错内容为“system01.dbf需要更多的恢复来保持一致性”。该Oracle数据库
    的头像 发表于 07-24 11:12 963次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—服务器异常断电导致Oracle<b class='flag-5'>数据库</b>故障的<b class='flag-5'>数据</b>恢复案例

    三款主流国产数据库的技术特点

    随着数字经济的快速发展和数据安全要求的提升,国产数据库正迎来前所未有的发展机遇。在信创浪潮推动下,达梦数据库、TiDB、华为高斯数据库等国产数据库
    的头像 发表于 07-14 11:08 1433次阅读

    数据库数据恢复—MongoDB数据库文件丢失的数据恢复案例

    MongoDB数据库数据恢复环境: 一台操作系统为Windows Server的虚拟机上部署MongoDB数据库。 MongoDB数据库故障: 工作人员在MongoDB服务仍
    的头像 发表于 07-01 11:13 899次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—MongoDB<b class='flag-5'>数据库</b>文件丢失的<b class='flag-5'>数据</b>恢复案例

    数据库数据恢复—SQL Server数据库被加密如何恢复数据

    SQL Server数据库故障: SQL Server数据库被加密,无法使用。 数据库MDF、LDF、log日志文件名字被篡改。
    的头像 发表于 06-25 13:54 941次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>数据</b>恢复—SQL Server<b class='flag-5'>数据库</b>被加密如何恢复<b class='flag-5'>数据</b>?

    工业数据中台如何支持智能决策

    工程:构建决策基础 源异构数据融合 工业场景中,设备数据(如PLC、传感器)、业务数据(ERP、MES)和外部数据(天气、供应链)分散且格
    的头像 发表于 06-16 17:13 704次阅读

    oracle数据恢复—oracle数据库误执行错误truncate命令如何恢复数据

    oracle数据库误执行truncate命令导致数据丢失是一种常见情况。通常情况下,oracle数据库误操作删除数据只需要通过备份恢复数据
    的头像 发表于 06-05 16:01 2050次阅读
    oracle<b class='flag-5'>数据</b>恢复—oracle<b class='flag-5'>数据库</b>误执行错误truncate命令如何恢复<b class='flag-5'>数据</b>?