0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分析型数据库如何创新

OSC开源社区 来源:OSC开源社区 2023-06-02 16:10 次阅读

在群雄逐鹿的 OLAP 数据库市场,开源引擎 ClickHouse 凭借其出色的性能成为公认的黑马。官方称其性能超过了市场上同类的列式数据库,每台服务器每秒可处理数亿到超过十亿行、体积达数十 GB 的数据,运行速度比传统数据库快 100-1000 倍。
高效运行速度的另一面,还隐含着成本、性能、容量等诸多问题,比如不支持事务,不能够保证数据的一致性和完整性,不存在隔离级别,不支持高并发等等。这导致 2016 年开源的 ClickHouse 难以应对当下更加复杂,数据规模更加巨大的场景需求。

比如在字节内部,从 2018 年引入 ClickHouse,因为业务的发展,要服务于大量的用户,数据规模变得越来越巨大。由于 ClickHouse 是 Shared-Nothing 的架构,每个节点是独立的,不会共享存储资源等,因而计算资源和存储资源是紧耦合的。这导致扩缩容成本变高,且会涉及到数据迁移,不能实时按需的扩缩容,从而导致资源的浪费。此外,ClickHouse 的紧耦合的架构会导致多租户在共享集群相互影响,另外由于读写在一个节点完成,导致读写受到影响,最后 ClickHouse 在复杂查询上例如多表 join 等的性能支持并不是很好。
字节 ClickHouse 使用情况 为了解决这些痛点,字节在 ClickHouse 架构基础上进行了升级,于 2020 年在内部启动了 ByConity 项目,并于 2023 年 1 月发布 Beta 版本,将于 5 月底正式对外开源。

ByConity 是一个开源的云原生数据仓库,采用存储 - 计算分离的架构。它支持多个关键功能特性,如存储计算分离、弹性扩缩容、租户资源隔离和数据读写的强一致性等。通过利用主流的 OLAP 引擎优化,如列存储、向量化执行、MPP 执行、查询优化等,ByConity 可以提供优异的读写性能。

ByConity 的架构分为三层,如下图所示,服务接入层包含负责客户端数据和服务的接入,也就是 ByConity Server;计算组为 ByConity 的计算资源层,每个 Virtual Warehouse 是一个计算组;数据存储层由分布式文件系统,如 HDFS、S3 等构成。
3b7f8892-f653-11ed-90ce-dac502259ad0.jpg ByConity 三层技术架构图 除了兼备 ClickHouse 的一些优点外,ByConity 还实现了了诸多新的功能。

ByConity 的一个重要优势是存储 - 计算分离的架构,它实现了读写分离和弹性扩缩容。它的优势是高弹性和高扩展性。这种架构确保读操作和写操作不会相互影响,使得计算资源和存储资源解耦,两者可以按需的且独立的扩缩容,确保资源高效利用。此外,ByConity 支持多租户资源隔离功能,保证不同租户之间不会互相影响,使 ByConity 适用于多租户环境,如图 2。
3b9776e6-f653-11ed-90ce-dac502259ad0.png ByConity 存储 - 计算分离,实现多租户隔离 ByConity 支持 弹性的扩缩容,能够实时、按需的对计算资源进行扩缩容,保证资源的高效利用。并且它能对不同的租户进行 资源的隔离,租户之间不会受到相互影响。其另一个重要功能是 数据读写的强一致性 ,确保数据始终是最新的,读写之间没有不一致。此外,ByConity 采用了主流的 OLAP 引擎优化,例如列存、向量化执行、MPP 执行、查询优化等,来保证提供了 优异的读写性能。

之所以采用开源的模式,ByConity 项目组是希望能够把项目回馈给社区,同时也希望通过社区的力量加强和完善 ByConity。接下来,ByConity 在 2023 开源社区发展规划中,希望增强 ByConity 的功能、性能和易用性,重点关注开发新的存储引擎、支持更多的数据类型和与其他数据管理工具的集成领域。

责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    12

    文章

    3863

    浏览量

    84690
  • 数据库
    +关注

    关注

    7

    文章

    3592

    浏览量

    63382
  • OLAP
    +关注

    关注

    0

    文章

    23

    浏览量

    10036

原文标题:分析型数据库如何创新?

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    labvies访问数据库

    LabVIEW 中利用LabSQL 访问数据库 虚拟仪器VI(virtual instruments)是National Instruments 公司在其产品LabVIEW 中首先提出的创新
    发表于 08-26 10:19

    数据库连接

    在利用 LabVIEW数据库工具包操作数据库之前,需要先连接数据库,这就像操作文件之前,先要打开文件一样。在这里我们利用UDL连接数据库。Microsoft设计的ODBC标准只能访问关
    发表于 06-29 21:29

    建立与数据库的连接

    在利用 LabVIEW数据库工具包操作数据库之前,需要先连接数据库,这就像操作文件之前,先要打开文件一样。在这里我们利用UDL连接数据库。Microsoft设计的ODBC标准只能访问关
    发表于 07-01 21:24

    数据库管理

    如题:用labview操作access数据库做公司测试流程管控。因测试数据量大,数据生成多,现在accdb文件已经有50M了,现在发现数据库在本地操作都很快,但是放在远端服务器后操作就
    发表于 11-08 16:58

    阿里云云数据库开了一个未来大会,谈了谈2038年的数据库趋势

    ,量子数据库是能够看得见的技术通途之一,通过对计算机架构的完全创新,用量子计算代替常规计算,才有可能实现DB级的海量存储,并以今天最高性能的数据库100万倍的能力进行海量分析。在201
    发表于 01-18 11:32

    浅析对象数据库和NoSQL

    (阻抗不匹配)”。于是吗,关系数据库对于程序员的设计始终有相当大的限制,有的人擅长从领域模型去设计程序,有的人喜好从数据存储层面去设计代码。在对象数据库中,可以显式避免了一些传统关系
    发表于 05-27 06:36

    使用NoSQL数据库的原因

    阻抗失衡 关系模型和内存中的数据结构不匹配 采用更为方便的数据交互方式提升开发效率待处理的数据量很大 数据量超过关系
    发表于 05-27 06:43

    关系数据库与非关系数据库的区别浅析

    关系数据库的一个劣势就是 阻抗失谐(impedance mismatch):关系模型和内存中的数据结构之间存在差异关系数据库中不可以含有
    发表于 06-03 06:03

    最新国产数据库排名

    金融领域应用案例;5.分布式、关系、云化及内存数据库占比统计。01 开篇在刚刚过去的一年也就是2019年是国产数据库崛起的元年,众多的国产数据库产品闯入了我们的视线,目前国产
    发表于 07-28 08:06

    什么是数据库

    什么是数据库数据库的主要特点有哪些?数据库的基本结构是由哪几部分组成的?
    发表于 09-23 09:09

    一款基于Java实现的小巧而强大的关系数据库

    H2 是一款基于 Java 实现的小巧而强大的关系数据库,支持嵌入式、客户端/服务器以及混合部署模式。H2 数据库适合嵌入小型应用程序、元数据管理、快速应用开发和测试、内存
    发表于 10-27 06:12

    HarmonyOS数据库的相关资料下载

    1、HarmonyOS数据库篇之轻量级数据存储HarmonyOS中的数据库存储主要分为3种形式:1. 轻量级数据存储2. 关系
    发表于 03-28 11:13

    HarmonyOS关系数据库和对象关系数据库的使用方法

    容易就上手的知识。本篇速成教程直接使用最精准和简短的文字,再配上讲解代码,让我们能在10分钟左右就能掌握最基本的数据库使用方法。数据库的三大要素:数据库、表、字段,接下来为大家介绍关系
    发表于 03-29 14:10

    如何在HarmonyOS对数据库进行备份,恢复与加密

    数据库恢复至可用状态。 键值数据库和关系数据库均支持对数据库的备份和恢复。另外,键值
    发表于 11-07 08:57

    分析数据库如何创新?GOTC 2023议题揭秘

    在群雄逐鹿的 OLAP 数据库市场,开源引擎 ClickHouse 凭借其出色的性能成为公认的黑马。官方称其性能超过了市场上同类的列式数据库,每台服务器每秒可处理数亿到超过十亿行、体积达数十 GB
    的头像 发表于 05-19 09:03 286次阅读
    <b class='flag-5'>分析</b>型<b class='flag-5'>数据库</b>如何<b class='flag-5'>创新</b>?GOTC 2023议题揭秘