0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么要分库分表?MySQL分库分表实践

马哥Linux运维 来源:稀土掘金 2023-11-25 17:47 次阅读

一、为什么要分库分表

数据库架构演变

刚开始多数项目用单机数据库就够了,随着服务器流量越来越大,面对的请求也越来越多,我们做了数据库读写分离, 使用多个从库副本(Slave)负责读,使用主库(Master)负责写,master和slave通过主从复制实现数据同步更新,保持数据一致。slave 从库可以水平扩展,所以更多的读请求不成问题

但是当用户量级上升,写请求越来越多,怎么保证数据库的负载足够?增加一个Master是不能解决问题的, 因为数据要保存一致性,写操作需要2个master之间同步,相当于是重复了,而且架构设计更加复杂

这时需要用到分库分表(sharding),把库和表存放在不同的MySQL Server上,每台服务器可以均衡写请求的次数

二、库表太大产生的问题

单库太大:单库处理能力有限、所在服务器上的磁盘空间不足、遇到IO瓶颈,需要把单库切分成更多更小的库

单表太大:CRUD效率都很低,数据量太大导致索引文件过大,磁盘IO加载索引花费时间,导致查询超时。所以只用索引还是不行的,需要把单表切分成多个数据集更小的表。MyCat提供的分表算法都在rule.xml,可以根据不同的分表算法进行拆分,比如根据时间拆分、一致性哈希、直接用主键对分表的个数取模等

拆分策略

单个库太大,先考虑是表多还是数据多:

如果因为表多而造成数据过多,则使用垂直拆分,即根据业务拆分成不同的库

如果因为单张表的数据量太大,则使用水平拆分,即把表的数据按照某种规则(mycat/conf/rule.xml定义的分表算法)拆分成多张表

分库分表的原则应该是先考虑垂直拆分,再考虑水平拆分

三、垂直拆分

分库分表和读写分离可以共同进行

1. 垂直分库

server.xml



123456
USERDB1,USERDB2

配置了USERDB1、USERDB2这两个逻辑库

schema.xml





  
   
  
  
    
    
  
  
    select user()
    
  
  
  
    select user()
    
  

两个逻辑库对应两个不同的数据节点,两个数据节点对应两个不同的物理机器

d78658b6-8b76-11ee-939d-92fbcf53809c.jpg

mytest1和mytest2分成了不同机器上的不同的库,各包含一部分表,它们原来是合在一块的,在一台机器上,现在做了垂直的拆分。

客户端就需要去连接不同的逻辑库了,根据业务操作不同的逻辑库

d79f1cf2-8b76-11ee-939d-92fbcf53809c.jpg

然后配置了两个写库,两台机器把库平分了,分担了原来单机的压力。分库伴随着分表,从业务上对表拆分

2. 垂直分表

垂直分表,基于列字段进行。一般是针对几百列的这种大表,也避免查询时,数据量太大造成的“跨页”问题。

一般是表中的字段较多,将不常用的, 数据较大,长度较长(比如text类型字段)的拆分到扩展表。访问频率较高的字段单独放在一张表

四、水平分表

针对数据量巨大的单张表(比如订单表),按照某种规则(RANGE、HASH取模等),切分到多张表里面去。但是这些表还是在同一个库中,所以库级别的数据库操作还是有IO瓶颈,不建议采用

将单张表的数据切分到多个服务器上去,每个服务器具有一部分库与表,只是表中数据集合不同。水平分库分表能够有效的缓解单机和单库的性能瓶颈和压力,突破IO、连接数、硬件资源等的瓶颈

分库分表可以和主从复制同时进行,但不基于主从复制;读写分离才基于主从复制

1. 配置水平分表

server.xml



  123456
  USERDB

schema.xml





  
  
    
select user() select user()

d7b7cdec-8b76-11ee-939d-92fbcf53809c.jpg

user表示一个普通的表,直接放在数据节点dn1上,放在一台机器上,这张表不用进行拆分

student表的primaryKey是id,根据id拆分,放在dn1和dn2上,最终这个表要分在两台机器上,在物理上分开了,但是在逻辑上还是一个,往哪张表里增加,在2台机器上查询然后如何合并这些操作都是由mycat完成的

拆分的规则是取模(mod - long),每次插入用id模上存在的机器数(2)

此外还需要在rule.xml中配置以下拆分算法

找到算法mod-long,因为我们将逻辑表student分开映射到两台主机上,所以修改数据节点的数量为2

d7c959cc-8b76-11ee-939d-92fbcf53809c.jpg

2. 测试水平分表

Linux主机

d7d92852-8b76-11ee-939d-92fbcf53809c.jpg

Windows主机

d7ed7e2e-8b76-11ee-939d-92fbcf53809c.jpg

登录到mycat的8066端口

d80afac6-8b76-11ee-939d-92fbcf53809c.jpg

使用MyCat给user表插入两条数据

d818fff4-8b76-11ee-939d-92fbcf53809c.jpg

由于schema.xml配置文件中,逻辑表user只在Linux主机的mytest1库中存在,mycat操作的逻辑表user会影响Linux主机上的物理表,而不会影响Windows主机上的表。我们分别查看一下Linux和Windows主机的user表:

d82fc40a-8b76-11ee-939d-92fbcf53809c.jpg

d83f9de4-8b76-11ee-939d-92fbcf53809c.jpg

我们再通过MyCat给student表插入两条数据

d848736a-8b76-11ee-939d-92fbcf53809c.jpg

我们知道schema.xml配置文件中,逻辑表student对应两台主机上的两个库mytest1、mytest2中的两张表,所以对逻辑表插入的两条数据,会实际影响到两张物理表(用id%机器数,决定插入到哪张物理表)。我们分别查看一下Linux和Windows主机的student表:

d85938b2-8b76-11ee-939d-92fbcf53809c.jpg

再通过MyCat插入id=3和id=4的数据,应该插入不同主机上的不同物理表

d87106e0-8b76-11ee-939d-92fbcf53809c.jpg

d88a09ce-8b76-11ee-939d-92fbcf53809c.jpg

这就相当于把student表进行水平拆分了

通过MyCat查询的时候只需要正常输入就行,我们配置的是表拆分后放在这2个数据节点上,MyCat会根据配置在两个库上查询并进行数据合并

d8a37742-8b76-11ee-939d-92fbcf53809c.jpg






审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    10992

    浏览量

    206744
  • MySQL
    +关注

    关注

    1

    文章

    775

    浏览量

    26006

原文标题:MySQL 分库分表实践

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    数据库分区、分库和分表

    今天先说说数据库的数据分区,分库以及分表的内容吧! 数据库分区、分库和分表 数据库分区、分库和分表是针对大型数据库系统的优化策略。它们的主要目的是提高数据库的性能和可靠性,以满足不断增长的数据存储
    的头像 发表于 09-30 11:24 848次阅读

    MySQL数据库运维篇-19. 运维-分库-Mycat

    数据库MySQL
    电子学习
    发布于 :2023年01月07日 15:09:53

    谈分布式数据库中间件之分库   

      分库,顾名思义就是把原本存储于一个库的数据分块存储到多个库上,把原本存储于一个的数据分块存储到多个上。那么关于
    发表于 08-02 20:19

    MyCat分片配置与分片测试

    MySQL分库
    发表于 04-22 13:07

    关于MySQL分区和的详细介绍

    MySQL分区和
    发表于 07-10 07:40

    分库是什么?怎么实现?

    数据库分库、读写分离的原理实现,使用场景
    发表于 10-25 17:24

    利用Mycat实现MySQL读写分离、分库分表最佳实践

    利用Mycat实现MySQL读写分离、分库分表最佳实践
    发表于 09-08 10:20 14次下载
    利用Mycat实现<b class='flag-5'>MySQL</b>读写分离、<b class='flag-5'>分库</b>分表最佳<b class='flag-5'>实践</b>

    结合实践对水平分库做一个系统地剖析

    及实施落地,这里结合项目实践,对水平分库做一个系统地剖析,希望为大家水平分库(包括去IOE)改造提供思路,主要内容包括: 水平分库说明分库
    发表于 10-11 17:46 0次下载
    结合<b class='flag-5'>实践</b>对水平<b class='flag-5'>分库</b>做一个系统地剖析

    i7-9700K现身跑分库

    经查,型号识别为i7-9700K的平台出现在了GeekBench 4.2跑分库中。
    发表于 09-04 10:55 1975次阅读

    你们知道为什么要分库分表吗

    在文章开头先抛几个问题: (1)什么时候才需要分库分表呢?我们的评判标准是什么? (2)一张表存储了多少数据的时候,才需要考虑分库分表? (3)数据增长速度很快,每天产生多少数据,才需要考虑做分库
    的头像 发表于 08-16 10:37 1364次阅读

    优化MySQL数据库中朴实无华的分表和花里胡哨的分库

    4、水平分库 总结 首先我们要知道分库、分表都是干啥的,本文主角还是我们的MySQL为第一视角。首先从字面意思来看: 分库:由单个数据库实例拆分成多个数据库实例,将数据分布到多个数据
    的头像 发表于 08-26 16:33 1063次阅读

    你是否知道分库分表需要哪些要素?

    分库分表会重新影响数据的分布,无论是全量还是增量,都会涉及到数据迁移,所以Databus是必要的。
    的头像 发表于 10-12 10:39 570次阅读

    什么是分库分表?为什么分库分表?什么情况下会用分库分表呢?

    分库分表是由分库和分表这两个独立概念组成的,只不过通常分库与分表的操作会同时进行,以至于我们习惯性的将它们合在一起叫做分库分表。
    的头像 发表于 11-30 09:37 4496次阅读

    分库分表的21条法则速来码住(上)

    还是不着急实战,咱们先介绍下在分库分表架构实施过程中,会接触到的一些通用概念,了解这些概念能够帮助理解市面上其他的分库分表工具,尽管它们的实现方法可能存在差异,但整体思路基本一致。因此,在开始
    的头像 发表于 05-26 17:33 396次阅读
    <b class='flag-5'>分库</b>分表的21条法则速来码住(上)

    分库分表的21条法则速来码住(下)

    还是不着急实战,咱们先介绍下在分库分表架构实施过程中,会接触到的一些通用概念,了解这些概念能够帮助理解市面上其他的分库分表工具,尽管它们的实现方法可能存在差异,但整体思路基本一致。因此,在开始
    的头像 发表于 05-26 17:33 470次阅读
    <b class='flag-5'>分库</b>分表的21条法则速来码住(下)