0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据库优化最有效的方式是什么?

马哥Linux运维 来源:马哥Linux运维 2023-02-28 09:46 次阅读

记得,如果有人问你做数据库优化最有效的方式是什么?SQL优化、分布式集群、分库分表!干就完了~ 但上来就考虑分库分表真的合适么,你对分库分表又理解多少呢?什么时候分?有几种分法儿?别想了,快上车!哈哥带你捋一下分库分表的额各种玩儿法~记得收藏

首先我们要知道分库、分表都是干啥的,本文主角还是我们的MySQL为第一视角。首先从字面意思来看:

  • 分库:由单个数据库实例拆分成多个数据库实例,将数据分布到多个数据库实中。


  • 分表:由单张表拆分成多张表,将数据划分到多张表内。

要知道,对于大型互联网项目,数据量级可能不是我们能想到的,每日新增数据量过千万是常有的事儿,想靠单台MySQL服务器是不现实的。你项羽再牛B,也顶不住四个队友挂机啊!!项羽:???

随着业务数据量和网站QPS日益增高,对数据库压力也越来越大,单机版数据库很快会到达存储和并发瓶颈,就需要做数据库性能方面的优化,分库分表采取的是分而治之的策略,分库目的是减轻单台MySQL实例存储压力及可扩展性,而分表是解决单张表数据过大以后查询的瓶颈问题,坦白说,这些问题也是所有关系型数据库的“硬伤”。

今天我们就基于常见分库、分表的策略方式以及场景,来搞清楚我们到底啥时候用的到。常用策略包括:垂直分表、水平分表、垂直分库、水平分库。

一、朴实无华的 - 分表

1、垂直分表

垂直分表,或者叫竖着切表,是不是感受到该策略是以字段为依据的!主要按照字段的活跃性、字段长度,将表中字段拆分到不同的表(主表和扩展表)中。

特点:

  • 每个表的结构都不一样;
  • 每个表的数据也不一样,
  • 有一个关联字段,一般是主键或外键,用于关联兄弟表数据;
  • 所有兄弟表的并集是该表的全量数据;

场景:

  1. 有几个字段属于热点字段,更新频率很高,要把这些字段单独切到一张表里,不然innodb行锁很恶心的,锁死你呀~~如用户表里的余额字段?不,我的余额就很稳定,一直是0。。
  2. 有大字段,如text,存储压力很大,毕竟innodb数据和索引是同一个文件;同时,我又喜欢用SELECT *,你懂得,这磁盘IO消耗的,跟玩儿似的,谁都扛不住的。
  3. 有明显的业务区分,或表结构设计时字段冗余;有些小伙伴看到第一点时,就发现陈哈哈是个菜鸡,用户表怎么会有余额字段?明显有问题啊!赶紧先到评论区喷陈哈哈一波~~然后笑嘻嘻的发现原来是个小尾巴,真不要脸是吧。。是的,因此不同业务我们要把具体字段拆开,这样才有利于业务后续扩展哦。

2、水平分表

水平分表,也叫“横着切”。。以行数据为依据进行切分,一般按照某列的自容进行切分。

手机号表,我们可以通过前两位或前三位进行切分,如131、132、133 → phone_131、phone_132、phone_133,手机号有11位(100亿),量大是很正常的事儿,这年头谁家老头老太太每个手机呢是吧。这样切就把一张大表切成了好几十张小表,数据量不就下来了。有同学就问了那我怎么知道我这手机号查哪个表呢?一看你就没认真看前两行标红的点,为啥标红嘞?比如我查13100001111,那我截取前三位,动态拼接到查询的表名上,就行了。

特点:

  • 每个表的结构都一样;
  • 每个表的数据都不一样,没有交集;
  • 所有表的并集是该表的全量数据;

场景:单表的数据量过大或增长速度很快,已经影响或即将会影响SQL查询效率,加重了CPU负担,提前到达瓶颈。记得水平分表越早越好,别问我为什么。。

二、花里胡哨的 - 分库

需要你注意的是,传统的分库和我们熟悉的集群、主从复制可不是一个事儿;多节点集群是将一个库复制成N个库,从而通过读写分离实现多个MySQL服务的负载均衡,实际是围绕一个库来搞的,这个库称为Master主库。而分库就不同了,分库是将这个主库一分为N,比如一分为二,然后针对这两个主库,再配置2N个从库节点。

3、垂直分库

纵向切库,太经典的切分方式,基于表进行切分,通常是把新的业务模块或集成公共模块拆分出去,比如我们最熟悉的单点登录、鉴权模块。熟悉的味道,记得有一次我把一些没用的表切到一个性能很好的服务器中,这服务器我专门用来学习,后来也不知被哪个狗腿子告密了~ 我你个,有种站出来,你个**东西。

47557db0-b2fc-11ed-bfe3-dac502259ad0.png

特点:

  • 每个库的表都不一样;
  • 表不一样,数据就更不一样了~ 没有任何交集;
  • 每个库相对独立,模块化

场景:可以抽象出单独的业务模块时,可以抽象出公共区时(如字典、公共时间、公共配置等),或者想有一台属于自己的服务器时?

4、水平分库

以行数据为依据,将一个库中的数据拆分到多个库中。大型分表体验一下?坦白说这种策略并不实用,因为会对后台开发很不友好,有很多坑,不建议采用,理解即可。

特点:

  • 每个库的结构都一样;
  • 每个库的数据都不一样,没有交集;
  • 所有库的并集是全量数据;

场景:系统绝对并发量上来了,CPU内存压力大。分表难以根本上解决量的问题,并且还没有明显的业务归属来垂直分库,主库磁盘接近饱和。

总结

本文就到这里,希望你学废了!其实,在实际工作中,我们在选择分库分表策略前,想到的应该是从缓存、读写分离、SQL优化等方面,因为这些能够更直接、代价更小的解决问题。要记住动表就是动根本,你永远不知道这张表后面会连带多少历史遗留问题,如果是个很大型的项目,遇到些问题你就跟经理提议要分库分表,小心被呼死~

好了,多了就不说了,我劝你耗子尾汁,但推荐你关注我,因为我会让你在快乐中学会很多东西!

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 结构
    +关注

    关注

    1

    文章

    116

    浏览量

    21472
  • 数据库
    +关注

    关注

    7

    文章

    3591

    浏览量

    63373
  • MySQL
    +关注

    关注

    1

    文章

    775

    浏览量

    26006

原文标题:老大让我优化数据库,我上来就分库分表,他过来就是一jio

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    labvies访问数据库

    都无法正确反映各类数据之间的密切联系,都不能有效的管理和组织数据。因此以数据库为中心,以数据管理为重点,构建的基于
    发表于 08-26 10:19

    往keil4添加STC数据库的方法

    目前的keil4数据库里面没有STC的数据库,每次都要替换,现在教大家一种方法,我试过的最有效的方法 ,在不改变原有的情况下添加STC的数据库
    发表于 10-13 18:55

    想按行的方式输入数据库

    请问下各位老师如何按照行的方式数据输入数据库,比如三列分别为日期ID 该ID的数值,整行输入数据库某个表中应该如何输入?(一行中包含的数据
    发表于 01-28 17:33

    数据库连接

    在利用 LabVIEW数据库工具包操作数据库之前,需要先连接数据库,这就像操作文件之前,先要打开文件一样。在这里我们利用UDL连接数据库。Microsoft设计的ODBC标准只能访问关
    发表于 06-29 21:29

    mysql数据库设计步骤

    mysql数据库设计和优化
    发表于 05-13 11:00

    使用NoSQL数据库的原因

    阻抗失衡 关系模型和内存中的数据结构不匹配 采用更为方便的数据交互方式提升开发效率待处理的数据量很大 数据量超过关系型
    发表于 05-27 06:43

    LabVIEW与数据库连接方式之DSN和UDL

    (universal Datebase Link)。创建一个数据库如 3.mdb:开始——打开access软件——新建空白数据库——保存地址和类型(*.mdb)。1、DSN方式LabVIEW
    发表于 07-03 10:52

    LabVIEW登录程序(数据库版)

    登录程序其实有很多种方式,这里介绍自己写的数据库版本,数据库采用的是office中的access,具体链接方式在file文件夹中,先配置后运行程序。功能具有增加、删除、注册、导出等情况
    发表于 07-19 09:34

    数据库设计及开发规范之sql性能优化

    数据库设计及开发规范,sql性能优化
    发表于 05-08 10:58

    电源纹波抑制和减少的最有效方式

    来源:互联网说到纹波,我们一直想做到抑制或减少它。但是理想化和实际中还是存在一定差距,在一定的环境下纹波是存在的。下面我们知晓下电源纹波抑制和减少的最有效方式
    发表于 10-22 20:49

    怎么解决移动数据库的断接问题?

    本文介绍了位置相关查询优化数据广播两种普遍用于移动数据库查询的方法,结合移动数据库中的缓存技术,分别从合理分配嵌入式移动数据库资源和在一定
    发表于 04-23 06:00

    怎样去实现嵌入式移动数据库的查询优化

    嵌入式移动数据库的结构体系及特点是什么?数据广播有哪些优点?嵌入式移动数据库优化查询方法有哪几种?
    发表于 04-27 06:27

    什么是时序数据库

    数据库(TSDB)是一个为了用于处理时间序列数据优化的软件系统,其按时间数值或时间范围进行索引。时序数据库增长趋势时序数据库从2014年开
    发表于 07-12 08:35

    最新国产数据库排名

    最新国产数据库排名,本篇文章约14000字,包含如下5部分内容:1.开篇2.国产数据库产品清单,包括产品名称,产品类别及厂商名称;3.国产数据库各产品概述,产品基本介绍、应用场景等;4.国产
    发表于 07-28 08:06

    数据库优化那些事

    我们出去面试经常会被问到数据库这一块,而涉及数据库这一块问的最多的就是数据库优化。那么我们怎么做才能做好优化问题呢?今天我们就来聊聊
    的头像 发表于 10-08 11:49 308次阅读
    <b class='flag-5'>数据库</b><b class='flag-5'>优化</b>那些事