0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一文深入Redis主从复制的原理详解

数据分析与开发 来源:ITPUB技术小栈 作者:ITPUB技术小栈 2021-02-04 16:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

复制原理

1.复制过程

复制的过程步骤如下:

1、从节点执行 slaveof 命令

2、从节点只是保存了 slaveof 命令中主节点的信息,并没有立即发起复制

3、从节点内部的定时任务发现有主节点的信息,开始使用 socket 连接主节点

4、连接建立成功后,发送 ping 命令,希望得到 pong 命令响应,否则会进行重连

5、如果主节点设置了权限,那么就需要进行权限验证;如果验证失败,复制终止。

6、权限验证通过后,进行数据同步,这是耗时最长的操作,主节点将把所有的数据全部发送给从节点。

7、当主节点把当前的数据同步给从节点后,便完成了复制的建立流程。接下来,主节点就会持续的把写命令发送给从节点,保证主从数据一致性。

2.数据间的同步

上面说的复制过程,其中有一个步骤是“同步数据集”,这个就是现在讲的‘数据间的同步’。

redis 同步有 2 个命令:

sync 和 psync,前者是 redis 2.8 之前的同步命令,后者是 redis 2.8 为了优化 sync 新设计的命令。我们会重点关注 2.8 的 psync 命令。

psync 命令需要 3 个组件支持:

1、主从节点各自复制偏移量 2、主节点复制积压缓冲区 3、主节点运行 ID

主从节点各自复制偏移量:

1、参与复制的主从节点都会维护自身的复制偏移量。 2、主节点在处理完写入命令后,会把命令的字节长度做累加记录,统计信息在 info replication 中的 masterreploffset 指标中。 3、从节点每秒钟上报自身的的复制偏移量给主节点,因此主节点也会保存从节点的复制偏移量。 4、从节点在接收到主节点发送的命令后,也会累加自身的偏移量,统计信息在 info replication 中。 5、通过对比主从节点的复制偏移量,可以判断主从节点数据是否一致。

主节点复制积压缓冲区:

1、复制积压缓冲区是一个保存在主节点的一个固定长度的先进先出的队列。默认大小 1MB。

2、这个队列在 slave 连接是创建。这时主节点响应写命令时,不但会把命令发送给从节点,也会写入复制缓冲区。

3、他的作用就是用于部分复制和复制命令丢失的数据补救。通过 info replication 可以看到相关信息。

主节点运行 ID:

1、每个 redis 启动的时候,都会生成一个 40 位的运行 ID。

2、运行 ID 的主要作用是用来识别 Redis 节点。如果使用 ip+port 的方式,那么如果主节点重启修改了 RDB/AOF 数据,从节点再基于偏移量进行复制将是不安全的。所以,当运行 id 变化后,从节点将进行全量复制。也就是说,redis 重启后,默认从节点会进行全量复制。

如果在重启时不改变运行 ID 呢?

1、可以通过 debug reload 命令重新加载 RDB 并保持运行 ID 不变。从而有效的避免不必要的全量复制。

2、他的缺点则是:debug reload 命令会阻塞当前 Redis 节点主线程,因此对于大数据量的主节点或者无法容忍阻塞的节点,需要谨慎使用。一般通过故障转移机制可以解决这个问题。

psync 命令的使用方式:

命令格式为 psync{runId}{offset}

runId:从节点所复制主节点的运行 id offset:当前从节点已复制的数据偏移量

psync 执行流程:

84f1b232-584b-11eb-8b86-12bb97331649.png

流程说明:从节点发送 psync 命令给主节点,runId 就是目标主节点的 ID,如果没有默认为 -1,offset 是从节点保存的复制偏移量,如果是第一次复制则为 -1.

主节点会根据 runid 和 offset 决定返回结果:

1、如果回复 +FULLRESYNC {runId} {offset} ,那么从节点将触发全量复制流程。

2、如果回复 +CONTINUE,从节点将触发部分复制。

3、如果回复 +ERR,说明主节点不支持 2.8 的 psync 命令,将使用 sync 执行全量复制。

到这里,数据之间的同步就讲的差不多了,篇幅还是比较长的。主要是针对 psync 命令相关之间的介绍。

3.全量复制

全量复制是 Redis 最早支持的复制方式,也是主从第一次建立复制时必须经历的的阶段。触发全量复制的命令是 sync 和 psync。之前说过,这两个命令的分水岭版本是 2.8,redis 2.8 之前使用 sync 只能执行全量不同,2.8 之后同时支持全量同步和部分同步。

流程如下:

852b91aa-584b-11eb-8b86-12bb97331649.png

介绍一下上图步骤:

1、发送 psync 命令(spync ?-1)

2、主节点根据命令返回 FULLRESYNC

3、从节点记录主节点 ID 和 offset

4、主节点 bgsave 并保存 RDB 到本地

5、主节点发送 RBD 文件到从节点

6、从节点收到 RDB 文件并加载到内存中

7、主节点在从节点接受数据的期间,将新数据保存到“复制客户端缓冲区”,当从节点加载 RDB 完毕,再发送过去。(如果从节点花费时间过长,将导致缓冲区溢出,最后全量同步失败) 8、从节点清空数据后加载 RDB 文件,如果 RDB 文件很大,这一步操作仍然耗时,如果此时客户端访问,将导致数据不一致,可以使用配置slave-server-stale-data 关闭. 9、从节点成功加载完 RBD 后,如果开启了 AOF,会立刻做 bgrewriteaof。

以上加粗的部分是整个全量同步耗时的地方。

注意:

1、如过 RDB 文件大于 6GB,并且是千兆网卡,Redis 的默认超时机制(60 秒),会导致全量复制失败。可以通过调大 repl-timeout 参数来解决此问题。

2、Redis 虽然支持无盘复制,即直接通过网络发送给从节点,但功能不是很完善,生产环境慎用。

4.部分复制

当从节点正在复制主节点时,如果出现网络闪断和其他异常,从节点会让主节点补发丢失的命令数据,主节点只需要将复制缓冲区的数据发送到从节点就能够保证数据的一致性,相比较全量复制,成本小很多。

步骤如下:

854c17ea-584b-11eb-8b86-12bb97331649.png

1、当从节点出现网络中断,超过了 repl-timeout 时间,主节点就会中断复制连接。

2、主节点会将请求的数据写入到“复制积压缓冲区”,默认 1MB。

3、当从节点恢复,重新连接上主节点,从节点会将 offset 和主节点 id 发送到主节点

4、主节点校验后,如果偏移量的数后的数据在缓冲区中,就发送 cuntinue 响应 —— 表示可以进行部分复制

5、主节点将缓冲区的数据发送到从节点,保证主从复制进行正常状态。

5.心跳

主从节点在建立复制后,他们之间维护着长连接并彼此发送心跳命令。

心跳的关键机制如下:

1、中从都有心跳检测机制,各自模拟成对方的客户端进行通信,通过 client list 命令查看复制相关客户端信息,主节点的连接状态为 flags = M,从节点的连接状态是 flags = S。

2、主节点默认每隔 10 秒对从节点发送 ping 命令,可修改配置 repl-ping-slave-period 控制发送频率。

3、从节点在主线程每隔一秒发送 replconf ack{offset} 命令,给主节点上报自身当前的复制偏移量。

4、主节点收到 replconf 信息后,判断从节点超时时间,如果超过 repl-timeout 60 秒,则判断节点下线。

85898ada-584b-11eb-8b86-12bb97331649.png

注意:为了降低主从延迟,一般把 redis 主从节点部署在相同的机房/同城机房,避免网络延迟带来的网络分区造成的心跳中断等情况。

6.异步复制

主节点不但负责数据读写,还负责把写命令同步给从节点,写命令的发送过程是异步完成,也就是说主节点处理完写命令后立即返回客户度,并不等待从节点复制完成。

异步复制的步骤很简单,如下:

1、主节点接受处理命令 2、主节点处理完后返回响应结果 3、对于修改命令,异步发送给从节点,从节点在主线程中执行复制的命令。

85a8bcde-584b-11eb-8b86-12bb97331649.png

总结

本文主要分析了 Redis 的复制原理,包括复制过程,数据之间的同步,全量复制的流程,部分复制的流程,心跳设计,异步复制流程。

其中,可以看出,RDB 数据之间的同步非常耗时。所以,Redis 在 2.8 版本退出了类似增量复制的 psync 命令,当 Redis 主从直接发生了网络中断,不会进行全量复制,而是将数据放到缓冲区(默认 1MB)里,在通过主从之间各自维护复制 offset 来判断缓存区的数据是否溢出,如果没有溢出,只需要发送缓冲区数据即可,成本很小,反之,则要进行全量复制,因此,控制缓冲区大小非常的重要。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7314

    浏览量

    93982
  • Redis
    +关注

    关注

    0

    文章

    390

    浏览量

    12056

原文标题:一文深入 Redis 主从复制的原理详解,权威又科学

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Redis集群部署配置详解

    Redis集群是种分布式Redis解决方案,通过数据分片和主从复制实现高可用性和横向扩展。集群将整个数据集分割成16384个哈希槽(hash slots),每个节点负责
    的头像 发表于 07-17 11:04 588次阅读

    Redis集群部署与性能优化实战

    Redis作为高性能的内存数据库,在现代互联网架构中扮演着关键角色。作为运维工程师,掌握Redis的部署、配置和优化技能至关重要。本文将从实战角度出发,详细介绍Redis集群的搭建、性能优化以及监控运维的核心技术。
    的头像 发表于 07-08 17:56 622次阅读

    【经验分享】在Omni3576上编译Redis-8.0.2源码,并安装及性能测试

    本文首先介绍Redis是什么,然后介绍如何在Omni3576上编译Redis-8.0.2源码,以及从源码编译、安装Redis,最后介绍如何在Omni3576上运行Redis性能测试,并
    的头像 发表于 06-05 08:05 765次阅读
    【经验分享】在Omni3576上编译<b class='flag-5'>Redis</b>-8.0.2源码,并安装及性能测试

    【幸狐Omni3576边缘计算套件试用体验】Redis最新8.0.2版本源码安装及性能测试

    的结果进行对比。 Redis是什么 维基百科的介绍是: Redis个使用ANSI C编写的开源、支持网络、基于内存、分布式、可选持久性的键值对存储数据库。
    发表于 06-03 01:28

    利用dockerfile搭建mysql主从集群和redis集群

    ==MySQL主从同步(Replication)是种实现数据冗余和高可用性的技术,通过将主数据库(Master)的变更操作同步到个或多个从数据库(Slave),实现数据的实时或准实时复制
    的头像 发表于 05-14 11:38 733次阅读
    利用dockerfile搭建mysql<b class='flag-5'>主从</b>集群和<b class='flag-5'>redis</b>集群

    redis三种集群方案详解

    Redis中提供的集群方案总共有三种(redis节点不超过10G内存)。
    的头像 发表于 03-31 10:46 1272次阅读
    <b class='flag-5'>redis</b>三种集群方案<b class='flag-5'>详解</b>

    Redis实战笔记

    《 2024最新Redis 实战笔记》,这份笔记对 Redis 的相关知识做了系统全面的介绍,还是PDF版本,可自由复制,特别适合 Redis 初学者快速入门和提高。   本笔记适合人
    的头像 发表于 02-09 09:12 628次阅读
    <b class='flag-5'>Redis</b>实战笔记

    解析大尺寸金刚石晶圆复制技术现状与未来

    高功率固态电子器件领域极具应用潜力。 然而,金刚石的高硬度和生长速率低、尺寸小等问题,限制了其在大尺寸晶圆制备中的应用。今天,我们就深入探究大尺寸金刚石晶圆复制技术的发展现状与未来趋势。   常规半导体
    的头像 发表于 02-07 09:16 943次阅读
    <b class='flag-5'>一</b><b class='flag-5'>文</b>解析大尺寸金刚石晶圆<b class='flag-5'>复制</b>技术现状与未来

    华为云 Flexus X 加速 Redis 案例实践与详解

    Redis 加速镜像,更是为开发者提供了极大的便利。本文将详细介绍如何利用华为云 Flexus X 实例自带的 Redis 镜像,快速部署并配置 Redis,以及通过实际案例展示其便捷性和高效性。
    的头像 发表于 01-23 17:52 601次阅读
    华为云 Flexus X 加速 <b class='flag-5'>Redis</b> 案例实践与<b class='flag-5'>详解</b>

    Redis Cluster之故障转移

    主从复制中单机的 QPS(10W)可能无法满足业务需求。 数据量的考虑:现有服务器内存不能满足业务数据的需要时,单纯向服务器添加内存不能
    的头像 发表于 01-20 09:21 1255次阅读
    <b class='flag-5'>Redis</b> Cluster之故障转移

    云服务器 Flexus X 实例,Docker 集成搭建 Redis 集群

    Redis 集群是种分布式的 Redis 解决方案,能够在多个节点之间分片存储数据,实现水平扩展和高可用性。与传统的主从架构不同,Redis
    的头像 发表于 01-13 13:37 677次阅读
    云服务器 Flexus X 实例,Docker 集成搭建 <b class='flag-5'>Redis</b> 集群

    华为云 Flexus 云服务器 X 实例:在 openEuler 系统下搭建 MySQL 主从复制

    前言 本文将介绍如何在华为云 Flexus 云服务器 X 实例上,基于 openEuler 系统部署 MySQL 主从复制。MySQL 作为款高性能且稳定的开源关系型数据库管理系统,是众多
    的头像 发表于 12-30 09:11 715次阅读
    华为云 Flexus 云服务器 X 实例:在 openEuler 系统下搭建 MySQL <b class='flag-5'>主从复制</b>

    华为云 Flexus X 轻松实现 Redis 主多从高效部署

    购买实例、配置 Redis 主从节点,并验证主多从架构的正确性。通过实际操作,您将体验到 Flexus X 在提升
    的头像 发表于 12-27 13:45 781次阅读
    华为云 Flexus X 轻松实现 <b class='flag-5'>Redis</b> <b class='flag-5'>一</b>主多从高效部署

    Redis使用重要的两个机制:Reids持久化和主从复制

    今天这篇文章,我们起了解 Redis 使用中非常重要的两个机制:Reids 持久化和主从复制。 我们都知道Redis个内存数据库,在学
    的头像 发表于 12-18 10:33 628次阅读
    <b class='flag-5'>Redis</b>使用重要的两个机制:Reids持久化和<b class='flag-5'>主从复制</b>

    Redis缓存与Memcached的比较

    Redis和Memcached都是广泛使用的内存数据存储系统,它们主要用于提高应用程序的性能,通过减少对数据库的直接访问来加速数据检索。以下是对Redis和Memcached的比较,涵盖了它们的
    的头像 发表于 12-18 09:33 916次阅读