0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TCP keepalive机制具体是怎么样的

程序人生 来源:小林coding 作者:小林coding 2022-03-11 16:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大家好,我是小林。

今天,聊一个有趣的问题:拔掉网线几秒,再插回去,原本的 TCP 连接还存在吗?

可能有的同学会说,网线都被拔掉了,那说明物理层被断开了,那在上层的传输层理应也会断开,所以原本的 TCP 连接就不会存在的了。就好像, 我们拨打有线电话的时候,如果某一方的电话线被拔了,那么本次通话就彻底断了。

真的是这样吗?

上面这个逻辑就有问题。问题在于,错误的认为拔掉网线这个动作会影响传输层,事实上并不会影响。

实际上,TCP 连接在 Linux 内核中是一个名为 struct socket 的结构体,该结构体的内容包含 TCP 连接的状态等信息。当拔掉网线的时候,操作系统并不会变更该结构体的任何内容,所以 TCP 连接的状态也不会发生改变。

我在我的电脑上做了个小实验,我用 ssh 终端连接了我的云服务器,然后我通过断开 wifi 的方式来模拟拔掉网线的场景,此时查看 TCP 连接的状态没有发生变化,还是处于 ESTABLISHED 状态。

9bddba90-a020-11ec-952b-dac502259ad0.png

通过上面这个实验结果,我们知道了,拔掉网线这个动作并不会影响 TCP 连接的状态。接下来,要看拔掉网线后,双方做了什么动作。所以,针对这个问题,要分场景来讨论:

拔掉网线后,有数据传输;

拔掉网线后,没有数据传输;

拔掉网线后,有数据传输

在客户端拔掉网线后,服务端向客户端发送的数据报文会得不到任何的响应,在等待一定时长后,服务端就会触发超时重传机制,重传未得到响应的数据报文。如果在服务端重传报文的过程中,客户端刚好把网线插回去了,由于拔掉网线并不会改变客户端的 TCP 连接状态,并且还是处于 ESTABLISHED 状态,所以这时客户端是可以正常接收服务端发来的数据报文的,然后客户端就会回 ACK 响应报文。此时,客户端和服务端的 TCP 连接依然存在的,就感觉什么事情都没有发生。但是,如果如果在服务端重传报文的过程中,客户端一直没有将网线插回去,服务端超时重传报文的次数达到一定阈值后,内核就会判定出该 TCP 有问题,然后通过 Socket 接口告诉应用程序该 TCP 连接出问题了,于是服务端的 TCP 连接就会断开。而等客户端插回网线后,如果客户端向服务端发送了数据,由于服务端已经没有与客户端相同四元祖的 TCP 连接了,因此服务端内核就会回复 RST 报文,客户端收到后就会释放该 TCP 连接。此时,客户端和服务端的 TCP 连接都已经断开了。

那 TCP 的数据报文具体重传几次呢?

在 Linux 系统中,提供了一个叫 tcp_retries2 配置项,默认值是 15,如下图:

9c0bee2e-a020-11ec-952b-dac502259ad0.png

这个内核参数是控制,在 TCP 连接建立的情况下,超时重传的最大次数。不过 tcp_retries2 设置了 15 次,并不代表 TCP 超时重传了 15 次才会通知应用程序终止该 TCP 连接,内核还会基于「最大超时时间」来判定。

每一轮的超时时间都是倍数增长的,比如第一次触发超时重传是在 2s 后,第二次则是在 4s 后,第三次则是 8s 后,以此类推。

9c1edde0-a020-11ec-952b-dac502259ad0.png

内核会根据 tcp_retries2 设置的值,计算出一个最大超时时间。

在重传报文且一直没有收到对方响应的情况时,先达到「最大重传次数」或者「最大超时时间」这两个的其中一个条件后,就会停止重传,然后就会断开 TCP 连接。

拔掉网线后,没有数据传输

针对拔掉网线后,没有数据传输的场景,还得看是否开启了 TCP keepalive 机制 (TCP 保活机制)。如果没有开启 TCP keepalive 机制,在客户端拔掉网线后,并且双方都没有进行数据传输,那么客户端和服务端的 TCP 连接将会一直保持存在。而如果开启了 TCP keepalive 机制,在客户端拔掉网线后,即使双方都没有进行数据传输,在持续一段时间后,TCP 就会发送探测报文:

如果对端是正常工作的。当 TCP 保活的探测报文发送给对端, 对端会正常响应,这样 TCP 保活时间会被重置,等待下一个 TCP 保活时间的到来。

如果对端主机崩溃,或对端由于其他原因导致报文不可达。当 TCP 保活的探测报文发送给对端后,石沉大海,没有响应,连续几次,达到保活探测次数后,TCP 会报告该 TCP 连接已经死亡。

所以,TCP 保活机制可以在双方没有数据交互的情况,通过探测报文,来确定对方的 TCP 连接是否存活。

TCP keepalive 机制具体是怎么样的?

这个机制的原理是这样的:定义一个时间段,在这个时间段内,如果没有任何连接相关的活动,TCP 保活机制会开始作用,每隔一个时间间隔,发送一个探测报文,该探测报文包含的数据非常少,如果连续几个探测报文都没有得到响应,则认为当前的 TCP 连接已经死亡,系统内核将错误信息通知给上层应用程序。在 Linux 内核可以有对应的参数可以设置保活时间、保活探测的次数、保活探测的时间间隔,以下都为默认值:

net.ipv4.tcp_keepalive_time=7200

net.ipv4.tcp_keepalive_intvl=75

net.ipv4.tcp_keepalive_probes=9

tcp_keepalive_time=7200:表示保活时间是 7200 秒(2小时),也就 2 小时内如果没有任何连接相关的活动,则会启动保活机制;

tcp_keepalive_intvl=75:表示每次检测间隔 75 秒;

tcp_keepalive_probes=9:表示检测 9 次无响应,认为对方是不可达的,从而中断本次的连接。

也就是说在 Linux 系统中,最少需要经过 2 小时 11 分 15 秒才可以发现一个「死亡」连接。

9c458c24-a020-11ec-952b-dac502259ad0.png

图片注意,应用程序若想使用 TCP 保活机制需要通过 socket 接口设置 SO_KEEPALIVE选项才能够生效,如果没有设置,那么就无法使用 TCP 保活机制。

TCP keepalive 机制探测的时间也太长了吧?

对的,是有点长。TCP keepalive 是 TCP 层(内核态) 实现的,它是给所有基于 TCP 传输协议的程序一个兜底的方案。实际上,我们应用层可以自己实现一套探测机制,可以在较短的时间内,探测到对方是否存活。比如,web 服务软件一般都会提供 keepalive_timeout 参数,用来指定 HTTP 长连接的超时时间。如果设置了 HTTP 长连接的超时时间是 60 秒,web 服务软件就会启动一个定时器,如果客户端在完后一个 HTTP 请求后,在 60 秒内都没有再发起新的请求,定时器的时间一到,就会触发回调函数来释放该连接。

9c5736d6-a020-11ec-952b-dac502259ad0.png

总结

客户端拔掉网线后,并不会直接影响 TCP 连接状态。所以,拔掉网线后,TCP 连接是否还会存在,关键要看拔掉网线之后,有没有进行数据传输。有数据传输的情况:

在客户端拔掉网线后,如果服务端发送了数据报文,那么在服务端重传次数没有达到最大值之前,客户端就插回了网线,那么双方原本的 TCP 连接还是能正常存在,就好像什么事情都没有发生。

在客户端拔掉网线后,如果服务端发送了数据报文,在客户端插回网线之前,服务端重传次数达到了最大值时,服务端就会断开 TCP 连接。等到客户端插回网线后,向服务端发送了数据,因为服务端已经断开了与客户端相同四元组的 TCP 连接,所以就会回 RST 报文,客户端收到后就会断开 TCP 连接。至此, 双方的 TCP 连接都断开了。

没有数据传输的情况:

如果双方都没有开启 TCP keepalive 机制,那么在客户端拔掉网线后,如果客户端一直不插回网线,那么客户端和服务端的 TCP 连接状态将会一直保持存在。

如果双方都开启了 TCP keepalive 机制,那么在客户端拔掉网线后,如果客户端一直不插回网线,TCP keepalive 机制会探测到对方的 TCP 连接没有存活,于是就会断开 TCP 连接。而如果在 TCP 探测期间,客户端插回了网线,那么双方原本的 TCP 连接还是能正常存在。

除了客户端拔掉网线的场景,还有客户端「宕机和杀死进程」的两种场景。第一个场景,客户端宕机这件事跟拔掉网线是一样无法被服务端的感知的,所以如果在没有数据传输,并且没有开启 TCP keepalive 机制时,服务端的 TCP 连接将会一直处于 ESTABLISHED 连接状态,直到服务端重启进程。所以,我们可以得知一个点。在没有使用 TCP 保活机制,且双方不传输数据的情况下,一方的 TCP 连接处在 ESTABLISHED 状态时,并不代表另一方的 TCP 连接还一定是正常的。第二个场景,杀死客户端的进程后,客户端的内核就会向服务端发送 FIN 报文,与客户端进行四次挥手。所以,即使没有开启 TCP keepalive,且双方也没有数据交互的情况下,如果其中一方的进程发生了崩溃,这个过程操作系统是可以感知的到的,于是就会发送 FIN 报文给对方,然后与对方进行 TCP 四次挥手。

原文标题:拔掉网线后, 原本的 TCP 连接还存在吗?

文章出处:【微信公众号:程序人生】欢迎添加关注!文章转载请注明出处。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90883
  • TCP
    TCP
    +关注

    关注

    8

    文章

    1418

    浏览量

    83018
  • WIFI
    +关注

    关注

    82

    文章

    5466

    浏览量

    212009

原文标题:拔掉网线后, 原本的 TCP 连接还存在吗?

文章出处:【微信号:coder_life,微信公众号:程序人生】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    第二十五章 W55MH32 TCP_Server_Multi_Socket示例

    、数据交互及连接关闭的完整过程。文章详细介绍了 TCP 协议的概念、特点、与 UDP 的区别、应用场景、数据交互流程、ACK 机制、重传机制Keepalive 
    的头像 发表于 07-24 16:10 739次阅读
    第二十五章 W55MH32 <b class='flag-5'>TCP</b>_Server_Multi_Socket示例

    第二十四章 W55MH32TCP_Client_Multi_Socket示例

    及处理连接关闭的完整过程。文章详细介绍了 TCP 协议的概念、特点、与 UDP 的区别、应用场景、数据交互流程、ACK 机制、重传机制Keepalive 
    的头像 发表于 07-24 16:08 641次阅读
    第二十四章 W55MH32<b class='flag-5'>TCP</b>_Client_Multi_Socket示例

    第三章 W55MH32 TCP Client示例

    本文介绍在 W55MH32 芯片上实现 TCP 客户端模式进行数据回环测试的方法。阐述 TCP 协议概念、特点、与 UDP 区别、应用场景及相关机制。展示实现过程,包括开启 Keepalive
    的头像 发表于 07-24 09:06 767次阅读
    第三章 W55MH32 <b class='flag-5'>TCP</b> Client示例

    WICED中使能TCP保活后无法disconnected怎么解决?

    函数,并开启Keepalive,在TCP非正常断开后(直接关闭WIFI而不是直接关闭TCP的连接,正常断开是能够进入断开的回调函数的),调试发现是能够进入
    发表于 07-08 06:57

    TCP协议的性能测试与评估方法

    在现代网络通信中,TCP协议的性能对用户体验至关重要。性能测试与评估可以帮助我们了解TCP协议在不同网络条件下的表现,从而优化网络配置和提高服务质量。 TCP协议概述 TCP是一种面向
    的头像 发表于 01-22 10:03 2209次阅读

    如何优化TCP协议的性能

    优化TCP协议的性能可以从多个方面入手,以下是一些关键的策略和方法: 一、调整TCP参数 TCP窗口大小 : 重要性 :TCP窗口大小是衡量TCP
    的头像 发表于 01-22 09:52 1459次阅读

    TCP协议在网络通信中的应用

    的、基于字节流的传输层通信协议。它的主要任务是确保数据能够正确、完整地从一个网络端点传输到另一个端点。TCP通过三次握手建立连接,通过序列号和确认应答机制保证数据的顺序和完整性,通过滑动窗口机制控制数据流量,以及通过超时重
    的头像 发表于 01-22 09:50 1123次阅读

    TCP协议的安全性分析

    1. TCP协议的基本特性 TCP协议的主要目的是确保数据的可靠传输。它通过以下机制实现这一目标: 数据分段和重组 :TCP将数据分割成较小的段,并在接收端重新组装这些段。 确认和重传
    的头像 发表于 01-22 09:48 1225次阅读

    TCP协议与UDP协议的区别

    1. 连接性 TCP(传输控制协议) : 面向连接 :在数据传输之前,TCP需要建立一个连接,这通过三次握手过程完成。 可靠性 :一旦连接建立,TCP确保数据的可靠传输,通过确认和重传机制
    的头像 发表于 01-22 09:44 1746次阅读

    什么是TCP协议及其工作原理

    协议之一。它提供了一种可靠的、有序的、基于字节流的数据传输服务。TCP协议的主要特点包括: 面向连接 :在数据传输之前,TCP需要在通信双方之间建立一个连接。 可靠传输 :TCP通过确认和重传
    的头像 发表于 01-22 09:41 2201次阅读

    TCP三次握手与UDP的区别

    在计算机网络中,数据传输的可靠性和效率是两个关键因素。为了满足不同的应用需求,设计者们开发了多种传输层协议。其中,TCP(传输控制协议)和UDP(用户数据报协议)是最常用的两种。它们在数据传输机制
    的头像 发表于 01-03 17:35 1218次阅读

    TCP三次握手的基本原理

    ”的过程。这个过程不仅确保了双方准备好进行数据传输,而且还避免了一些网络攻击,如重放攻击。 什么是TCP三次握手? TCP三次握手是一种用于在两个网络实体之间建立可靠连接的机制。这个过程涉及到三个步骤,每个步骤都由一个特定的T
    的头像 发表于 01-03 17:25 1597次阅读

    TCP-UART数据透传技术,居然如此简单!

    连接的、可靠的、基于字节流的传输层通信协议。它主要用于在不可靠的网络环境中提供稳定的数据传输服务,确保数据能够按照顺序、无错误地到达接收端。 TCP通过三次握手建立连接,使用滑动窗口进行流量控制,以及通过校验和确认应答、超时重传等机制来保证数据的可靠性。它是互联网协议套件
    的头像 发表于 12-30 16:46 922次阅读
    <b class='flag-5'>TCP</b>-UART数据透传技术,居然如此简单!

    TCP-UART透传示例~看完就会源码开放!

    连接的、可靠的、基于字节流的传输层通信协议。它主要用于在不可靠的网络环境中提供稳定的数据传输服务,确保数据能够按照顺序、无错误地到达接收端。 TCP通过三次握手建立连接,使用滑动窗口进行流量控制,以及通过校验和确认应答、超时重传等机制来保证数据的可靠性。它是互联网协议套件
    的头像 发表于 12-30 16:43 936次阅读
    <b class='flag-5'>TCP</b>-UART透传示例~看完就会源码开放!

    Keepalive基础知识

    Keepalive 1 keepalived介绍   官网:http://keepalived.org/   功能: 基于vrrp协议完成地址流动 为vip地址所在的节点生成ipvs规则(在配置文件
    的头像 发表于 12-19 09:57 1451次阅读
    <b class='flag-5'>Keepalive</b>基础知识