0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

TCP粘包和拆包产生的原因

科技绿洲 来源:Linux开发架构之路 作者:Linux开发架构之路 2023-11-10 14:07 次阅读

一、TCP粘包现象

what?

TCP是个“流”协议,即没有边界。由于这个特性以及实际的网络情况,在进行数据传输时假设我们连续调用send分别发送两段数据data1和data2,在接收端有以下几种代表性的情况:

  1. 先接收到data1,然后接收到data2。
  2. 先接收到data1的部分数据,然后接收到data1余下的部分以及data2的全部。
  3. 先接收到data1的全部数据和data2的部分数据,然后接收到data2余下的数据。
  4. 一次性接收到了data1和data2的全部数据。

其中,1是理想情况,也就是我们需要的。对于2,3,4的情况就是常说的“粘包”,就需要把接收到的数据进行拆包,拆成一个个独立的数据包,而为了拆包就必须在发送端进行封包。

对于UDP来说不存在拆包问题,因为UDP是一个“数据包“协议,也就是两段数据是有界限的,在接收端要么接收不到数据要么就是一段完整的数据,不会少接收也不会多接收。

这里,笔者在发送端连续发送4096个字节的数据,然后在接收端打印接收到的数据字节数,可以很明显的看到出现了粘包现象。

receive num=2648
------------------------
receive num=1448
------------------------
receive num=2648
------------------------
receive num=2896
------------------------
receive num=1200
------------------------
receive num=1448
------------------------
receive num=2648
------------------------
receive num=2896
------------------------
receive num=1200
------------------------
receive num=1448
------------------------

why?

为什么会出现粘包这种现象呢,以下几点原因。

  1. 由Nagle算法造成的发送端粘包。Nagle算法是一种改善网络传输效率的算法,但也可能造成困扰。简单的说,当提交一端数据给TCP时,TCP并不立刻发送此段数据,而是等待一段时间,看看在等待期间是否还有要发送的数据,若有则会一次吧多段数据发送出去。
  2. 接收端接收不及时造成的接收端粘包。TCP会把接收到的数据存在自己的缓冲区中,然后通知应用层取数据。当应用层由于某些原因不能及时取出TCP的数据,就会造成TCP缓冲区中存放多段数据。
  3. 这种原因是笔者根据实践得出的,不知道对不对。若发送端发送很大的数据包,比如4096字节,由于网卡和路由器中MTU的限制。MTU规定为1500字节,那么每次数据包要低于1500字节(除去IP头部等字节),否则网口以及网络传输途径中路由器等会自动对其进行分包操作。造成接收端并不能一次接收到发送的字节数。

附:

TCP粘包和拆包产生的原因

  1. 应用程序写入数据的字节大小大于套接字发送缓冲区的大小
  2. 进行MSS大小的TCP分段。MSS是最大报文段长度的缩写。MSS是TCP报文段中的数据字段的最大长度。数据字段加上TCP首部才等于整个的TCP报文段。所以MSS并不是TCP报文段的最大长度,而是:MSS=TCP报文段长度-TCP首部长度
  3. 以太网的payload大于MTU进行IP分片。MTU指:一种通信协议的某一层上面所能通过的最大数据包大小。如果IP层有一个数据包要传,而且数据的长度比链路层的MTU大,那么IP层就会进行分片,把数据包分成若干片,让每一片都不超过MTU。注意,IP分片可以发生在原始发送端主机上,也可以发生在中间路由器上。

二、封包和解包

How?

最初解决“粘包”的问题,采用在两次send之间调用sleep休眠小一段时间来解决,缺点是显而易见的:传输效率大大降低,而且也并不可靠。

对数据包进行封包和解包就能解决这个问题:

封包就是给一段数据加上包头,这样一来数据包就分为包头和包体两部分内容了(可加上包尾)。包头其实是一个大小固定的结构体,其中有个结构体成员变量表示包体的长度,这是个很重要的变量,其他的结构体成员可根据需要自己定义。根据固定的包头长度以及包头中含有的包体长度变量值就能正确的拆分出一个完整的数据包。

利用底层的缓冲区来进行拆包时,由于TCP也维护了一个缓冲区,所以可以利用TCP的缓冲区来拆包,也就是循环不停地接收包头给出的数据,直到收够为止,这就是一个完整的TCP包。
三、代码示例

为了解决“粘包”问题,大家通常会在所发送的内容前,加上发送内容的长度,所以对方会先收到4Byte,解析获得接下来所需要接收的长度,再进行收包。

当然这个代码中还有一些待改进的地方:我们并不能保证接收到的4Byte数据正好表示的是数据的实际长度,改进办法是在包头这个结构体变量里添加表示数据头的标志。

发送端:

#include < stdio.h >
#include < stdlib.h >
#include < string.h >
#include < unistd.h >
#include < sys/types.h >
#include < sys/socket.h >
#include < netinet/in.h >
#include < arpa/inet.h >
#include < errno.h >
/*
客户端给服务端发送一个字符串,由于双方都不知道这个字符串有多长,因此发送数据前的前面4个字节表示字符串的大小
数据格式:4字节(存储字符串实际长度) + 字符串内容
*/
/*
该函数能够发送指定长度的数据。一次发送不完,可以接着发送,直到发送完指定长度为止
*/
int MySend( int iSock, char * pchBuf, size_t tLen){
        int iThisSend;
        unsigned int iSended=0;//has send bytes
        if(tLen == 0)
               return(0);
        while(iSended< tLen){
              do{
                     iThisSend = send(iSock, pchBuf, tLen-iSended, 0);//this time  
              } while((iThisSend< 0) && (errno==EINTR));
               if(iThisSend < 0){
                      return(iSended);
              }
              iSended += iThisSend;
              pchBuf += iThisSend;
       }
        return(tLen);
}

#define DEFAULT_PORT 6666

int main( int argc, char * argv[]){
    int connfd = 0;
    int cLen = 0;
    struct sockaddr_in client;
    if(argc < 2){
        printf(" Uasge: clientent [server IP address]n");
        return -1;
    }
    client.sin_family = AF_INET;
    client.sin_port = htons(DEFAULT_PORT);
    client.sin_addr.s_addr = inet_addr(argv[1]);
    connfd = socket(AF_INET, SOCK_STREAM, 0);
    if(connfd < 0){
        printf("socket() failure!n" );
        return -1;
    }

    if(connect(connfd, (struct sockaddr*)&client, sizeof(client)) < 0){
        printf("connect() failure!n" );
        return -1;
    }
	//
    ssize_t writeLen;
    char *sendMsg = "0123456789";
    int tLen=strlen(sendMsg);
    printf("tLen:%dn" ,tLen);
    int iLen=0;
    char * pBuff= new char [100];
    *(int*)(pBuff+iLen)= htonl(tLen);
    iLen+=sizeof( int);
    memcpy(pBuff+iLen,sendMsg,tLen);
    iLen+=tLen;
    writeLen= MySend(connfd, pBuff, iLen);
    if (writeLen < 0) {
       printf("write failedn" );
       close(connfd);
       return 0;
    }
    else{
       printf("write sucess, writelen :%d, sendMsg:%sn",writeLen,sendMsg);
    }
    close(connfd);
    return 0;
}

服务器端:

#include < sys/types.h >
#include < sys/socket.h >
#include < netinet/in.h >
#include < arpa/inet.h >
#include < unistd.h >
#include < stdio.h >
#include < stdlib.h >
#include < strings.h >
#include < sys/wait.h >
#include < string.h >
#include < errno.h >

/*
该函数能够接受指定长度(字节)的数据。循环接收,直到接受完指定数量为止。
*/
int MyRecv( int iSock, char * pchBuf, size_t tCount){
        size_t tBytesRead=0;
        int iThisRead;
        while(tBytesRead < tCount){
              do{
                     iThisRead = read(iSock, pchBuf, tCount-tBytesRead);
              } while((iThisRead< 0) && (errno==EINTR));
              if(iThisRead < 0){
                      return(iThisRead);
              }else if (iThisRead == 0)
                      return(tBytesRead);
              tBytesRead += iThisRead;
              pchBuf += iThisRead;
       }
}

#define DEFAULT_PORT 6666
int main( int argc, char ** argv){
    int sockfd,acceptfd; /* 监听socket: sock_fd,数据传输socket: acceptfd */
    struct sockaddr_in my_addr; /* 本机地址信息 */
    struct sockaddr_in their_addr; /* 客户地址信息 */
    unsigned int sin_size, myport=6666, lisnum=10;
    if ((sockfd = socket(AF_INET , SOCK_STREAM, 0)) == -1) {
       perror("socket" );
       return -1;
    }

    printf("socket ok n");
    my_addr.sin_family=AF_INET;
    my_addr.sin_port=htons(DEFAULT_PORT);
    my_addr.sin_addr.s_addr = INADDR_ANY;
    bzero(&(my_addr.sin_zero), 0);

    if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr )) == -1) {
        perror("bind" );
        return -2;
    }

    printf("bind ok n");
    if (listen(sockfd, lisnum) == -1) {
        perror("listen" );
        return -3;
    }
    printf("listen ok n");
    char recvMsg[10];
    sin_size = sizeof(my_addr);
    acceptfd = accept(sockfd,(struct sockaddr *)&my_addr,&sin_size);
    if (acceptfd < 0) {
       close(sockfd);
       printf("accept failedn" );
       return -4;
    }

    ssize_t readLen = MyRecv(acceptfd, recvMsg, sizeof( int));
    if (readLen < 0) {
       printf("read failedn" );
       return -1;
    }

    int len=( int)ntohl(*( int*)recvMsg);
    printf("len:%dn",len);
    readLen = MyRecv(acceptfd, recvMsg, len);
    if (readLen < 0) {
       printf("read failedn" );
       return -1;
    }
    recvMsg[len]='�';//接收到的数据并没有结束符'�',因此需要加上结束符'�
    printf("recvMsg:%sn" ,recvMsg);
    close(acceptfd);
    return 0;
  }

Makefile:

all:tcpServer tcpClient
tcpServer:tcpServer.o
	gcc -g -o tcpServer tcpServer.o
tcpClient:tcpClient.o
	gcc -g -o tcpClient tcpClient.o
tcpServer.o:tcpServer.c
	gcc -g -c tcpServer.c
tcpClient.o:tcpClient.c
	gcc -g -c tcpClient.c
clean:all
	rm all

运行截图:

图片

四、总结思考

这篇文章一个非常核心的代码就是readn和writen函数,说白了, 就一直读, 读到指定的字节数为止。其实, 在recv函数中, 最后参数如果是MSG_WAITALL, 那么就可以用recv函数一行代码, 替代上述所有代码。

大家可以对比下代码:

ssize_t readn(int fd, void *buf, int n)
{
	size_t nleft = n;   // left的意思是“剩下”, 而非“左边”
	char *bufptr = buf;
	ssize_t nread;
	while(nleft > 0)
	{
		if((nread = read(fd, bufptr, n)) < 0)
		{
			if(errno == EINTR) 	// 遇到中断
			{ 
				continue;   // 或者用 nread = 0;
			}
			else
			{
				return -1;  // 真正错误
			}
		}
		else if(nread == 0) // 对端关闭
		{
			break;
		}

		nleft -= nread;
		bufptr += nread;
	}

	return (n - nleft);
}


//一句话代码(MSG_WAITALL),前提套接字是阻塞的
 while ((num = recv(connectfd, recvbuf+buf_pos, recv_size,MSG_WAITALL)) > 0) {
 }
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据传输
    +关注

    关注

    9

    文章

    1530

    浏览量

    63567
  • 缓冲
    +关注

    关注

    0

    文章

    47

    浏览量

    17717
  • TCP
    TCP
    +关注

    关注

    8

    文章

    1272

    浏览量

    78301
  • Data
    +关注

    关注

    0

    文章

    61

    浏览量

    38028
  • 字符串
    +关注

    关注

    1

    文章

    552

    浏览量

    20130
收藏 人收藏

    评论

    相关推荐

    【NanoPi2试用体验】大图

    上个月申请的NanoPi2这个星期终于到了,顺丰快递,包装很结实,里面一大堆配件有NanoPi2开发板和红色外壳,5V2A充电器一个 ,转换头1个,8GB TF卡一张,下面直播高清大图。
    发表于 12-22 21:17

    LabVIEW 与其他语言TCP通信,数据解析求助

    做为下位机与上位机进行TCP通信,上位机非labview编程语言设计,切已经定好数据格式:帧头EB90+两个字节数据长度+数据,不能更改。以前做的
    发表于 09-14 09:15

    【MM32 MiniBoard试用体验】上海灵动开发版,测评。

    这次很幸运能申请成功,昨天上午收到了版子,最近有点忙,所以现在才分享一下我的测试等。首先:这个板子看着听高大上的,底层丝印还有二维码,USB线是黑色,面条型的。其他的 我就不废话了,上点图吧!实在点。后续开发中有什么好的想法,我会继续分享到大家的。
    发表于 11-15 22:22

    10年的FLASH芯片是否可以使用

    公司无意进到了2007年的一批未的FALSH芯片,(nor flash),部分焊接,发现芯片还可以用,但不知道这类y存放时间过长的FLASH芯片,使用会有哪些影响,请教相关人员
    发表于 06-02 22:52

    Z-Stack发送广播,超过最大数据长度时传输失败,请问怎么解决?

    也没有无线数据发出。小于等于99个字节时,发送数据正常。并且,协调器通过单播方式向某个设备发送数据时,当数据长度超过99个时,协议栈会自动传输,传输的数据也正确。我的问题:1、超过最大数据长度发送
    发表于 08-10 10:07

    ESP8266 TCP透传有时接收的数据丢

    到的数据长度,是1460,正好是一个TCP的长度。于是我猜测,由于BIN文件太大,拆分了多个TCP,而网络原因,第一个
    发表于 04-18 06:35

    sl_setsockopt选项里面有类似TCP_NODELAY的属性设置吗

    , sl_setsockopt的熟悉里面有类似的选项么? 我发现用socket 连续传输一些数据时,会出现的情况, 想用这种方法试着解决一下。
    发表于 05-05 10:53

    Labview TCP通信 数据分包和处理。

    Labview的TCP通信的读函数,会发生数据分包和吗?应该怎么处理TCP读数据,官方的例子没有考虑。
    发表于 03-22 14:02

    Labview TCP通信问题

    labview的TCP通信的读函数,会发生数据分包和吗?应该怎么处理TCP读数据,官方的例子没有考虑。
    发表于 03-22 14:07

    CH32F103C8使用串口DMA出现接收或者接收不全现象如何处理?

    在启用串口DMA接收的协议帧的时候发现接收或者接收不全现象。发送端100ms发送帧头0D帧尾0A的30字节数据,接收端使用串口空闲中断DMA方式收数据:1、接收端可能会收到0A 0D 开头的30
    发表于 05-25 06:17

    CH579 TCP的大小怎么修改?

    你好我用CH579的网络功能,我将一大小改为1024。#define RECE_BUF_LEN 1024 /* 接收缓冲区的大小536 */#define CH57xNET_TCP_MSS 1024 /* tcp MSS的大小
    发表于 08-02 06:19

    tcp_client例程为何去掉发送后,一直接收就会容易出现数据要如何处理?

    / portTICK_PERIOD_MS);}代码如下,当我使用tcp_client例程,并且把发送数据注释掉,再接收数据就很容易出现TCP数据,求助[22:43:18.320]
    发表于 02-14 08:20

    压电致动器与滑原理仿真

    。  压电“粘滞滑动”微动平台  压电“粘滞滑动”微动平台的模拟仿真运动。压电特性测试曲线如下:  实际应用仿真模拟  1、压电直推位移平台  向前应变片,  缓慢上升电压,运动范围速度不足以产生滑现象
    发表于 03-27 17:25

    锡须产生原因

    电路板焊接不良中锡须产生的分析,分析产生原因
    发表于 12-14 15:21 0次下载

    电弧产生原理_电弧产生原因

    本文介绍了电弧产生现象原因及特点,其次详细的介绍了电弧的形成原因,最后介绍了电弧产生原理图及电弧熄灭的方法进行了介绍。
    发表于 02-06 10:34 9.3w次阅读
    电弧<b class='flag-5'>产生</b>原理_电弧<b class='flag-5'>产生</b>的<b class='flag-5'>原因</b>