0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么要结构体对齐?为什么结构体对齐那么重要?

jf_L18yujSQ 来源:嵌入式软件实战派 2023-05-26 14:10 次阅读

C语言结构体对齐问题,是面试必备问题。

这不是在面试时要装B,也不是要故意难为一下面试者,而是这个知识点比较基础,但很重要。

网上搜出来的嵌入式或C语言笔试题,很多都有这种题目,连《程序员面试宝典》也有讲解这种题目。

6b49f12c-fb83-11ed-90ce-dac502259ad0.png

结构体对齐知识点考察,俨然成为编程技术岗面试笔试的一种标配。

我以前找工作被问这种题的时候就经常想,结构体对齐这个东西平常很少用,考这东西干嘛?为什么结构体对齐那么重要。 看看这个例子:

    typedef struct 
    {
        int e_int;
        char e_char1;
        char e_char2;
    }S2;


    typedef struct 
    {
        char e_char1;
        int e_int;
        char e_char2;
    }S3;
S2s2;
    S3 s3;

你觉得这俩结构体所占内存是一样大吗?其实不是!

好像也没什么啊,一不一样大对于C语言程序员有什么所谓!

也许你还还感觉不到,上段代码:

    S2 s2[1024] = {0};
    S3 s3[1024] = {0};

对于32位系统,s2的大小为8K,而s3的大小为12K,一放大,就有很明显的区别了。

再举个例子:

unsignedcharbytes[10]={0};
int* p = (int*)&bytes[3];
*p = 0x345678;
你觉得执行上面的代码会发生什么情况?Warining?只是Warning么?!

以前我也没觉得懂得这个结构体对齐或者内存对齐有多重要,直到已经从事了嵌入式开发经验不断积累,才慢慢体会到,这是一种很基础的知识,就因为这个东西不常用,而出现相关的问题是非常致命的,排查起来成本非常高。 有个小伙伴,因为一个内存对齐(结构体对齐相关知识点)问题导致的偶发性Exception问题,折腾了一个多星期。

由于项目接近尾声,出现这种问题,项目经理、老板都操心得不得了。天天不是奶茶水果,就是宵夜,把小伙伴当宝贝来哄,为的就是快速定位这个问题。

然而,他们日以继夜的排查了一个多星期,依然一脸懵逼。 直到让我参与进来支援,我通过仿真方式碰巧捕捉到了这种异常情况。问题的根本原因就是强制类型转换导致的内存对齐问题。

篇幅有限,这个故事,以后慢慢细讲。 接下来先看看,结构体对齐的知识点。 结构体对齐,说不难吧,我研究了很多次,都没完全记住;说难吧,理解其原因本质,就易如破竹。

结构体对齐,其实其本质就是内存对齐。

什么以最大元素变量为单位,什么最小公倍数等等法则,通通都是让你死记硬背的,没两天就忘了。

为什么要结构体对齐,原因就是内存要对齐,原因是芯片内存的制造限制,是制造成本约束,是内存读取效率要求。

如果你上学的时候认真学习过微机原理,应该还记得,芯片的地址总线和数据总线这个概念吧。

没学过微机原理也没关系,8位单片机、16位单片机和32位单片机等等,这些总得听说过吧。

6b5b9422-fb83-11ed-90ce-dac502259ad0.png

这个8位、16位和32位等,指的是单片机一次处理数据的宽度,也就和数据总线相关了。

细心的小伙伴会知道,16位单片机的通用寄存器例如R0的长度是2个字节的,而32位的是4字节的。

也就是说16位单片机,单指令一次访问数据是2个字节,而32位单片机可以访问4字节。

为了提高MCU的运行效率,内存设计上,进来适应这个CPU的总线访问。

以32位MCU为例,其内存一般都是每4字节(32位)为一个小单元,有时候也叫1个字(Word)。

6b665cae-fb83-11ed-90ce-dac502259ad0.png

注意:字节,这个概念长度是固定的,就是8bit;而,却不是固定的,跟CPU或系统位数有关,有时候还会出现字、双字这些概念,举例说明下: 32位计算机:1字=32位=4字节,64位计算机:1字=64位=8字节 所以,对于C语言的变量的存放和访问,都会按着这单位来,例如32位系统中,char是一个字节的,就按Byte来,int是4字节的,那么按Word来。

为什么要这样呢? 如果,一块内存在地址上随便放的,CPU有可能就会用到多条指令来访问,这就会降低效率。

对于32位系统,如下图的A可能需要2条指令访问,而B只需1条指令。

6b7051be-fb83-11ed-90ce-dac502259ad0.png

6b775f90-fb83-11ed-90ce-dac502259ad0.png

不仅单片机这样,我们常用的计算机也是这样

你以为,通过总线的方式可以随便访问一个地址吗

6b8e5092-fb83-11ed-90ce-dac502259ad0.png

但是,为了提高访问速度,其设计是这样的:

6b9a77b4-fb83-11ed-90ce-dac502259ad0.png

6ba4276e-fb83-11ed-90ce-dac502259ad0.png

这样,这个地址就必须是8的倍数。 如果你要从不对齐的内存读取数据,虽然在C语言编程上感觉不到这样的操作有什么区别,但CPU是分开多次读出来的。

这就是内存对齐了。int8(即char)是以1字节对齐,int16是以2字节对齐,而int32是以4字节对齐的,等等。

世界上CPU平台、系统那么多,我们怎么知道哪个类型到底有多长,是以哪种长度对齐的?

不要瞎猜,直接上代码。每个平台都不一样,请读者自行测试,以下我是基于Windows上MinGW的GCC测的。

#defineBASE_TYPE_SIZE(t)printf("%12s:%2dByte%s
",#t,sizeof(t),(sizeof(t))>1?"s":"")
void base_type_size(void)
{
    BASE_TYPE_SIZE(void);
    BASE_TYPE_SIZE(char);
    BASE_TYPE_SIZE(short);
    BASE_TYPE_SIZE(int);
    BASE_TYPE_SIZE(long);
    BASE_TYPE_SIZE(long long);
    BASE_TYPE_SIZE(float);
    BASE_TYPE_SIZE(double);
    BASE_TYPE_SIZE(long double);
    BASE_TYPE_SIZE(void*);
    BASE_TYPE_SIZE(char*);
    BASE_TYPE_SIZE(int*);
    
    typedef struct 
    {
    }StructNull;
    BASE_TYPE_SIZE(StructNull);
    BASE_TYPE_SIZE(StructNull*);
}

结果是:

        void :  1 Byte
        char :  1 Byte
       short :  2 Bytes
         int :  4 Bytes
        long :  4 Bytes
   long long :  8 Bytes
       float :  4 Bytes
      double :  8 Bytes
 long double : 12 Bytes
       void* :  4 Bytes
       char* :  4 Bytes
        int* :  4 Bytes
  StructNull :  0 Byte
 StructNull* :  4 Bytes

这些内容不用记住,不同平台是不一样的,使用之前,一定要亲自测试验证下。

这里先解释下“模数”的概念:

每个特定平台上的编译器都有自己的默认“对齐系数”(也叫对齐模数)。

接着看网上流传一个表:

平台 长度/模数 char short int long float double long long long double
Win-32 长度 1 2 4 4 4 8 8 8
模数 1 2 4 4 4 8 8 8
Linux-32 长度 1 2 4 4 4 8 8 12
模数 1 2 4 4 4 4 4 4
Linux-64 长度 1 2 4 8 4 8 8 16
模数 1 2 4 8 4 8 8 16

本文的的例子我用的是MinGW32的GCC来测试,你猜符合上表的哪一项?

别急,再看一个例子:

    typedef struct 
    {
        int e_int;
        double e_double;
    }S11;
    S11 s11;
STRUCT_E_ADDR_OFFSET(s11,e_int);
    STRUCT_E_ADDR_OFFSET(s11, e_double);

结果是:

  s11 size = 16        s11.e_int addr: 0028FF18, offset:  0
  s11 size = 16     s11.e_double addr: 0028FF20, offset:  8

很明显,上表没有一项完全对应得上的。简单汇总以下我测试的结果:

长度/模数 char short int long float double long long long double
长度 1 2 4 4 4 8 8 12
模数 1 2 4 4 4 8 8 8

所以,再强调一下:因为环境的差异,在你参考使用之前,请自行测试一下。

其实,这个模数是可以改变的,可以用预编译命令#pragma pack(n),n=1,2,4,8,16来改变这一系数,其中的n就是你要指定的“对齐系数”。

例如

#pragma pack(1)
typedef struct 
{
    char e_char;
    long double e_ld;
}S14;
#pragma pack()
想知道结构图元素内存如何对齐,其实非常简单。 其实,你只需知道当前你使用的这个系统的基本类型的sizeof是多少,然后根据这个大小做对齐排布。 例如,本文一开始的例子:
    typedef struct 
    {
        int e_int;
        char e_char1;
        char e_char2;
    }S2;


    typedef struct 
    {
        char e_char1;
        int e_int;
        char e_char2;
    }S3;
S2s2;
    S3 s3;

32位系统中,它们内存是这么对齐的:

6bb09530-fb83-11ed-90ce-dac502259ad0.png

简单解释下:

S2中的元素e_int是按4字节对齐的,其地址位4整数倍,而e_char1和e_char2就按1字节对齐,紧跟其后面就可以了;

而S3中的元素e_char1是按1字节对齐的,放在最前面,而e_int是按4字节对齐的,其地址位4整数倍,所以,只能找到个+4的位置,紧接着e_char2就按1字节对齐,跟其后面就可以了。

那么sizeof(s2)和sizeof(s3)各是多少怎么算?

也很简单,例如这个32位系统,为了提高执行效率,编译器会让数据访问以4字节为单位的,所以S2里有2个字节留空,即sizeof(s2)=8,而sizeof(s3)=12。

是不是很简单呢!

接着,来个复杂一点的:

    typedef struct 
    {
        char e_char1;
        short e_short;
        char e_char2;
        int e_int;
        char e_char3;
    }S4;
S4s4;

其内存分布如下:

6bb8138c-fb83-11ed-90ce-dac502259ad0.png

按上面的方法,也不难理解。e_int是不能从+5位置开始的,因为+5不是int的对齐位置,用int去访问+5位置是效率很低或者有问题的,所以它只能从+8位置开始。

再复杂一点的呢?来看看union和struct结合的例子:

    typedef struct
    {
        int e_int1; 
        union
        {
            char ue_chars[9]; 
            int ue_int;
        }u;
        double e_double; 
        int e_int2; 
    }SU2;
SU2su2;
得到:

6bbe5af8-fb83-11ed-90ce-dac502259ad0.png

为什么这样呢? 你这样想,要时刻想着CPU访问数据的效率,如果union里的元素类型不一样,那就以最大长度的那个类型对齐了。

另外,还有结构体套着结构体的情况了:

typedef struct 
    {
        int e_int;
        char e_char;
}S1;
typedef struct 
    {
        S1 e_s;
        char e_char;
    }SS1;


    typedef struct 
    {
        short e_short;
        char e_char;
    }S6;


    typedef struct 
    {
        S6 e_s;
        char e_char;
}SS2;

得出结果:

6bc83212-fb83-11ed-90ce-dac502259ad0.png

得出结论:结构体内的结构体,结构体内的元素并不会和结构体外的元素合并占一个对齐单元。

只要技术上面的对齐方法,这些都不难理解。 如果你非要一些规则的话,我总结成这样:

首先,不推荐记忆这些条条框框的文字,以下内容仅供参考:

结构体的内存大小,并非其内部元素大小之和;

结构体变量的起始地址,可以被最大元素基本类型大小或者模数整除;

结构体的内存对齐,按照其内部最大元素基本类型或者模数大小对齐;

模数在不同平台值不一样,也可通过#pragma pack(n)方式去改变;

如果空间地址允许,结构体内部元素会拼凑一起放在同一个对齐空间;

结构体内有结构体变量元素,其结构体并非展开后再对齐;

union和bitfield变量也遵循结构体内存对齐原则。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 单片机
    +关注

    关注

    6001

    文章

    43973

    浏览量

    620841
  • 寄存器
    +关注

    关注

    30

    文章

    5028

    浏览量

    117722
  • C语言
    +关注

    关注

    180

    文章

    7530

    浏览量

    128713
  • MCU芯片
    +关注

    关注

    3

    文章

    218

    浏览量

    11144

原文标题:面试爱问之结构体对齐

文章出处:【微信号:小飞哥玩嵌入式,微信公众号:小飞哥玩嵌入式】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    C语言-结构对齐详解

    `C语言-结构对齐详解朱有鹏1、结构为何要对齐访问访问
    发表于 07-12 16:41

    RM48HDK平台CCS结构字节对齐总是咨询

    硬件平台:RM48HDK  软件平台:5.4.0.00091  编译器:TI V5.0.6 我在程序中想对一个结构增加单字节对齐属性,增加方式如下: 1、参照《ARM Optimizing
    发表于 05-25 10:38

    CCS3.3 结构成员对齐

    吗?如果不支持,那么怎么样来改变其结构对齐方式?请朋友们不吝赐教。 另外 用#pragma pack()会提示#pragma 不被识别的错误。这是怎么回事?
    发表于 06-21 10:16

    请问在ccs4.2 中怎么设置结构的字节对齐

    请问在ccs4.2 中怎么设置结构的字节对齐,用于网络数据发送的。是:]__attribute__((packed))还是:#pragma pack(1)编译后,两种都不行,是什么原因?有没有其他方法,把
    发表于 08-02 07:47

    请问z-stack结构默认对齐方式是一字节吗?

    z-stack的结构默认对齐方式是一字节吗?在z-stack中可以将一般指针强制转换为结构指针吗?
    发表于 08-18 07:38

    漫谈C语言结构

    我放在下面。  在此,我会围绕以下2个问题来分析和应用C语言结构:  1. C语言中的结构有何作用  2. 结构
    发表于 11-15 15:59

    请问cc2640r2 ccs7.4结构字节能实现对齐吗?

    请问结构字节下面能实现字节对齐么#pragma pack(1)typedef struct [ uint16_t nt ; uint8_t nd ; uint8_t *data
    发表于 10-31 10:10

    关于labview传入参数到DLL结构

    labview给DLL中结构传入参数,保证字节对齐下面是注意事项,很关键:labview中层次结构数据类型(例如,簇)中的数组和字符串始
    发表于 11-08 20:30

    STM32终极字节对齐的相关资料推荐

    字节对齐。uint64_t定义变量地址8字节对齐。指针变量是4字节对齐。二、结构成员
    发表于 12-06 06:03

    结构变量的定义与使用变量访问结构成员

    知识点回顾关于找最大公共子串的两种解题方法结构的定义(3种)结构变量的定义与使用变量访问结构
    发表于 12-17 07:10

    测试结构成员内存对齐的方式方法

    //测试环境:keil for ARM//测试目的:通过keil仿真,介绍结构成员对齐方式 #pragma pack ()//定义一个联合体类型 struct stru {int a;long b
    发表于 12-21 07:37

    C语言中创建一个结构其实际占用的内存空间大小是多少呢?

    际占用的内存空间大小是多少呢?示例代码如下:struct S{int i;char c;int j;};正确计算结构大小,首先需要了解数据对齐的原理。数据
    发表于 09-29 11:57

    为什么ST库函数结构没加对齐地址是连续的?

    为什么ST库函数结构没加对齐,地址是连续的
    发表于 10-15 08:11

    结构对齐为什么那么重要

    以前我也没觉得懂得这个结构对齐或者内存对齐有多重要,直到已经从事了嵌入式开发经验不断积累,才慢慢体会到,这是一种很基础的知识,就因为这个东西不常用,而出现相关的问题是非常致命的,排查
    的头像 发表于 04-03 10:13 1159次阅读

    keil arm工程中结构体1字节对齐如何实现

    在Keil Arm工程中,结构体的对齐方式可以通过使用特定的编译器指令或者关键字来实现。结构体的对齐方式会直接影响结构体变量在内存中的布局和
    的头像 发表于 01-05 14:40 1164次阅读