0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

C语言中Linux字节对齐的问题

multisim 来源: 一口Linux 作者:土豆居士 2021-08-16 11:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近作者在做一个项目,遇到一个问题,运行于ARM上的threadx在与DSP通信采用消息队列的方式传递消息(最终实现原理是中断+共享内存的方式),在实际操作过程中发现threadx总是crash,于是经过排查,是因为传递消息的结构体没有考虑字节对齐的问题。

随手整理一下C语言中字节对齐的问题与大家一起分享。

一、概念

对齐跟数据在内存中的位置有关。如果一个变量的内存地址正好位于它长度的整数倍,他就被称做自然对齐。比如在32位cpu下,假设一个整型变量的地址为0x00000004,那它就是自然对齐的。

首先了解什么位、字节、字

bit 1个二进制位称为1个bit
字节 Byte 8个二进制位称为1个Byte
word 电脑用来一次性处理事务的一个固定长度
名称 英文名 含义

字长

一个字的位数,现代电脑的字长通常为16,32, 64位。(一般N位系统的字长是N/8字节。)

不同的CPU一次可以处理的数据位数是不同的,32位CPU可以一次处理32位数据,64位CPU可以一次处理64位数据,这里的位,指的就是字长。

而所谓的字长,我们有时会称为字(word)。在16位的CPU中,一个字刚好为两个字节,而32位CPU中,一个字是四个字节。若以字为单位,向上还有双字(两个字),四字(四个字)。

二、对齐规则

对于标准数据类型,它的地址只要是它的长度的整数倍就行了,而非标准数据类型按下面的原则对齐:数组 :按照基本数据类型对齐,第一个对齐了后面的自然也就对齐了。联合 :按其包含的长度最大的数据类型对齐。结构体:结构体中每个数据类型都要对齐。

三、如何限制定字节对齐位数?

1. 缺省

在缺省情况下,C编译器为每一个变量或是数据单元按其自然对界条件分配空间。一般地,可以通过下面的方法来改变缺省的对界条件:

2. #pragma pack(n)

· 使用伪指令#pragma pack (n),C编译器将按照n个字节对齐。· 使用伪指令#pragma pack (),取消自定义字节对齐方式。

#pragma pack(n) 用来设定变量以n字节对齐方式。n字节对齐就是说变量存放的起始地址的偏移量有两种情况:

如果n大于等于该变量所占用的字节数,那么偏移量必须满足默认的对齐方式

如果n小于该变量的类型所占用的字节数,那么偏移量为n的倍数,不用满足默认的对齐方式。

结构的总大小也有一个约束条件,如果n大于等于所有成员变量类型所占用的字节数,那么结构的总大小必须为占用空间最大的变量占用的空间数的倍数;否则必须是n的倍数。

3. __attribute

另外,还有如下的一种方式:· __attribute((aligned (n))),让所作用的结构成员对齐在n字节自然边界上。如果结构中有成员的长度大于n,则按照最大成员的长度来对齐。·attribute((packed)),取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐。

3. 汇编.align

汇编代码通常用.align来制定字节对齐的位数。

.align:用来指定数据的对齐方式,格式如下:

.align[absexpr1,absexpr2]

以某种对齐方式,在未使用的存储区域填充值. 第一个值表示对齐方式,4, 8,16或 32. 第二个表达式值表示填充的值。

四、为什么要对齐?

操作系统并非一个字节一个字节访问内存,而是按2,4,8这样的字长来访问。因此,当CPU从存储器读数据到寄存器,IO的数据长度通常是字长。如32位系统访问粒度是4字节(bytes), 64位系统的是8字节。当被访问的数据长度为n字节且该数据地址为n字节对齐时,那么操作系统就可以高效地一次定位到数据,无需多次读取,处理对齐运算等额外操作。数据结构应该尽可能地在自然边界上对齐。如果访问未对齐的内存,CPU需要做两次内存访问。

字节对齐可能带来的隐患:

代码中关于对齐的隐患,很多是隐式的。比如在强制类型转换的时候。例如:

unsignedinti=0x12345678; unsignedchar*p=NULL; unsignedshort*p1=NULL; p=&i; *p=0x00; p1=(unsignedshort*)(p+1); *p1=0x0000;

最后两句代码,从奇数边界去访问unsignedshort型变量,显然不符合对齐的规定。在x86上,类似的操作只会影响效率,但是在MIPS或者sparc上,可能就是一个error,因为它们要求必须字节对齐.

五、举例

例1:os基本数据类型占用的字节数

首先查看操作系统的位数

在64位操作系统下查看基本数据类型占用的字节数:

#include intmain() { printf("sizeof(char)=%ld ",sizeof(char)); printf("sizeof(int)=%ld ",sizeof(int)); printf("sizeof(float)=%ld ",sizeof(float)); printf("sizeof(long)=%ld ",sizeof(long)); printf("sizeof(longlong)=%ld ",sizeof(longlong)); printf("sizeof(double)=%ld ",sizeof(double)); return0; }

例2:结构体占用的内存大小--默认规则

考虑下面的结构体占用的位数

structyikou_s { doubled; charc; inti; }yikou_t;

执行结果

sizeof(yikou_t)=16

在内容中各变量位置关系如下:

9e6db748-fdb8-11eb-9bcf-12bb97331649.png

其中成员C的位置还受字节序的影响,有的可能在位置8

编译器给我们进行了内存对齐,各成员变量存放的起始地址相对于结构的起始地址的偏移量必须为该变量类型所占用的字节数的倍数, 且结构的大小为该结构中占用最大空间的类型所占用的字节数的倍数。

对于偏移量:变量type n起始地址相对于结构体起始地址的偏移量必须为sizeof(type(n))的倍数结构体大小:必须为成员最大类型字节的倍数

char:偏移量必须为sizeof(char)即1的倍数 int:偏移量必须为sizeof(int)即4的倍数 float:偏移量必须为sizeof(float)即4的倍数 double:偏移量必须为sizeof(double)即8的倍数

例3:调整结构体大小

我们将结构体中变量的位置做以下调整:

structyikou_s { charc; doubled; inti; }yikou_t;

执行结果

sizeof(yikou_t)=24

各变量在内存中布局如下:

9eb0590e-fdb8-11eb-9bcf-12bb97331649.png

当结构体中有嵌套符合成员时,复合成员相对于结构体首地址偏移量是复合成员最宽基本类型大小的整数倍。

例4:#pragma pack(4)

#pragmapack(4) structyikou_s { charc; doubled; inti; }yikou_t;sizeof(yikou_t)=16

例5:#pragma pack(8)

#pragmapack(8) structyikou_s { charc; doubled; inti; }yikou_t;sizeof(yikou_t)=24

例6:汇编代码

举例:以下是截取的uboot代码中异常向量irq、fiq的入口位置代码:

9f00b354-fdb8-11eb-9bcf-12bb97331649.png

六、汇总实力

有手懒的同学,直接贴一个完整的例子给你们:

#include main() { structA{ inta; charb; shortc; }; structB{ charb; inta; shortc; }; structAA{ //inta; charb; shortc; }; structBB{ charb; //inta; shortc; }; #pragmapack(2)/*指定按2字节对齐*/ structC{ charb; inta; shortc; }; #pragmapack()/*取消指定对齐,恢复缺省对齐*/ #pragmapack(1)/*指定按1字节对齐*/ structD{ charb; inta; shortc; }; #pragmapack()/*取消指定对齐,恢复缺省对齐*/ ints1=sizeof(structA); ints2=sizeof(structAA); ints3=sizeof(structB); ints4=sizeof(structBB); ints5=sizeof(structC); ints6=sizeof(structD); printf("%d ",s1); printf("%d ",s2); printf("%d ",s3); printf("%d ",s4); printf("%d ",s5); printf("%d ",s6); } ------------END------------

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    88

    文章

    11628

    浏览量

    217949
  • C语言
    +关注

    关注

    183

    文章

    7642

    浏览量

    144599
  • 字节
    +关注

    关注

    0

    文章

    43

    浏览量

    14330

原文标题:Linux字节对齐的那些事

文章出处:【微信号:A1411464185,微信公众号:multisim】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    C语言的编程技巧

    一个成员是一个未知大小的数组,适用于动态分配内存并关联一个可变长度的数组。‌ ‌3、匿名结构体和联合体‌:C语言允许在结构体或联合体中定义不带标签的内部结构体或联合体,简化代码结构。 ‌4
    发表于 11-27 06:46

    C语言的分支结构介绍

    1.简单if语句 C语言中的分支结构语句中的if条件语句。 简单if语句的基本结构如下: 代码语言:javascript if(表达式) { 执行代码块; } 其语义是:如果表达式的值为真,则执行其后的语句,否则不执
    发表于 11-25 07:48

    C语言的常量介绍

    、-13; 实型常量:13.33、-24.4; 字符常量:‘a’、‘M’ 字符串常量:”I love china!” 在C语言中,可以用一个标识符来表示一个常量,称之为符号常量。符号常量在使用之前必须先
    发表于 11-24 07:12

    摩尔线程新一代大语言模型对齐框架URPO入选AAAI 2026

    近日,摩尔线程在人工智能前沿领域取得重要突破,其提出的新一代大语言模型对齐框架——URPO统一奖励与策略优化,相关研究论文已被人工智能领域的国际顶级学术会议AAAI 2026收录。这一成果标志着摩尔线程在大模型基础技术探索上迈出了关键一步,为简化大模型训练流程、突破模型性
    的头像 发表于 11-17 16:03 229次阅读
    摩尔线程新一代大<b class='flag-5'>语言</b>模型<b class='flag-5'>对齐</b>框架URPO入选AAAI 2026

    Linux 编程语言盘点:从内核到AI的全栈选择

    在工控圈和嵌入式圈里,有一个常年被讨论的问题:  “在 Linux 上,到底该用什么语言编程?” 有人坚信:C 才是真正的工业语言。有人反驳:Python 才是效率王者。还有人推崇 G
    的头像 发表于 11-06 17:05 430次阅读

    第4章 C语言基础以及流水灯的实现(4.3 4.4)

    4.3 C语言基本运算符 小学数学学过加、减、乘、除等运算符号以及四则混合运算,而这些运算符号在C语言中也有,但是有些表达方法不一样,并且还有额外的运算符号。在
    的头像 发表于 10-29 15:30 178次阅读

    MDK uVision V5.36.00使用rt_packed进行字节对齐,但无效,为什么?

    各位RTT专家好: MDK uVision V5.36.00使用rt_packed进行字节对齐,但无效。
    发表于 09-24 06:37

    C语言中的内联函数与宏

    C编程中,内联函数和宏都用于避免函数调用的开销并编写可复用的逻辑部分,但它们在工作方式和安全性方面存在显著差异。
    的头像 发表于 07-25 15:10 1712次阅读
    <b class='flag-5'>C</b><b class='flag-5'>语言中</b>的内联函数与宏

    Windows环境下32位汇编语言中文资料

    电子发烧友网站提供《Windows环境下32位汇编语言中文资料.rar》资料免费下载
    发表于 06-30 15:14 0次下载

    深入理解C语言C语言循环控制

    改变程序的执行流程,使代码更加灵活和可控。本文将详细介绍这些语句的作用及其应用场景,并通过示例代码进行说明。Part.1break语句C语言中break语句有两种
    的头像 发表于 04-29 18:49 1733次阅读
    深入理解<b class='flag-5'>C</b><b class='flag-5'>语言</b>:<b class='flag-5'>C</b><b class='flag-5'>语言</b>循环控制

    C语言中结构体与联合体的深度解析:内存布局与应用场景

    一、基础概念与核心差异 1.1 结构体(Struct)的本质 **结构体是C语言中实现数据封装的基石,其核心特征在于内存独立性。每个成员变量在内存中按声明顺序依次排列,形成连续的内存块。以学生信息为
    发表于 04-08 09:18

    技术干货驿站 ▏深入理解C语言:嵌套循环与循环控制的底层原理

    大家好!在上一节中,我们学习了C语言中的基本循环语句,如for、while和do...while循环。今天,我们将进一步探讨嵌套循环和循环控制,这些技巧可以帮助我们实现更复杂的逻辑操作。无论是处理
    的头像 发表于 02-21 18:26 1039次阅读
    技术干货驿站  ▏深入理解<b class='flag-5'>C</b><b class='flag-5'>语言</b>:嵌套循环与循环控制的底层原理

    EE-62:在C语言中访问短字内存

    电子发烧友网站提供《EE-62:在C语言中访问短字内存.pdf》资料免费下载
    发表于 01-07 14:02 0次下载
    EE-62:在<b class='flag-5'>C</b><b class='flag-5'>语言中</b>访问短字内存

    EE-128:C语言中的DSP:从C调用汇编类成员函数

    电子发烧友网站提供《EE-128:C语言中的DSP:从C调用汇编类成员函数.pdf》资料免费下载
    发表于 01-07 13:48 0次下载
    EE-128:<b class='flag-5'>C</b><b class='flag-5'>语言中</b>的DSP:从<b class='flag-5'>C</b>调用汇编类成员函数

    深入理解C语言:循环语句的应用与优化技巧

    能让你的代码更加简洁明了,还能显著提升程序执行效率。本文将详细介绍C语言中的三种常见循环结构——while循环、for循环和do...while循环,带你深入理解它
    的头像 发表于 12-07 01:11 1063次阅读
    深入理解<b class='flag-5'>C</b><b class='flag-5'>语言</b>:循环语句的应用与优化技巧