0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为何++i比i++执行效率高一些呢?

Q4MP_gh_c472c21 来源:嵌入式ARM 2019-12-03 15:37 次阅读

背景

相信很多人遇到过这样的问题:printf("%d,%d",i++,++i);

也纠结过这个问题,到底答案是什么。确没有一个参考的资料。唯一知道的是,几乎所有C语言教材都这么讲:i++就是先使用i的值再使i自身加一,而++i则是先使i自身加一,然后在使用i的值。出于对真理的追求。今天我们彻底弄明白此问题。 譬如这样的话:

int a,b;int i=10,j=10;a=i++;b=++j; 我们可以很清楚的知道a和b的值分别将是10和11。这点毫无疑问,因为无论在任何平台任何编译器上运行都是这个结果!
然而对于这样的程序:

int a,b;int i=10,j=10;a=(i++)+(i++)+(i++);b=(++j)+(++j)+(++j); 各位试想答案将是多少?
我们可以放到编译器上运行看一下结果如下:
先看看windows下常用的VC6结果:

恩看到了,是30和37!嗯,但..这个结果好像有点怪。
那再看看Linux下gcc的结果:

哦,竟然也是30 37 。
那我们再看看古老一点的TurboC的结果:


结果成了30 39 , 喔~还真有点怪。

当然,就C语言代码来看,i++ 和 ++i 都只有一行,看起来似乎二者的执行效率一样了?其实不是的,在学习C语言时,教材和老师一般都会强调 i++ 和 ++i 的区别,例如下面这段C语言代码:

inti,j,k;i = 0;j = i++;i = 0;k = ++i;

这段C语言代码执行后,j 和 k 的值并不相等:j 等于 0,k 等于 1。既然执行结果有差异,那么执行效率很有可能也是有差异的,事实的确如此。查看上述C语言代码对应的汇编代码,如下:

编译器版本为gcc 4.8.4

可见,j=i++; 计算机需要 4 条指令来解释,比执行 k=++i; 多出了一条指令。多出的一条指令为:在对 i 执行自加操作之前,先保存 i 的当前值留作稍后使用(赋值为j)。

这是怎么回事呢?不同的编译器结果还不一样呢?

而且这样看来,似乎 ++i 的执行效率比 i++ 高一些?

为何不同的编译器结果不一样
要说起这其中的原因,我们要先明白两个知识点。即“副作用”与“顺序点”。 这里我们引用《C Primer Plus》的说法:
“现在我们再讨论一些C的术语。副作用(side effect)是对数据对象或文件的修改。

例如,语句:states = 50; 的副作用是将变量states的值设置为50。这是副作用?这看起来更像是主要目的!然而,从C的角度来看,主要目的是对表达式求值。给C一个表达式4+6,C将计算它的值为10。给C一个表达式states=50,C将计算它的值为50。计算这个表达式的副作用就是把变量states的值改变为50。跟赋值运算符一样,增量运算符和减量运算符也有副作用,它们主要由于副作用而被使用。
一个顺序点(sequence point)是程序执行中的一点;在该点处,所有的副作用都在进入下一步之前被计算。在C中,语句里的分号标志了一个顺序点。它意味着在一个语句中赋值运算符、增量预算符及减量运算符所做的全部改变必须在程序进入下一个语句前发生。任何一个完整的表达式的结束也是一个顺序点。
什么是完整的表达式呢?一个完整的表达式(full expression)是这样一个表达式—-它不是一个更大的表达式的子表达式。完整的表达式的例子包括一个表达式语句里的表达式和在一个while循环里作为判断条件的表达式。
顺序点帮助阐明后缀增量动动作何时发生。例如,考虑下面的代码:

while(guests++<10)printf(“%d ”,guests);  有时C的初学者会设想在本程序中“先使用该值,然后增加它的值”的意思是在使用printf()语句后在增加guests的值。然而,因为guests++<10是while循环的判断条件,所以它是一个完整的表达式,这个表达式的结束就是一个顺序点。因此,C保证副作用(增加guests的值)在程序进入printf()前发生。同时使用后缀形式保证了guests在于10比较后才增加。
现在考虑这个语句:

Y=(4+ x++)+(6+ x++);
表达式4+x++不是一个完整的表达式,所以C不能保证在计算子表达式4+x++后立即增加x。这里,完整表达式是整个赋值语句,并且分号标记了顺序点,所以C能保证的是在程序进入后续语句前x将增加两次。C 没有指明x是在每个子表达式被计算后增加还是在整个表达式被计算后增加,这就是我们要避免使用这类语句的原因。 这是《C Primer Plus》的说法,相信您应该有一定答案了。
没错,那就是对于i=10;(++i)+(++i)+(++i);这样的语句。C语言标准并没有作规定。有的编译器计算出来是39,因为会使i的值自增三次变为13,然后使用增加三次之后也就是13的3个值相加为39。而有的编译器计算结果则为37,如VisaulC++6.0则会先计算前两个i的值为12,第三个i的值变成了加三次以后的值为13,因此结果是12+12+13=37。如果有心的话,您可以分别在VC6和TC上本别测试;(++i)+(++i)+(++i) +(++i)的值来洞悉不同编译器的处理规则。

那么,回到最初的printf的问题,明白求值的顺序之后,再来看printf的求值问题,printf的参数都是从左到右依次压入栈内,所以计算起来求值运算的时候则是由右至左(栈的特点:即先进后出),那么至此,想必您已经完全想明白了这类问题的全部了!
所以讲到这里,想必大家就清楚缘由了,不同编译器的处理过程是不同的。所以并没有唯一的标准答案!现在大家明白了吗?

为何++i比i++执行效率高一些呢?

那为了写出效率更高的C语言程序,以后是不是应该尽量使用 ++i,而不是 i++ 了呢?例如下面这样的C语言代码:

for(i=0; i<10; i++);for(i=0; i<10; ++i);

是不是上面那行C语言代码的执行效率低于下面的呢?只能说理论如此,实际上,现代C语言编译器已经足够聪明,它会根据上下文编译C语言代码。

应该明白,i++ 和 ++i 的效率差异主要来自于处理 i++ 时,需要先保存 i 的当前值留作稍后使用。如果之后没有人使用 i 的当前值,也就是说没有C语言代码读取 i++ 的值,编译器实在没有必要保存 i 的当前值了,因此就会将这一步优化掉。

为了便于分析,我们编写下面这样的C语言代码:

int i = 0;i++;++i;

与上面的例子相比,区别在于在执行 i++ 时,没有人关心 i 的当前值了。查看这段C语言代码对应的汇编代码:

显然,i++ 和 ++i 对应的指令是一模一样的,不再有执行效率上的差异。

C语言中的 i++ 和 ++i 是有区别的,这就有可能带来效率上的差异。如果有代码关心 i++ 执行时的 i 当前值,程序在对 i 进行自加操作时,将不得不先保存 i 的当前值,而 ++i 就无需保存当前值,这就会带来效率上的差异。如果没人关心 i++ 的当前值,那么现代大多数C语言编译器将会将这一差异优化掉,此时 i++ 和 ++i 不再有效率上的差异。

-END-

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Linux
    +关注

    关注

    87

    文章

    10990

    浏览量

    206729
  • C语言
    +关注

    关注

    180

    文章

    7529

    浏览量

    128483

原文标题:C语言灵魂拷问:++i为何比i++执行效率高!有何区别?

文章出处:【微信号:gh_c472c2199c88,微信公众号:嵌入式微处理器】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    鸿蒙原生应用开发-ArkTS语言基础类库多线程I/O密集型任务开发

    使用异步并发可以解决单次I/O任务阻塞的问题,但是如果遇到I/O密集型任务,同样会阻塞线程中其它任务的执行,这时需要使用多线程并发能力来进行解决。 I/O密集型任务的性能重点通常不在于
    发表于 03-21 14:57

    PSOC Creator 4.4中是否有一些设置可以阻止strtok操作?

    我需要一些帮助才能开始使用这个功能。 我做了个简单的代码,意图用逗号作为分隔符来标记字符串。 我尝试在 PC 上模拟以下代码并将其改编为 PSoc5LP: [i]int 主要 () [i
    发表于 01-24 08:31

    提高系统效率的几个误解解析

    始地址和长度等),在传输时往往是先读到芯片内暂存,然后再写出去,即搬次数据需两个时钟周期,软件来搬要快一些(不需要取指令, 没有循环跳转等额外工作),但如果次只搬几个字节,还要做
    发表于 01-15 07:29

    【飞凌 OK113i-C 全志T113-i开发板】一些有用的常用的命令测试

    一些有用的常用的命令测试、系统信息查询 可以查询板子的内核信息、CPU处理器信息、环境变量等 二、CPU频率 从上面的系统信息查询到,这是颗具有两个ARMv7结构A7内核的处理器,主频最高
    发表于 12-22 10:05

    for循环中i++与++i的区别

    i++和++i都是增加变量i的值的运算符,但它们之间有着一些微小的区别。在这篇文章中,我将详尽、详实、细致地解释i++和++i之间的差异,并探讨它们在循环中的应用。 首先,让我们明确i++
    的头像 发表于 11-26 09:20 1293次阅读

    如何在非Autosar应用中执行I2C?

    我是NXP产品的新产品,我试图了解它的生态系统。我需要在非Autosar应用中执行I2C,所以我需要了解它是如何工作的,所以我有一些问题: 1) 在 RTD_I2C_UM.pdf 中写
    发表于 11-13 07:04

    三轴或六轴加速度传感器哪种灵敏度高一些

    DIY平衡控制系统,需要使用加速度传感器,三轴或六轴的均可以,哪种灵敏度高一些
    发表于 11-10 06:46

    “T”型NPC的效率怎么会比“I”型NPC的效率高呢?

    网上查找三电平相关的资料,特别是两种三电平结构的差异,经常能看到这样的一个结论。那就是,当开关频率小于16kHz的时候,“T”型NPC的效率比“I”型NPC的效率高;当开关频率高于16kHz的时候,“I”型NPC的效率会更高。
    的头像 发表于 11-09 14:29 1382次阅读
    “T”型NPC的<b class='flag-5'>效率</b>怎么会比“I”型NPC的<b class='flag-5'>效率高</b>呢?

    I.MX RT1052代码执行在哪里?

    试用的开发板里有了I.MX RT1052 但是看I.MX RT1052有代码与数据的SPI Flash,还有SRAM,还有片上的TCM 代码可以执行在TCM上么?还是在SRAM上运行。 TCM与
    发表于 11-09 06:49

    从使用效果看I2C通信方式和普通串口方式哪个抗干扰好一些

    从实际使用效果看,I2C和串口方式哪个抗干扰效果好一些?信号频率从几百到几M不等
    发表于 11-01 06:07

    有源pfc效率高还是无源效pfc效率高

    有源pfc效率高还是无源效pfc效率高
    发表于 10-07 09:01

    lm35传感器和18b20传感器哪个精度高一些

    这两个哪个精度高一些,分别是多少,还有测温范围是多少
    发表于 10-07 07:16

    w806和esp32哪个性价比高一些

    w806和esp32哪个性价比高一些
    发表于 09-22 06:00

    关于内部spi flash执行代码效率问题

    新唐很多mcu可以在spi flash上直接寻址,执行代码,很多自带内部spi flash作为代码存储器,这样虽然可以降低成本,但代码在spi flash上执行是极其慢的,一些关键函数必须得定向到
    发表于 08-24 07:21

    M23芯片,I2C_ReadMultiBytesOneReg想在函数中增加一些发送的数据,或修改停止或启动位要如何修改?

    M23芯片,I2C_ReadMultiBytesOneReg函数修改,看不懂源码。。。 如果我想在函数中增加一些发送的数据,或修改停止或启动位,不知如何修改,请大侠指点。
    发表于 06-20 06:44