0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么指令集支持原子操作

电子工程师 来源:技术让梦想更伟大 作者:技术让梦想更伟大 2022-08-02 11:48 次阅读

前言

这个是在面试的时候遇到的问题,当时没有答出来。回到家以后查了查,整理记录下来。 原问题:什么指令集支持原子操作?其原理是什么?如果考虑到全部的指令集,问题太大了,这里简化下。以X86和ARM为例。 原子操作是不可分割的操作,在执行完毕时它不会被任何事件中断。在单处理器系统(UniProcessor,简称 UP)中,能够在单条指令中完成的操作都可以认为是原子操作,因为中断只能发生在指令与指令之间。 比如,C语言代码 8186aa7e-0e86-11ed-ba43-dac502259ad0.png   如果未经优化,有可能生成如下汇编:   819e654c-0e86-11ed-ba43-dac502259ad0.png   这样在有多个进程执行这段代码时,就有可能产生并发问题:   81aa7b5c-0e86-11ed-ba43-dac502259ad0.png   这就会出现问题。 在单处理器中,解决这个问题的方法是,将count++语句翻译成单指令操作 81bab972-0e86-11ed-ba43-dac502259ad0.png X86指令集支持inc操作,这样count操作可以在一条指内完成。 进程的上下文切换总是在一条指令执行之后完成,所以不会出现上述的并发问题。对于单处理器来说,一条处理器指令就是一个原子操作。 同样,ARM里的SWP和X86里的XCHG都是对于单处理器来说,是原子操作。 但是,在多处理器系统(Symmetric Multi-Processor,简称 SMP)中情况有所不同,由于系统中有多个处理器在独立的运行,即使在能单条指令中完成的操作也可能受到干扰。因为这个时候并发的主题不再是进程,而是处理器。

X86架构

Intel X86指令集提供了指令前缀lock用于锁定前端串行总线FSB,保证了指令执行时不会收到其他处理器的干扰。 比如: 81c7a588-0e86-11ed-ba43-dac502259ad0.png 使用lock指令前缀之后,处理期间对count内存的并发访问(Read/Write)被禁止,从而保证了指令的原子性。 如图所示: 81db363e-0e86-11ed-ba43-dac502259ad0.pngX86LOCK 其原理在Intel开发手册有如下说明:

在执行伴随的指令期间使处理器的LOCK#信号有效(将指令变为原子指令)。在多处理器环境中,LOCK#信号确保处理器在信号有效时独占使用任何共享存储器。 LOCK前缀只能附加在下面的指令之前,并且只适用于那些目标操作数是内存操作数的指令格式:ADD,ADC,AND,BTC,BTR,BTS,CMPXCHG,CMPXCH8B,CMPXCHG16B,DEC,INC, NEG,NOT,OR,SBB,SUB,XOR,XADD和XCHG。 如果LOCK前缀与这些指令之一一起使用,并且源操作数是内存操作数,则可能会生成未定义的操作码异常(#UD)。如果LOCK前缀与任何不在上述列表中的指令一起使用,也会产生未定义的操作码异常。无论是否存在LOCK前缀,XCHG指令都始终声明LOCK#信号。 LOCK前缀通常与BTS指令一起使用,以在共享存储器环境中的存储器位置上执行读取 – 修改 – 写入操作。 LOCK前缀的完整性不受存储器字段对齐的影响。内存锁定是针对任意不对齐的字段。

操作系统中的实现

Linux源码中对于原子自增一是如下定义的: 81ef3404-0e86-11ed-ba43-dac502259ad0.png   LOCK_PREFIX的定义如下所示: 81fdce9c-0e86-11ed-ba43-dac502259ad0.png   可见:在对称多处理器架构的情况下,LOCK_PREFIX被解释为指令前缀lock。而对于单处理器架构,LOCK_PREFIX不包含任何内容。 另外,对于CAS,有cmpxchg指令进行操作。代码如下:

static__always_inlineintatomic_cmpxchg(atomic_t*v,intold,intnew)
{
returncmpxchg(&v->counter,old,new);
}


#definecmpxchg(ptr,old,new)
__cmpxchg(ptr,old,new,sizeof(*(ptr)))


#define__cmpxchg(ptr,old,new,size)
__raw_cmpxchg((ptr),(old),(new),(size),LOCK_PREFIX)


#define__raw_cmpxchg(ptr,old,new,size,lock)
({
__typeof__(*(ptr))__ret;
__typeof__(*(ptr))__old=(old);
__typeof__(*(ptr))__new=(new);
switch(size){
case__X86_CASE_B:
{
volatileu8*__ptr=(volatileu8*)(ptr);
asmvolatile(lock"cmpxchgb%2,%1"
:"=a"(__ret),"+m"(*__ptr)
:"q"(__new),"0"(__old)
:"memory");
break;
}
case__X86_CASE_W:
{
volatileu16*__ptr=(volatileu16*)(ptr);
asmvolatile(lock"cmpxchgw%2,%1"
:"=a"(__ret),"+m"(*__ptr)
:"r"(__new),"0"(__old)
:"memory");
break;
}
case__X86_CASE_L:
{
volatileu32*__ptr=(volatileu32*)(ptr);
asmvolatile(lock"cmpxchgl%2,%1"
:"=a"(__ret),"+m"(*__ptr)
:"r"(__new),"0"(__old)
:"memory");
break;
}
case__X86_CASE_Q:
{
volatileu64*__ptr=(volatileu64*)(ptr);
asmvolatile(lock"cmpxchgq%2,%1"
:"=a"(__ret),"+m"(*__ptr)
:"r"(__new),"0"(__old)
:"memory");
break;
}
default:
__cmpxchg_wrong_size();
}
__ret;
})

ARM架构

在ARM架构下,没有LOCK#指令,其具体实现如下:## ARMv6之前 早期的ARM架构是不支持SMP的,这些单核架构的CPU实现原子操作的方式就是通过关闭CPU中断来完成的。 在Linux对于ARM架构的代码下 有如下: 82115fe8-0e86-11ed-ba43-dac502259ad0.png   这个是好多操作共用的一套代码。 对于cmpxchg: 82213e7c-0e86-11ed-ba43-dac502259ad0.png   可以看到,对v->counter的操作是一个临界区,指令的执行不能被打断,内存的访问也需要保持没有干扰。 ARMv6以前的版本通过关本地中断来保护这块临界区,看起来相当简单,其奥秘就在于ARMv6以前的版本不支持SMP。 比如经典的read-modify-write问题,其本质是保持一个对内存read和write访问的原子性问题,也就是说内存的读和写的访问不能被打断。对该问题的解决可以通过硬件、软件或者软硬件结合的方法来进行。 早期的ARM CPU给出的方案就是依赖硬件:SWP这个汇编指令执行了一次读内存操作、一次写内存操作,但是从程序员的角度看,SWP这条指令就是原子的,读写之间不会被任何的异步事件打断。具体底层的硬件是如何做的呢?这时候,硬件会提供一个lock signal,在进行memory操作的时候设定lock信号,告诉总线这是一个不可被中断的内存访问,直到完成了SWP需要进行的两次内存访问之后再clear lock信号。 多说一点关于SWP和SWPB的内容 这两个指令是用来同步的,不是用来执行原子操作的。在将独占访问引入ARM架构之前,SWP和SWPB指令常用于同步。 其局限性是:如果中断在触发交换操作时触发,则处理器必须在执行中断之前完成指令的加载和存储部分,从而增加中断延迟。由于独立加载和独占存储是单独的指令,因此在使用新的同步基元时会降低此效果。 但是在多核系统中,交换指令期间阻止所有处理器访问主存会降低系统性能。在处理器工作在不同频率但是共享相同主存的多核系统中,情况尤其如此。 所以在ARMv6及以后的版本中,弃用了SWP,ARMv6架构引入了独占访问内存为止的概念,提供了更灵活的原子内存更新。 ARMv6体系结构以Load-Exclusive和Store-Exclusive同步原语LDREX和STREX的形式引入了Load Link和Store Conditional指令。从ARMv6T2开始,这些指令在ARM和Thumb指令集中可用。独立加载和专有存储提供了灵活和可扩展的同步,取代了弃用的SWP和SWPB指令。 后来使用的是LDREX和STREX指令,在armv7之后就用了ldrex和strex: 82331822-0e86-11ed-ba43-dac502259ad0.png   访存指令LDREX/STREX和普通的LDR/STR访存指令不一样,它是“独占”访存指令。这对指令访存过程由一个称作“exclusive monitor”的部件来监视是否可以进行独占访问。   独占访存指令: (1)LDREX R1 ,[R0] 指令是以独占的方式从R0所指的地址中取一个字存放到R0中; (2)STREX R2,R1,[R0] 指令是以独占的方式用R1来更新内存,如果独占访问条件允许,则更新成功并返回0到R2,否则失败返回1到R2。 最后,大家知道答案吗?

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18219

    浏览量

    221936
  • C语言
    +关注

    关注

    180

    文章

    7522

    浏览量

    127499
  • 指令集
    +关注

    关注

    0

    文章

    205

    浏览量

    23163

原文标题:对 int 变量赋值的操作是原子的吗?

文章出处:【微信号:技术让梦想更伟大,微信公众号:技术让梦想更伟大】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    X86和ARM中的指令集支持原子操作

    裸机开发与RTOS开发一个非常重要的区别在于多线程之间的消息传递和数据共享问题,然而在这中间变量的原子操作是一个非常重要的话题,不同的处理器架构和编译选项都可能生成不同的指令,从而影响到变量的
    发表于 07-06 16:10 1109次阅读
    X86和ARM中的<b class='flag-5'>指令集</b><b class='flag-5'>支持</b><b class='flag-5'>原子</b><b class='flag-5'>操作</b>

    常用ARM指令集及汇编

    常用ARM指令集及汇编ARM处理器是基于精简指令集计算机(RISC)原理设计的,指令集和相关译码机制较为简单,ARM7IDMI(-S)具有32位ARM指令集和16位Thumb
    发表于 11-23 09:38

    SCSI指令集

    SCSI指令集
    发表于 08-19 20:40

    ARM指令集

    ARM指令集,很好的资料。
    发表于 04-20 14:30

    分别什么情况下选择ARM指令集和THUMB指令集

    1、分别在什么情况下选择这两种指令集?2、如何选择这两种指令集,调用是使用BX,编译器就会默认按照指定的指令集进行编译连接吗?
    发表于 12-05 14:11

    Hexagon DSP的指令集

    Hexagon处理器指令集被划分成了特定的指令类。类的不同决定了指令可以被如何以并行方式结合。指令类与指令的类型相符合。例如ALU32类包含
    发表于 09-19 18:13

    请问有STM32 SDIO指令集

    最近在做SD卡,但不是用原子哥的SPI模式,用SDIO模式,但不知道SDIO指令集,数据手册上只有寥寥几个指令,网上查了许久没有结果。望哪位兄弟给一份指令集。qq 741060785谢
    发表于 02-19 21:25

    简单介绍ARM的指令集

    处理器架构是处理器厂商为同一个系列的处理器规定的一个规范。ARM架构是一种精简指令集(RISC)架构,具有以下RISC架构特点:较大的通用寄存器堆。load/store体系结构,其中数据处理操作仅对
    发表于 08-18 10:58

    ARM的指令集文章集合

    三、指令集如果你想要集中学习一下关于ARM指令集方面的知识(比如下面几个知识点),可以看下下面的文章1、机器码2、运算指令3、控制指令4、汇编指令
    发表于 09-07 22:06

    什么是指令集

    1、什么是指令集:设计CPU的人给出的编写规则就可以说是指令,这一系列的规则就是指令集(合)我们都知道之所以计算机能够进行计算,主要靠的是大规模集成电路中由晶体管组成的逻辑电路。这些逻辑电路使得
    发表于 11-10 09:14

    ARM指令集的特点有哪些呢

    1、ARM指令集ARM指令集格式ARM指令集(ARM920T的核(core)的指令集)的格式如下图所示,可以看出,无论哪一种指令,长度都是3
    发表于 12-14 07:24

    汇编ARM指令集分为哪几种

    ARM文件类型*.c,C语言*.s,汇编ARM指令集分为16位thumb指令集与32位ARM指令集;注释,end结束ARM每条指令4字节长度ARM
    发表于 12-14 08:58

    Thumb指令集是什么意思呢

    了一些变种。Thumb指令集(T变种)Thumb指令集是将ARM指令集的一个子集重新编码形成的指令集。ARM指令长度为32位,Thumb
    发表于 12-14 09:01

    所谓指令集是指什么

    目录正文0.1.2.3.4.5.6.7.8.[参考文献]正文0.所谓指令集,就是CPU中用来计算和控制计算机系统的一套指令的集合,而每一种新型的CPU在设计时就规定了一系列与其他硬件电路相配合
    发表于 12-16 06:26

    精简指令集架构RISC与复杂指令集架构CISC有何区别

    精简指令集架构RISC是什么?复杂指令集架构CISC又是什么?精简指令集架构RISC与复杂指令集架构CISC有何区别?
    发表于 12-23 10:02