0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM体系结构的基本特性介绍

GReq_mcu168 来源:智能软件研究中心 作者:罗宇哲 2021-09-26 10:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

01ARM汇编指令

操作系统中硬件相关的部分集中体现在汇编指令和对寄存器的操作中,因此我们对ARM体系结构的介绍也围绕ARMv8-A的汇编指令和寄存器来展开。

处理器架构是处理器厂商为同一个系列的处理器规定的一个规范。ARM架构是一种精简指令集(RISC)架构,具有以下RISC架构特点:

较大的通用寄存器堆。

load/store体系结构,其中数据处理操作仅对寄存器内容进行操作,而不是直接对内存内容。

简单寻址模式,所有load/store地址由寄存器内容和指令确定。该体系结构定义了处理单元与内存(包括缓存)的交互,并包括内存地址翻译系统。它还描述了多个处理单元如何相互作用。面积小、性能强和非常低的功耗是ARM体系结构的关键特性。本小节主要以ARMv8-A架构为例来介绍ARM体系结构的基本特性。ARMv8-A体系结构的一个重要特性是向后兼容,可以支持诸多标准和应用场景下的最优设计。ARMv8-A架构支持64bit的执行模式(AArch64)和32bit的执行模式(AArch32),这一模式兼容之前的ARM架构。两种执行状态都支持SIMD和浮点指令。

一、AMRv8架构概要

ARM体系结构自推出以来已经有了显著的发展,并且ARM还在继续开发它。到目前为止,已经有八个主要版本,由版本号1到8表示。其中前三个版本现在已经过时了。

通用名称AArch64和AArch32描述了64位和32位执行状态。AArch64是64位执行状态,意味着地址保存在64位寄存器中,并且基本指令集可以使用64位寄存器进行处理。AArch64支持A64指令集。AArch32是32位执行状态,这意味着地址保存在32位寄存器中,并且基本指令集使用32位寄存器进行处理。AArch32支持T32和A32指令集。

ARM支持三种架构配置:

A系列,面向应用场景的架构(Application Profile)。该系列支持基于内存管理单元(MMU)的虚拟内存系统体系结构(VMSA)。它支持A64、A32和T32指令集。

R系列,面向实时场景的架构配置。该系列支持基于内存保护单元(MPU)的受保护内存系统体系结构(PMSA)。它支持A32和T32指令集。

M系列,面向微处理器的架构。该系列实现了一个为低延迟中断处理而设计的程序员模型(programmers’ model),该模型具有寄存器硬件堆栈和对中断处理程序的高级语言支持。它支持T32指令集的变种。

(注:内存保护单元(MPU)是ARM中配备的有效保护系统资源的一种硬件,提供了内存区域保护功能。)

二、ARMv8-A指令集

在ARMv8-A中,可能的指令集取决于执行状态:

AArch64:AArch64 state只支持A64指令集。这是一个固定长度的指令集,使用32位指令编码。

Arch32:AArch32 state支持以下指令集:

A32:这是一个固定长度的指令集,使用32位指令编码。它是与ARMv7 ARM指令集兼容。

T32:这是一个可变长度指令集,它同时使用16位和32位指令编码。它与ARMv7 Thumb指令集兼容。

ARM指令的基本格式如下[2]:

《Opcode》{《Cond》}《S》《Rd》,《Rn》 {,《Opcode2》}

其中各个部分的含义为:

Opcode:操作码,也就是助记符,说明指令需要执行的操作类型;

Cond:指令执行条件码;

S:条件码设置项,决定本次指令执行是否影响PSTATE寄存器相应状态位值;

Rd/Xt:目标寄存器,A32指令可以选择R0-R14,T32指令大部分只能选择RO-R7,A64指令可以选择X0-X30;

Rn/Xn:第一个操作数的寄存器,和Rd一样,不同指令有不同要求;

Opcode2:第二个操作数,可以是立即数,寄存器Rm和寄存器移位方式(Rm,#shit);

下面以A64指令集为例简要介绍ARMv8-A的指令体系。A64指令集中的指令主要分为控制指令、访存指令和计算指令。控制指令主要包括有条件分支指令、无条件分支指令、异常产生和返回指令、系统寄存器指令、系统指令、提示指令、同步指令和清除独占访问标志指令。访存指令主要有Load指令和Store指令,这两种指令有许多变种。计算指令包含算数指令、逻辑指令、MOVE指令、移位指令、位扩展指令和SIMD指令等等。以下列出了一些常用的控制指令的名称与用途。

1. 控制指令:

使用寄存器的无条件分支指令:

异常产生指令:

06c53238-1319-11ec-8fb8-12bb97331649.png

异常返回指令:

06e0bc56-1319-11ec-8fb8-12bb97331649.png

系统寄存器指令:

06ebe702-1319-11ec-8fb8-12bb97331649.png

同步指令和独占状态清除指令:

06f6381a-1319-11ec-8fb8-12bb97331649.png

2. 访存指令:

ARMv8访存指令支持以下寻址模式:

基址加上无符号立即数的寻址和基址加上有符号立即数的寻址;

基址加上寄存器偏移值;

基址加上扩展的寄存器偏移;

pre-index模式;

post-index模式;

PC相对寻址模式。

具体情形见下表:

070d5bd0-1319-11ec-8fb8-12bb97331649.png

其中对于A64指令集来说,64bit的基址来自通用寄存器X0-X30或来自栈指针SP,立即数或寄存器偏移值则是可选的,对寻址方式的解释如下:

寄存器偏移寻址是指来自64bit基址寄存器的地址加上一个偏移值;

Pre-indexed模式是指寻址地址是64bit基址加上一个偏移值,这个计算和将会写入基址寄存器;

Post-indexed模式是指寻址地址是64bit的基址,但之后基址和偏移值的和将会写入基址寄存器;由此可见pre-indexed和post-indexed的区别在于使用的地址是先加上偏移值再使用还是先使用再加上偏移值;

PC相对寻址是指寻址地址是这条指令64bit的PC值加上一个19bit的有符号字偏移,这个地址在当前指令的PC值的 ±1MB范围内并且是4byte对齐的。使用PC相对寻址所load的数据大小至少为32bit并且只能用来预取指令,且PC值不能被其他寻址方式使用。

一个立即数偏移可以为有符号的,也可以为无符号的,可以为scaled也可以为unscaled。当一个立即数偏移是scaled的时候,它被编码为传输数据大小的整数倍。虽然汇编程序总是使用byte对齐的偏移,但汇编器或反汇编器会做必要的转换工作,因此可用的byte偏移值取决于load/store指令类型和数据传输的大小。

上表中指令的寻址方式有:

基址加上12bit无符号scaled立即数偏移寻址;

基址加上9bit有符号unscaled立即数偏移寻址;

基址加上64bit寄存器偏移,可选为scaled;

基址加上32bit可拓展寄存器偏移,可选为scaled;

有unscaled9bit有符号立即数偏移的pre-indexed模式;

有unscaled9bit有符号立即数偏移的post-indexed模式;

Load至少32bit数据的PC相对寻址模式。

如果被load或store的指令的寻址模式会修改基址寄存器的内容,且被load/store寄存器恰好的是基址所在的寄存器,那么硬件的行为可能不确定。

3.计算指令:

在操作系统汇编语言中使用的计算指令主要是一些简单的算数计算指令,用于对寄存器的move操作和对地址的计算操作,一般计算指令既可以使用立即数作为操作数,也可以使用寄存器中的数作为操作数。下面简单列举了一些算数指令:

使用立即数的简单算数指令:

0752d926-1319-11ec-8fb8-12bb97331649.png

使用寄存器的逻辑操作指令:

077fe272-1319-11ec-8fb8-12bb97331649.jpg

其中:

07ac465a-1319-11ec-8fb8-12bb97331649.png

寄存器移位指令:

07b7cd54-1319-11ec-8fb8-12bb97331649.png

例如:

07c33ad6-1319-11ec-8fb8-12bb97331649.png

02

ARM架构寄存器

在处理器中,寄存器用于保存需要被快速访问的数据,在操作系统中需要特别注意的寄存器主要有栈指针寄存器(SP)、连接寄存器(LR)、程序计数器(PC)以及当前程序状态寄存器(CPSR)和保存程序状态寄存器(SPSR)。本小节主要以ARMv8-A为例介绍ARM架构的寄存器的基本情况。详情可参见文献[3],D1.6小节。

在这一小节中,我们主要介绍ARMv8架构中AArch64执行状态下的寄存器使用情况。ARM架构中的寄存器主要有两类,一类用于提供系统控制与状态报告;另一类用于指令运行和异常处理。我们主要讨论第二类。

通用寄存器主要用于基本指令集中的指令运行,通用寄存器共有31个,编号为R0-R31。这些通用寄存器可以被当成31个64bit的寄存器,编号为X0-X30;或者被作为31个32bit的寄存器,编号为W0-W30。

在AArch64执行状态下,除了通用寄存器外,每一个异常级别都会有一个栈指针寄存器(StackPointer Register, SP),栈指针寄存器为SPEL0和SPEL1。异常级别用于区分指令的执行权限,我们将在本章的第四期介绍。如果处理器实现中包含EL2,那么还有SPEL2。如果处理器实现中包含EL3,那么还有SPEL3。详情可参考链接[5]。

SIMD和浮点寄存器共用一系列寄存器,这些寄存器会用于浮点操作、向量操作和其它SIMD有关的标量操作。SIMD指令是能够复制多个操作数、并把它们打包在大型寄存器的一组指令集[3]。以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和运算。而在SIMD型的CPU中,指令译码后几个执行部件同时访问内存,一次性获得所有操作数进行运算。浮点寄存器和SIMD寄存器共包含32个128bit位宽的寄存器,V0-V31。这些寄存器可以作为:

32个双字(64bit)寄存器,D0-D31。

32个单字(32bit)寄存器,S0-S31。

32个半字(16bit)寄存器,H0-H31。

32个单字(8bit)寄存器,B0-B31。

程序状态寄存器(Current Program Status Register,CPSR) 在用户级编程时用于存储条件码。CPSR包含条件码标志,中断禁止位,当前处理器模式以及其他状态和控制信息。

保存程序状态寄存器(SPSR,Saved Program StatusRegister)用于保存CPSR的状态,以便异常返回后恢复异常发生时的工作状态。在A64中,不再使用单一的CPSR寄存器,来保存当前处理器状态,而是用PSTATE来保存处理器状态,而在A32中依然使用CPSR。有关PSTATE和CPSR的详细信息可参考链接[4]。A64中SPSR 格式的示意图如下图所示:

其中N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变,并且可以用于决定某条指令是否被执行,其含义如下表所示[8]:

标志位含义

N当两个有符号整数运算时:N=1表示运算的结果为负数;N=0表示运算的结果为正数或零。

ZZ=1表示运算的结果为零,Z=0表示运算的结果非零。

C可以有4种方法设置C的值:

在加法指令中(包括比较指令CMP),当结果产生了进位,则C=1,表示无符号运算发生上溢出;其他情况C=0。

在减法指令中(包括减法指令CMP),当运算中发生借位,则C=0,表示无符号运算数发生下溢出;其他情况下C=1。

对于包含移位操作的非加减运算指令,C中包含最后一次溢出的位的数值。

对于其他非加减运算指令,C位的值通常不受影响。

V对于加减运算指令,当操作数和运算结果为二进制的补码表示的带符号数时,V=1表示符号为溢出,通常其他指令不影响V位。

有关SPSR中各个位的详细信息可以参考文献[1] 1.6.4小节。

连接寄存器LR(R14)的主要作用有两个:

1. 保存子程序返回地址,用MOVE指令或BX指令可以用于实现返回,如MOV PC、LR或BXLR。若子程序中还需要调用子程序,则可以写为:

07ecaa88-1319-11ec-8fb8-12bb97331649.png

第一条指令将LR中的内容入栈,最后一条将栈中保存的LR寄存器的内容存入PC中用于返回。

2. 当异常发生时,异常模式的LR用于保存异常返回地址,将LR内容入栈可以处理嵌套中断。

PC是程序计数器,其中保存的是正在被加载的指令,而不是正在被执行的指令。例如,若指令长度为4byte,则PC指向当前正在被执行的指令的地址+8byte的地址。关于LR和PC的详细内容可参考文献[6]和[7]。

ARM架构中处理器有不同的运行模式,因此同一个功能的寄存器在不同的运行模式下可能对应不同的物理寄存器,这些寄存器被称为备份寄存器。如SPSR_svc表示svc模式下使用的SPSR寄存器。ARM架构中常用的运行模式如下表所示[9]:

处理器模式描述

用户模式(User, usr)正常程序执行的模式

快速中断模式(FIQ, fiq)用于高速数据传输和通道处理

外部中断模式(IRQ, irq)用于通常的中断处理

特权模式(Supervisor, svc)供操作系统使用的一种保护模式

数据访问中止模式(Abort, abt)当数据或指令预取中止时进入该模式,用于虚拟存储及存储保护

未定义指令中止模式(Undefined, und)当执行未定义指令时进入该模式,用于支持通过软件仿真硬件的协处理器

系统模式(System, sys)用于运行特权级的操作系统任务

ARMv8-A架构还有Monitor(mon)工作模式,用于处理器安全状态与非安全状态的切换,Hypervisor(hyp)模式则用于对虚拟化有关功能的支持。有关安全状态的详细内容在后续的文章中会介绍。

03

ARM架构中的执行状态

ARMv8-A有两种执行模式,一种是AArch64执行模式,另一种是AArch32执行模式。执行状态定义处理单元(Processing Element, PE)的执行环境,包括以下内容:

支持的寄存器宽度

支持的指令集

异常模型

虚拟存储系统(Virtual Memory System Architecture, VMSA)架构

程序员模型

AArch64为64位执行状态。对应上述内容,此执行状态:

提供31个64位通用寄存器,其中X30用作过程链接寄存器(ProcedureLink Register)。

提供64位程序计数器(PC)、堆栈指针(SP)和异常链接寄存器(ELRs)。

提供32个128位寄存器以支持SIMD矢量和标量浮点运算。

提供单一指令集A64。

定义ARMv8异常模型,该模型最多有四个异常级别EL0-EL3,它们提供执行权限层次结构。

支持64位虚拟寻址。

定义一系列与PSTATE相关的寄存器。A64指令集包括能直接操作各种PSTATE寄存器的指令。

使用后缀命名每个系统寄存器,该后缀指示可以访问寄存器的最低异常级别。

AArch32为32位执行状态。对应上述内容,此执行状态:

提供13个32位通用寄存器和一个32位PC、一个32位SP寄存器和一个32位链接寄存器(Link Register,LR)。链接寄存器用作异常链接寄存器和过程链接寄存器。其中一些寄存器有多个备份寄存器,用于不同的处理器工作模式。我们在上一期提到过,同一个功能的寄存器在不同的处理器运行模式下可能对应不同的物理寄存器,这些寄存器被称为备份寄存器。

为从Hyp(hypervisor)模式返回的异常提供一个异常链接寄存器。

提供32个64位寄存器,用于对高级SIMD矢量和标量浮点计算的支持。

提供两个指令集,A32和T32。

支持基于处理器工作模式的ARMv7-A异常模型,并将其映射到基于异常级别的ARMv8异常模型。

使用32位虚拟地址。

使用单个当前程序状态寄存器(CPSR)保存处理器状态。

在AArch64和AArch32执行状态之间进行转换称为内部处理(interprocessing)。

04ARMv8-A架构的异常级别和安全状态

ARMv8-A有四个异常级别,从EL0到EL3。对于异常级别ELn,整数n增加表示软件执行的特权权限变大了。EL0级别下的执行叫非特权执行(unprivileged execution)。EL1主要用于运行操作系统内核。EL2可以支持非安全操作的虚拟化。EL3则支持安全状态和非安全状态之间的转换。安全状态与ARM TrustZone技术有关[2]。安全状态可以运行可信执行环境(TEE, Trusted Execution Environment)及安全应用,用于保障隐私数据和程序运行环境的安全性。

ARMv8-A架构并未直接指定哪些软件应该运行在哪些异常级别,但是在通常情况下,有如异常级别的使用模型:

1.应用程序运行在EL0;

2.操作系统内核和相关功能运行在EL1;

3.Hypervisor[3]运行在EL2;

从图中我们可以看出,Hypervisor相关的支持特性主要是在EL2的非安全状态实现的。Hypervisor可以支持虚拟机之间的切换,而虚拟机主要被包含在EL1的非安全状态和EL0的非安全状态中。一些Guest OS可以运行在EL1状态里,每一个Guest OS可以运行在一个虚拟机上。而应用则运行在EL0的非安全状态中,同时也运行在Guest OS上。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    246942
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388555
  • 操作系统
    +关注

    关注

    37

    文章

    7328

    浏览量

    128605

原文标题:最全ARM体系结构知识:汇编、架构、异常级别和安全状态

文章出处:【微信号:mcu168,微信公众号:硬件攻城狮】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    控制结构介绍

    1. 顺序结构:按照代码的书写顺序,逐行执行程序。这是最基本的程序结构。 2. 选择结构:根据条件判断的结果,选择执行不同的代码块。常见的选择结构有if语句和switch语句。 3
    发表于 11-24 06:43

    恩智浦i.MX RT1180 MCU如何进入Boundary Scan模式

    本文重点介绍RT1180如何进入Boundary Scan模式,通过Jtag来进行板级硬件测试的过程。遵循IEEE1149.1中的测试访问端口和BoundaryScan体系结构的标准。
    的头像 发表于 10-22 09:50 2885次阅读
    恩智浦i.MX RT1180 MCU如何进入Boundary Scan模式

    PY32F030系列32位ARM Cortex-M0+微控制器介绍

    在嵌入式开发领域,一款性能适配、成本可控且功耗优异的 MCU,往往是项目成功的关键。今天要为大家隆重介绍的PY32F030 系列 32 位 ARM Cortex-M0 + 微控制器,正是这样一款能
    的头像 发表于 10-15 16:43 635次阅读

    村田电容的分类体系与技术特性

    村田制作所凭借其多元化的电容产品线覆盖了从消费电子到航空航天的高端市场。其电容产品以材料特性、工艺结构和应用场景为核心维度,形成了涵盖陶瓷、电解、薄膜、超级电容等几个类别的完整体系,并通过
    的头像 发表于 08-01 15:12 553次阅读

    ARM入门学习方法分享

    ,了解相关的硬件知识也是很重要的。学习关于计算机体系结构和电子电路的基础知识可以帮助你更好地理解ARM的工作原理。 六、参考文档和教程:ARM的官方文档和教程是学习ARM的重要资源。
    发表于 07-23 10:21

    Arm产品命名体系的演变

    Arm 首席执行官 Rene Haas 宣布 Arm 推出新的产品命名体系后,本文将为你详解新的计算平台名称,以及新命名体系内的新 IP 名称标识。
    的头像 发表于 06-19 10:38 776次阅读
    <b class='flag-5'>Arm</b>产品命名<b class='flag-5'>体系</b>的演变

    安森美SiC Combo JFET的静态特性和动态特性

    和 JFET 的高效结构,可实现更低的导通电阻和更佳的热性能,非常适合需要多个器件并联以高效管理大电流负载的应用场景。第一部分介绍了SiC Combo JFET 技术概览、产品介绍等(点击文字可看)。本文将继续讲解静态
    的头像 发表于 06-16 16:40 1129次阅读
    安森美SiC Combo JFET的静态<b class='flag-5'>特性</b>和动态<b class='flag-5'>特性</b>

    DPU核心技术论文再次登陆体系结构领域旗舰期刊《IEEE Transactions on Computers》

    近期,鄢贵海团队研究成果在计算机体系结构领域国际顶级期刊《IEEE Transactions on Computers》中发表。该研究主要围绕KPU敏捷计算架构展开,KPU具有超强异构核集成和调度
    的头像 发表于 06-11 18:11 500次阅读
    DPU核心技术论文再次登陆<b class='flag-5'>体系结构</b>领域旗舰期刊《IEEE Transactions on Computers》

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP 核,凭借其异构计算架构、能效优化和生态协同,成为全球移动
    的头像 发表于 05-29 10:12 2967次阅读

    睿创微纳AI芯片技术登上国际计算机体系结构领域顶级会议

    近日,国际计算机体系结构领域顶级会议HPCA 2025(International Symposium on High-Performance Computer Architecture)在美国召开。会议共收到534篇来自全球顶尖科研机构及高校的论文投稿,最终录用率仅为21%。
    的头像 发表于 05-19 15:57 749次阅读

    风华贴片电感的标准分类体系

    作为国内电子元器件领域的领军企业,风华高科通过构建多维度分类体系,实现了贴片电感产品的精准定位与高效应用。其分类逻辑融合了结构特征、功能特性及场景适配性,形成了涵盖产品形态、技术参数、应用领域
    的头像 发表于 05-19 14:04 475次阅读
    风华贴片电感的标准分类<b class='flag-5'>体系</b>

    开关电源拓扑结构介绍

    PUSH-PULL 推挽电路HALF BRIDGE 半桥电路FULL BRIDGE 全桥电路SEPIC 电路 二、拓扑结构介绍(一)BUCK 降压电路 在不考虑带有寄生参数的RLGC模型的情况下,一般我们的计算步骤
    发表于 05-12 16:04

    Arm主板与x86主板的区别

    在当今数字化迅猛发展的时代,计算机硬件的架构选择对于系统的性能、能效以及适用性具有至关重要的影响。Arm架构与x86架构是目前主流的两种计算机体系结构,各自在个人计算机、服务器、嵌入式系统及移动设备
    的头像 发表于 01-07 12:21 1409次阅读
    <b class='flag-5'>Arm</b>主板与x86主板的区别

    顺络压敏电阻的种类、结构特性与作用

    顺络压敏电阻作为一种重要的电子元件,在电路保护中发挥着至关重要的作用。本文将详细介绍顺络压敏电阻的种类、结构特性及其在各种应用场合中的作用。 一、顺络压敏电阻的种类 顺络压敏电阻按照不同的分类标准
    的头像 发表于 01-03 14:37 747次阅读
    顺络压敏电阻的种类、<b class='flag-5'>结构</b><b class='flag-5'>特性</b>与作用

    《RISC-V 体系结构编程与实践(第2版)》指令集

    本书的指令集基于rv64i mafdcsiu 属于精简指令集。 阅读本章可以指令集不多,都是最基础的功能点。 分为6个部分 加载保存指令 跳转指令 寄存器运算指令 跳转指令 csr控制指令。 其中指令码使用32位字节标识。 如下所示 其中pc的寻址部分单独有一节讲解,可以仔细读读。 对于程序运行来讲,pc计数器控制着程序的流程,是一个芯片活动的最重要的标记。 它的寻址能力标志着程序的设计和跳转等性能问题。 主要有两条指令: auipc指令 lui指令。 其中auipc指令由于操作数会机型左移12位的操作,所以寻址能力按照4k的宽度蹦。 对于4k内的地址使用lui指令定位。
    发表于 12-07 18:36