0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ARM体系结构的基本特性介绍

GReq_mcu168 来源:智能软件研究中心 作者:罗宇哲 2021-09-26 10:04 次阅读

01ARM汇编指令

操作系统中硬件相关的部分集中体现在汇编指令和对寄存器的操作中,因此我们对ARM体系结构的介绍也围绕ARMv8-A的汇编指令和寄存器来展开。

处理器架构是处理器厂商为同一个系列的处理器规定的一个规范。ARM架构是一种精简指令集(RISC)架构,具有以下RISC架构特点:

较大的通用寄存器堆。

load/store体系结构,其中数据处理操作仅对寄存器内容进行操作,而不是直接对内存内容。

简单寻址模式,所有load/store地址由寄存器内容和指令确定。该体系结构定义了处理单元与内存(包括缓存)的交互,并包括内存地址翻译系统。它还描述了多个处理单元如何相互作用。面积小、性能强和非常低的功耗是ARM体系结构的关键特性。本小节主要以ARMv8-A架构为例来介绍ARM体系结构的基本特性。ARMv8-A体系结构的一个重要特性是向后兼容,可以支持诸多标准和应用场景下的最优设计。ARMv8-A架构支持64bit的执行模式(AArch64)和32bit的执行模式(AArch32),这一模式兼容之前的ARM架构。两种执行状态都支持SIMD和浮点指令。

一、AMRv8架构概要

ARM体系结构自推出以来已经有了显著的发展,并且ARM还在继续开发它。到目前为止,已经有八个主要版本,由版本号1到8表示。其中前三个版本现在已经过时了。

通用名称AArch64和AArch32描述了64位和32位执行状态。AArch64是64位执行状态,意味着地址保存在64位寄存器中,并且基本指令集可以使用64位寄存器进行处理。AArch64支持A64指令集。AArch32是32位执行状态,这意味着地址保存在32位寄存器中,并且基本指令集使用32位寄存器进行处理。AArch32支持T32和A32指令集。

ARM支持三种架构配置:

A系列,面向应用场景的架构(Application Profile)。该系列支持基于内存管理单元(MMU)的虚拟内存系统体系结构(VMSA)。它支持A64、A32和T32指令集。

R系列,面向实时场景的架构配置。该系列支持基于内存保护单元(MPU)的受保护内存系统体系结构(PMSA)。它支持A32和T32指令集。

M系列,面向微处理器的架构。该系列实现了一个为低延迟中断处理而设计的程序员模型(programmers’ model),该模型具有寄存器硬件堆栈和对中断处理程序的高级语言支持。它支持T32指令集的变种。

(注:内存保护单元(MPU)是ARM中配备的有效保护系统资源的一种硬件,提供了内存区域保护功能。)

二、ARMv8-A指令集

在ARMv8-A中,可能的指令集取决于执行状态:

AArch64:AArch64 state只支持A64指令集。这是一个固定长度的指令集,使用32位指令编码。

Arch32:AArch32 state支持以下指令集:

A32:这是一个固定长度的指令集,使用32位指令编码。它是与ARMv7 ARM指令集兼容。

T32:这是一个可变长度指令集,它同时使用16位和32位指令编码。它与ARMv7 Thumb指令集兼容。

ARM指令的基本格式如下[2]:

《Opcode》{《Cond》}《S》《Rd》,《Rn》 {,《Opcode2》}

其中各个部分的含义为:

Opcode:操作码,也就是助记符,说明指令需要执行的操作类型;

Cond:指令执行条件码;

S:条件码设置项,决定本次指令执行是否影响PSTATE寄存器相应状态位值;

Rd/Xt:目标寄存器,A32指令可以选择R0-R14,T32指令大部分只能选择RO-R7,A64指令可以选择X0-X30;

Rn/Xn:第一个操作数的寄存器,和Rd一样,不同指令有不同要求;

Opcode2:第二个操作数,可以是立即数,寄存器Rm和寄存器移位方式(Rm,#shit);

下面以A64指令集为例简要介绍ARMv8-A的指令体系。A64指令集中的指令主要分为控制指令、访存指令和计算指令。控制指令主要包括有条件分支指令、无条件分支指令、异常产生和返回指令、系统寄存器指令、系统指令、提示指令、同步指令和清除独占访问标志指令。访存指令主要有Load指令和Store指令,这两种指令有许多变种。计算指令包含算数指令、逻辑指令、MOVE指令、移位指令、位扩展指令和SIMD指令等等。以下列出了一些常用的控制指令的名称与用途。

1. 控制指令:

使用寄存器的无条件分支指令:

异常产生指令:

06c53238-1319-11ec-8fb8-12bb97331649.png

异常返回指令:

06e0bc56-1319-11ec-8fb8-12bb97331649.png

系统寄存器指令:

06ebe702-1319-11ec-8fb8-12bb97331649.png

同步指令和独占状态清除指令:

06f6381a-1319-11ec-8fb8-12bb97331649.png

2. 访存指令:

ARMv8访存指令支持以下寻址模式:

基址加上无符号立即数的寻址和基址加上有符号立即数的寻址;

基址加上寄存器偏移值;

基址加上扩展的寄存器偏移;

pre-index模式;

post-index模式;

PC相对寻址模式。

具体情形见下表:

070d5bd0-1319-11ec-8fb8-12bb97331649.png

其中对于A64指令集来说,64bit的基址来自通用寄存器X0-X30或来自栈指针SP,立即数或寄存器偏移值则是可选的,对寻址方式的解释如下:

寄存器偏移寻址是指来自64bit基址寄存器的地址加上一个偏移值;

Pre-indexed模式是指寻址地址是64bit基址加上一个偏移值,这个计算和将会写入基址寄存器;

Post-indexed模式是指寻址地址是64bit的基址,但之后基址和偏移值的和将会写入基址寄存器;由此可见pre-indexed和post-indexed的区别在于使用的地址是先加上偏移值再使用还是先使用再加上偏移值;

PC相对寻址是指寻址地址是这条指令64bit的PC值加上一个19bit的有符号字偏移,这个地址在当前指令的PC值的 ±1MB范围内并且是4byte对齐的。使用PC相对寻址所load的数据大小至少为32bit并且只能用来预取指令,且PC值不能被其他寻址方式使用。

一个立即数偏移可以为有符号的,也可以为无符号的,可以为scaled也可以为unscaled。当一个立即数偏移是scaled的时候,它被编码为传输数据大小的整数倍。虽然汇编程序总是使用byte对齐的偏移,但汇编器或反汇编器会做必要的转换工作,因此可用的byte偏移值取决于load/store指令类型和数据传输的大小。

上表中指令的寻址方式有:

基址加上12bit无符号scaled立即数偏移寻址;

基址加上9bit有符号unscaled立即数偏移寻址;

基址加上64bit寄存器偏移,可选为scaled;

基址加上32bit可拓展寄存器偏移,可选为scaled;

有unscaled9bit有符号立即数偏移的pre-indexed模式;

有unscaled9bit有符号立即数偏移的post-indexed模式;

Load至少32bit数据的PC相对寻址模式。

如果被load或store的指令的寻址模式会修改基址寄存器的内容,且被load/store寄存器恰好的是基址所在的寄存器,那么硬件的行为可能不确定。

3.计算指令:

在操作系统汇编语言中使用的计算指令主要是一些简单的算数计算指令,用于对寄存器的move操作和对地址的计算操作,一般计算指令既可以使用立即数作为操作数,也可以使用寄存器中的数作为操作数。下面简单列举了一些算数指令:

使用立即数的简单算数指令:

0752d926-1319-11ec-8fb8-12bb97331649.png

使用寄存器的逻辑操作指令:

077fe272-1319-11ec-8fb8-12bb97331649.jpg

其中:

07ac465a-1319-11ec-8fb8-12bb97331649.png

寄存器移位指令:

07b7cd54-1319-11ec-8fb8-12bb97331649.png

例如:

07c33ad6-1319-11ec-8fb8-12bb97331649.png

02

ARM架构寄存器

在处理器中,寄存器用于保存需要被快速访问的数据,在操作系统中需要特别注意的寄存器主要有栈指针寄存器(SP)、连接寄存器(LR)、程序计数器(PC)以及当前程序状态寄存器(CPSR)和保存程序状态寄存器(SPSR)。本小节主要以ARMv8-A为例介绍ARM架构的寄存器的基本情况。详情可参见文献[3],D1.6小节。

在这一小节中,我们主要介绍ARMv8架构中AArch64执行状态下的寄存器使用情况。ARM架构中的寄存器主要有两类,一类用于提供系统控制与状态报告;另一类用于指令运行和异常处理。我们主要讨论第二类。

通用寄存器主要用于基本指令集中的指令运行,通用寄存器共有31个,编号为R0-R31。这些通用寄存器可以被当成31个64bit的寄存器,编号为X0-X30;或者被作为31个32bit的寄存器,编号为W0-W30。

在AArch64执行状态下,除了通用寄存器外,每一个异常级别都会有一个栈指针寄存器(StackPointer Register, SP),栈指针寄存器为SPEL0和SPEL1。异常级别用于区分指令的执行权限,我们将在本章的第四期介绍。如果处理器实现中包含EL2,那么还有SPEL2。如果处理器实现中包含EL3,那么还有SPEL3。详情可参考链接[5]。

SIMD和浮点寄存器共用一系列寄存器,这些寄存器会用于浮点操作、向量操作和其它SIMD有关的标量操作。SIMD指令是能够复制多个操作数、并把它们打包在大型寄存器的一组指令集[3]。以加法指令为例,单指令单数据(SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和运算。而在SIMD型的CPU中,指令译码后几个执行部件同时访问内存,一次性获得所有操作数进行运算。浮点寄存器和SIMD寄存器共包含32个128bit位宽的寄存器,V0-V31。这些寄存器可以作为:

32个双字(64bit)寄存器,D0-D31。

32个单字(32bit)寄存器,S0-S31。

32个半字(16bit)寄存器,H0-H31。

32个单字(8bit)寄存器,B0-B31。

程序状态寄存器(Current Program Status Register,CPSR) 在用户级编程时用于存储条件码。CPSR包含条件码标志,中断禁止位,当前处理器模式以及其他状态和控制信息

保存程序状态寄存器(SPSR,Saved Program StatusRegister)用于保存CPSR的状态,以便异常返回后恢复异常发生时的工作状态。在A64中,不再使用单一的CPSR寄存器,来保存当前处理器状态,而是用PSTATE来保存处理器状态,而在A32中依然使用CPSR。有关PSTATE和CPSR的详细信息可参考链接[4]。A64中SPSR 格式的示意图如下图所示:

其中N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变,并且可以用于决定某条指令是否被执行,其含义如下表所示[8]:

标志位含义

N当两个有符号整数运算时:N=1表示运算的结果为负数;N=0表示运算的结果为正数或零。

ZZ=1表示运算的结果为零,Z=0表示运算的结果非零。

C可以有4种方法设置C的值:

在加法指令中(包括比较指令CMP),当结果产生了进位,则C=1,表示无符号运算发生上溢出;其他情况C=0。

在减法指令中(包括减法指令CMP),当运算中发生借位,则C=0,表示无符号运算数发生下溢出;其他情况下C=1。

对于包含移位操作的非加减运算指令,C中包含最后一次溢出的位的数值。

对于其他非加减运算指令,C位的值通常不受影响。

V对于加减运算指令,当操作数和运算结果为二进制的补码表示的带符号数时,V=1表示符号为溢出,通常其他指令不影响V位。

有关SPSR中各个位的详细信息可以参考文献[1] 1.6.4小节。

连接寄存器LR(R14)的主要作用有两个:

1. 保存子程序返回地址,用MOVE指令或BX指令可以用于实现返回,如MOV PC、LR或BXLR。若子程序中还需要调用子程序,则可以写为:

07ecaa88-1319-11ec-8fb8-12bb97331649.png

第一条指令将LR中的内容入栈,最后一条将栈中保存的LR寄存器的内容存入PC中用于返回。

2. 当异常发生时,异常模式的LR用于保存异常返回地址,将LR内容入栈可以处理嵌套中断。

PC是程序计数器,其中保存的是正在被加载的指令,而不是正在被执行的指令。例如,若指令长度为4byte,则PC指向当前正在被执行的指令的地址+8byte的地址。关于LR和PC的详细内容可参考文献[6]和[7]。

ARM架构中处理器有不同的运行模式,因此同一个功能的寄存器在不同的运行模式下可能对应不同的物理寄存器,这些寄存器被称为备份寄存器。如SPSR_svc表示svc模式下使用的SPSR寄存器。ARM架构中常用的运行模式如下表所示[9]:

处理器模式描述

用户模式(User, usr)正常程序执行的模式

快速中断模式(FIQ, fiq)用于高速数据传输和通道处理

外部中断模式(IRQ, irq)用于通常的中断处理

特权模式(Supervisor, svc)供操作系统使用的一种保护模式

数据访问中止模式(Abort, abt)当数据或指令预取中止时进入该模式,用于虚拟存储及存储保护

未定义指令中止模式(Undefined, und)当执行未定义指令时进入该模式,用于支持通过软件仿真硬件的协处理器

系统模式(System, sys)用于运行特权级的操作系统任务

ARMv8-A架构还有Monitor(mon)工作模式,用于处理器安全状态与非安全状态的切换,Hypervisor(hyp)模式则用于对虚拟化有关功能的支持。有关安全状态的详细内容在后续的文章中会介绍。

03

ARM架构中的执行状态

ARMv8-A有两种执行模式,一种是AArch64执行模式,另一种是AArch32执行模式。执行状态定义处理单元(Processing Element, PE)的执行环境,包括以下内容:

支持的寄存器宽度

支持的指令集

异常模型

虚拟存储系统(Virtual Memory System Architecture, VMSA)架构

程序员模型

AArch64为64位执行状态。对应上述内容,此执行状态:

提供31个64位通用寄存器,其中X30用作过程链接寄存器(ProcedureLink Register)。

提供64位程序计数器(PC)、堆栈指针(SP)和异常链接寄存器(ELRs)。

提供32个128位寄存器以支持SIMD矢量和标量浮点运算。

提供单一指令集A64。

定义ARMv8异常模型,该模型最多有四个异常级别EL0-EL3,它们提供执行权限层次结构。

支持64位虚拟寻址。

定义一系列与PSTATE相关的寄存器。A64指令集包括能直接操作各种PSTATE寄存器的指令。

使用后缀命名每个系统寄存器,该后缀指示可以访问寄存器的最低异常级别。

AArch32为32位执行状态。对应上述内容,此执行状态:

提供13个32位通用寄存器和一个32位PC、一个32位SP寄存器和一个32位链接寄存器(Link Register,LR)。链接寄存器用作异常链接寄存器和过程链接寄存器。其中一些寄存器有多个备份寄存器,用于不同的处理器工作模式。我们在上一期提到过,同一个功能的寄存器在不同的处理器运行模式下可能对应不同的物理寄存器,这些寄存器被称为备份寄存器。

为从Hyp(hypervisor)模式返回的异常提供一个异常链接寄存器。

提供32个64位寄存器,用于对高级SIMD矢量和标量浮点计算的支持。

提供两个指令集,A32和T32。

支持基于处理器工作模式的ARMv7-A异常模型,并将其映射到基于异常级别的ARMv8异常模型。

使用32位虚拟地址。

使用单个当前程序状态寄存器(CPSR)保存处理器状态。

在AArch64和AArch32执行状态之间进行转换称为内部处理(interprocessing)。

04ARMv8-A架构的异常级别和安全状态

ARMv8-A有四个异常级别,从EL0到EL3。对于异常级别ELn,整数n增加表示软件执行的特权权限变大了。EL0级别下的执行叫非特权执行(unprivileged execution)。EL1主要用于运行操作系统内核。EL2可以支持非安全操作的虚拟化。EL3则支持安全状态和非安全状态之间的转换。安全状态与ARM TrustZone技术有关[2]。安全状态可以运行可信执行环境(TEE, Trusted Execution Environment)及安全应用,用于保障隐私数据和程序运行环境的安全性。

ARMv8-A架构并未直接指定哪些软件应该运行在哪些异常级别,但是在通常情况下,有如异常级别的使用模型:

1.应用程序运行在EL0;

2.操作系统内核和相关功能运行在EL1;

3.Hypervisor[3]运行在EL2;

从图中我们可以看出,Hypervisor相关的支持特性主要是在EL2的非安全状态实现的。Hypervisor可以支持虚拟机之间的切换,而虚拟机主要被包含在EL1的非安全状态和EL0的非安全状态中。一些Guest OS可以运行在EL1状态里,每一个Guest OS可以运行在一个虚拟机上。而应用则运行在EL0的非安全状态中,同时也运行在Guest OS上。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18250

    浏览量

    222055
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8648

    浏览量

    361746
  • 操作系统
    +关注

    关注

    37

    文章

    6278

    浏览量

    121865

原文标题:最全ARM体系结构知识:汇编、架构、异常级别和安全状态

文章出处:【微信号:mcu168,微信公众号:硬件攻城狮】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    ARM体系结构、处理器和设备开发文章

    ARM产品必须如何运行的体系结构规范。 此外,一些合作伙伴还授权实施符合架构规范的自己的ARM处理器。 这导致了分层划分为三个级别的规范,这些规范共同描述了整个SoC的行为和程序员模型
    发表于 08-21 07:28

    ARM通用中断控制器体系结构规范GIC体系结构版本3和版本4

    本手册中的体系结构描述使用了与Armv8体系结构相同的术语。有关该术语的更多信息,请参阅Armv8-A架构配置文件Armv8 Arm®架构参考手册A部分的介绍。此外,在适当的情况下使用
    发表于 08-11 07:45

    ARM体系结构参考手册

    ARM体系结构已经发展到支持跨多种性能点实施的程度。 超过20亿个部件的出货量,使其成为许多细分市场的主导架构。 ARM处理器的架构简单性传统上导致了非常小的实现,而小实现允许设备具有非常低的功耗。 实施规模、性能和非常低的功耗
    发表于 08-11 07:10

    了解体系结构-适用于AArch64的TrustZone介绍

    、对TrustZone的内存系统支持以及典型的软件体系结构。我们还介绍Arm提供的资源,以帮助使用TrustZone的系统和软件开发人员。 在本指南的末尾,您将能够: •举一个TrustZone的用例示例,描述
    发表于 08-10 07:02

    Arm AArch64体系结构的可扩展矢量扩展指南

    本指南简要介绍Arm AArch64体系结构的可扩展矢量扩展(SVE)。在本指南中,您可以了解SVE的概念和主要功能,SVE的应用领域,以及SVE与Neon的比较。我们还描述了如何为支持SVE的目标开发程序
    发表于 08-10 06:43

    ARM服务器基础系统体系结构7.1平台设计文档

    服务器基本系统体系结构(SBSA)指定了基于ARM 64位体系结构的硬件系统体系结构,服务器系统软件(例如操作系统、管理程序和固件)可以依赖该体系结
    发表于 08-09 07:49

    Arm CoreSight体系结构规范

    本文档描述了CoreSight体系结构,平台和系统使用。
    发表于 08-09 06:08

    了解体系结构-内存系统资源分区和监视(MPAM)概述

    本指南介绍了内存系统资源分区和监视(MPAM)Arm体系结构的可选添加,以支持内存系统分区。MPAM记录在内存系统资源分区和监视(MPAM)中,用于A配置文件体系结构
    发表于 08-09 06:08

    Arm的DRTM体系结构规范

    的原理和术语,但也包含了显著的差异。 本规范的结构如下: •第2节,DRTM体系结构概述,概述了DRTM,并介绍了该体系结构如何将DRTM映射到基于
    发表于 08-08 07:45

    ARM体系结构标准配置

    ARM体系结构包含大量功能,这些功能被描述为可选或定义的实施。来自平台操作系统供应商的反馈表明这种可变性对于系统代码的开发人员来说是一个实质性的问题,由于操作系统必须满足各种不同的系统配置,导致开发
    发表于 08-08 07:40

    Armv9-A体系结构参考手册

    本增补件是Armv9-A体系结构Arm®体系结构参考手册增补件轮廓本书介绍了Armv9-A体系结构扩展,因此必须与
    发表于 08-08 07:07

    ARM同步原件体系结构指南

    本文介绍ARM中可用的硬件同步原语体系结构,并提供了系统级程序员如何使用它们的示例。
    发表于 08-02 10:59

    ARM系统监控框架体系结构规范

    包含一个简短的介绍,以帮助读者。与体系结构兼容的实现必须 遵守本规范中的所有规则。 一些体系结构规则伴随着解释为什么指定体系结构的基本原理陈述 事实就是这样。基本原理陈述用字母X表示
    发表于 08-02 10:55

    ARM体系结构ABl的v1和v2之间的差异

    ARM体系结构的ABl版本2包括本文档1.2美元中列出的十个组件。ARM体系结构的ABl(基础标准)[BSABI]。 ABl的第2版旨在在不引入不兼容性的情况下扩展和澄清第1版。例如,
    发表于 08-02 08:53

    了解体系结构 - 介绍 Arm 体系结构

    。该体系结构为软件开发人员公开了一个通用的指令集和工作流程,也称为程序员模型。这有助于确保架构的不同实现之间的互操作性,以便软件可以在不同的 Arm 设备上运行。本指南为任何对此感兴趣的人介绍
    发表于 08-01 14:35