0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍Armv9.5-A中Arm架构的最新特性

冬至子 来源:Martin Weidmann 作者:Martin Weidmann 2023-10-11 09:44 次阅读

随着人工智能AI)的崛起和安全威胁加剧,计算的需求持续加强。因此,世界上各种设备核心的基础计算架构的持续演进显得尤为重要。这就是为什么我们的工程团队向Arm架构中添加新的功能和技术,然后软件团队确保软件尽可能无缝地利用这些未来的功能和技术。

Arm架构是怎样开发的

Arm每年发布对Arm指令集架构(ISA)的更新,这些更新是与Arm生态系统的多样化合作伙伴共同创建的。该过程涉及芯片合作伙伴、操作系统供应商和OEMs、Arm的内部工程团队和标准制定机构。

经过严格规划的ISA可以确保软件在新旧硬件上继续工作很多年。Arm与Linaro以及其他众多合作伙伴紧密合作,以便最广泛使用的软件上游社区(例如Linux内核和发行版)可以利用Arm ISA,以帮助提供全球最广泛的开发者生态系统。

每年九月,我们发布一篇博客,讨论当年A-Profile架构的关键更新。然后我们通过开发者网页发布完整的指令集和系统寄存器文档。

完整的Arm架构参考手册(Arm ARM)也每年更新一次。预计将在2024年初发布包含2023扩展的更新。在2023年和2024年,“Learn the Architecture”页面也将更新。

Architecture 2023 image 1.png

发布博客和文档只是部署新架构的第一步。下一步我们将和生态系统伙伴合作,确保一旦硬件可用,开源软件就能立即利用这一功能。

2023年,Arm引入新功能,以支持我们持续关注的人工智能(AI)、机器学习(ML)和安全性。让安全的AI无处不在是Arm架构的关键优先任务,神经网络(NNs)的训练对AI的持续发展和进步至关重要。这就是为什么2023年的架构扩展包括FP8的新8位浮点格式的支持,此格式已在NNs中迅速被采纳。在安全性方面,我们正在添加Checked Pointer Arithmetic,该功能基于Arm Memory Tagging Extension (MTE),允许开发人员快速检测内存安全性违规,从而在应用开发过程中节省成本和时间。

之前对A-Profile架构的更新的详细信息可以在这里找到:2014、2015、2016、2017、2018、2019、2020、2021和2022。

让我们看看今年增加了哪些新功能。

Floating Point 8 (FP8)

2022年,Arm、Intel 和 Nvidia 宣布了他们在FP8上的合作,这是一个交换格式,允许软件生态系统轻松地共享NN模型,并支持AI计算能力的持续进步。作为2023年扩展的一部分,SME2、SVE2 和 Advanced SIMD (Neon) 增加了对FP8的支持。

FP8支持两种数据格式:E5M2 和 E4M3。这两种格式在精度和范围之间提供了不同的权衡。
image.png

由FPMR寄存器控制选择使用那种格式。可以为一条指令的不同输入选择不同的格式,从而有效地处理不同格式的数据集。我们坚信,行业共创的FP8带来的好处,使开发者能够集中精力在真正重要的创新和差异化上。我们很兴奋地看到FP8如何推动未来的AI发展.

实时迁移

实时迁移是将虚拟机(VM)从一个主机移动到另一个主机的过程,同时保留其可用性和状态。高效的实时迁移支持是大规模数据中心管理的重要工具。

image.png

为了实现实时迁移,hypervisor需要在VM仍在旧主机上运行时将页面复制到新主机。这通常需要一个迭代过程,因为VM可能会“弄脏”已经被复制的页面。解决这个问题有不同的方法,但它们都必须面对三个挑战:

记录(Recording):创建VM写入(弄脏)的页面的记录。
调查(Surveying):处理记录,以确定哪些页面需要重新复制。
清理(Cleaning):在每次迭代上重置记录机制。

2023年的扩展引入了新特性,帮助优化这三个过程。

FEAT_HDBSS增加了记录被弄脏的stage 2页面或块日志的能力。这种机制减少了记录成本,因为内存管理单元(MMU)可以有效地创建日志,而不中断VM的执行。该日志还减少了调查成本,因为生成的数据是hypervisor可以高效使用的格式。

image.png

为了解决清理成本,FEAT_HACDBS为清理 stage 2页表中的脏状态增加了一个加速器。该引擎使用脏页面的日志来定位需要更新的stage 2页表描述符。

这些特性一起为实时迁移带来显著的性能和效率提升。

Checked Pointer Arithmetic 检验过的指针运算

AArch64支持的特性可以重新利用保存地址的寄存器的高位。例如,Armv8.0-A中引入的Tagged Pointers和Armv8.5-A中引入的MTE。

软件经常需要操作指针,例如给基址加上一个偏移量。这通常使用常规的算术操作来完成,如加或减。地址计算上的溢出可能导致非地址位被损坏。例如,如果正在使用MTE,地址操作可能导致存储在指针中的MTE Tag被更改。损坏的MTE Tag可能导致处理器无法检测到内存安全违规,如下所示:

image.png

2023年的扩展引入了专门用于操作指针的新指令。这些指令包含多个指针特定的检查,包括检查bits[63:56]是否被修改,并防止溢出。寻址模式的加载和存储指令也可以被配置为保留bits[63:56]。

取之前的MTE例子,新的特性允许处理器检测指针的前8位是否已经被修改。这意味着,如果MTE标签被损坏,它将被报告回到软件中。

其他功能

2023年扩展部分引入的其他增强功能包括:

  • 支持使用PC(程序计数器)和SP(当前选择的堆栈指针)的组合作为生成或检查指针认证代码时的modifier 。
  • 支持具备Realm Management Extension (RME) 的设计,在Granule Protection Tables中支持non secure only,并具有禁用某些Physical Address Spaces (PAS)的能力。
  • EL3配置写入陷阱。
  • 断点支持地址范围和mismatch触发,而无需链接。
  • 支持从EL3有效地将SErrors委托给EL2或EL1。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 寄存器
    +关注

    关注

    30

    文章

    5028

    浏览量

    117719
  • 神经网络
    +关注

    关注

    42

    文章

    4572

    浏览量

    98748
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230600
  • 机器学习
    +关注

    关注

    66

    文章

    8122

    浏览量

    130561
  • ARM架构
    +关注

    关注

    14

    文章

    167

    浏览量

    35992
收藏 人收藏

    评论

    相关推荐

    Arm架构学习—开启Armv9时代

    在上一篇文章“从A76到A78——在变化中学习Arm架构”中,我们了解了Arm处理器微架构的基本组成,介绍
    的头像 发表于 11-27 16:46 599次阅读
    <b class='flag-5'>Arm</b>微<b class='flag-5'>架构</b>学习—开启<b class='flag-5'>Armv</b>9时代

    ARM Cortex®-A75核心技术参考手册

    Cortex-A75内核是一款高性能、低功耗的ARM产品,它实现了ARMv8-A架构,支持ARMv8.2扩展(包括RAS扩展)和
    发表于 08-29 08:19

    Arm Cortex®-A77核心软件优化指南

    Cortex-A77内核是一款高性能、低功耗的ARM产品,它实现了ARMv8-A架构,支持ARMv8.2-A扩展,包括RAS扩展、
    发表于 08-29 07:51

    Arm v8.5-AArmv9 CPU更新

    作为ARM v8.5-A架构更新的一部分,ARM添加了一些功能,旨在解决Google ProjectZero团队和其他地方披露的安全问题。 完整的
    发表于 08-25 07:26

    ARM Cortex-A77软件优化指南

    Cortex-A77内核是一款高性能、低功耗的ARM产品,它实现了ARMv8-A架构,支持ARMv8.2-A扩展,包括RAS扩展、
    发表于 08-24 07:30

    ARM Cortex-A715核心软件优化指南

    Cortex-A715内核是一款性能均衡、低功耗和受限区域的产品,采用ARMv9.0-A架构ARMv9.0-A架构
    发表于 08-24 06:20

    ARM Cortex-A系列ARMv8-A程序员指南

    。 有关ARMv7-A架构的一般介绍,请参阅ARM®Cortex®-A系列程序员指南。 本指南还可以帮助您熟悉本卷
    发表于 08-22 07:22

    ARM体系结构参考手册ARMv7-AARMv7-R版本

    本手册介绍ARM®架构v7、ARMv7的A和R配置文件。 其中包括以下内容的描述: ·处理器指令集: -原始
    发表于 08-12 07:46

    ARM领域管理扩展(RME)系统架构介绍

    本章介绍Realm Management Extension(RME)系统架构。RME架构是在[1]中指定,并且被定义为Armv9体系结构的A
    发表于 08-09 07:52

    Armv9-A体系结构参考手册

    本增补件是Armv9-A体系结构的Arm®体系结构参考手册增补件轮廓本书介绍Armv9-A体系结构扩展,因此必须与Arm®体系结构参考手册
    发表于 08-08 07:07

    深入介绍Arm架构的R-Profile

    本指南向您介绍Arm架构的R-Profile。您将了解Arm架构、R-Profile的演变以及所有R-Profile版本
    发表于 08-02 17:51

    如何在Cortex-M处理器实现的Armv8-M异常模型

    本指南介绍在Cortex-M处理器实现的Armv8-M异常模型。本指南还提供了示例,以帮助解释其介绍的概念。 Arm
    发表于 08-02 13:14

    Armv8-R架构的虚拟化概念和可能性

    本指南介绍Armv8-R架构的虚拟化概念和可能性。我们用四个例子来解释这些概念,其中大部分是基于汽车行业的应用程序。这些示例可以帮助您理解和熟悉虚拟化概念 使用
    发表于 08-02 09:27

    Armv8-AArmv9-A的内存属性和属性介绍

    1. 本指南介绍Armv8-AArmv9-A的内存属性和属性。它首先解释内存的属性来自何处,如何分配到内存区域,然后介绍现有的不同属性,并解释内存顺序的基本
    发表于 08-02 09:03

    Armv9引入的MTE已成内存安全的新防线

    电子发烧友网报道(文/周凯扬)随着Arm近日公开TCS23方案,可以看出Arm在移动SoC的计算核心上,已经全面走向了Armv9.2架构,无论是大核Cortex-X4、中核Cortex
    的头像 发表于 06-01 00:11 1393次阅读