0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm下一代指令架构“Armv9”已经问世

jf_1689824270.4192 来源:电子发烧友网 作者:jf_1689824270.4192 2019-11-13 11:55 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Arm的下一代CPU指令集架构(ISA:指令集架构)“ Armv9”开始推出。该公司正在逐步扩展当前的ISA“ Armv8”,而扩展的高潮最终将成为Armv9的搭建桥梁。至于Armv9,一位CPU行业人士表示,安全性增强是最重要的关键。Arm在Armv8.3之后的阶段扩展中专注于安全性,并被视为迈向Armv9的一步。

Arm的指令集架构的发展对于当前的IT行业至关重要。这是因为高性能CPU的指令集体系结构几乎被x86 / x64和Arm两个系统所垄断。对于移动和嵌入式应用程序,Arm是最大的力量。即使不使用Arm本身的CPU内核IP,Apple的A系列SoC的CPU内核和Qualcomm的Snapdragon SoC的Kryo内核也符合Arm的指令集。Arm的指令集体系结构更改会影响许多计算设备。

该公司在2011年使用Armv8将CPU ISA 64位化,同时极大地改变了架构 使用AArch64(一种智能且有条理的64位体系结构),并对ISA进行了重新分区,然后重新开始。在Armv8基础之上,Arm目前正在建立扩展指令。扩展从三个方向进行:虚拟化和RAS等服务器的系统扩展,深度学习的计算扩展以及安全性扩展。

此外,Arm还发布了未来CPU体系结构扩展的方向。引入事务性内存以扩展CPU内核数量,增加了用于车载的功能安全功能,支持用于深度学习的矩阵运算,针对矢量市场中的某些市场将矢量扩展到256位。

它还允许获得Arm许可的客户将自定义指令合并到Arm指令集中。定制指令从用于嵌入式用途的Cortex-M开始,但也正在考虑将其部署到实时的Cortex-R和计算的Cortex-A中。到目前为止,Arm尚未允许被许可方添加自定义指令,以防止破坏CPU指令集体系结构。Cortex-A类中的自定义说明将谨慎进行,以免造成干扰。客户自定义指令的引入旨在与允许客户自定义指令的RISC-V指令集体系结构相反。

不断升级的Armv8-A指令集

Arm CPU当前的指令集架构是第8代“ Armv8”。即使具有相同的Armv8名称,它也会按CPU配置文件分为ISA系列的三种类型。“ Armv8-A”用于高性能CPU“ Cortex-A”系列,“ Armv8-R”用于实时CPU“ Cortex-R”系列,“ Armv8-M”用于嵌入式MCU“ Cortex-M”系列,每个配置文件都有不同的指令集。

此外,对指令集进行了较小的升级。用于高性能CPU的Armv8-A在小数点后也有一个版本。从Armv8.1-A开始,十进制版本每年都会增加“ .1”,现在宣布了Armv8.6-A。Armv8.6-A是ISA在2019年的扩展,Armv8.5-A是2018年,Armv8.4-A是2017年。

传统上,当出现新的Arm ISA小数点版本时,新的小数点版本几乎同步地添加到Arm自己的CPU核心IP中。但这不是现在。Arm的高端CPU核心IP“ Cortex-A77” ISA版本为Armv8.2-A。下一个内核Hercules也是Armv8.2-A。实际上,自2015年Armv8.2-A起,CPU核心IP ISA版本就没有增加。

Apple CPU内核几乎没有Armv8.3-A。已经发布了过去几年的Armv8.x,但尚未在CPU上完全实现。这这种情况有些复杂。首先,ISA版本和CPU实施ISA版本名称之间存在关联。每个Armv8.x一代ISA版本都包含多个功能。使用Arm ISA,如果您具有特定世代的所有功能,则可以首次声明该版本。

例如,如果实现了Armv8.2-A的所有功能,它将成为Armv8.2-A CPU。但是,除了Armv8.0-A的基本功能之外,如果仅实现Armv8.2-A功能的一部分,它将成为Armv8.0-A CPU而不是Armv8.2-A CPU。

在实际的核心IP示例中,Cortex-A77实现了Armv8.2-A之前的所有功能,但仅实现了Armv8.3-A和Armv8.4-A的某些功能。因此,ISA版本是Armv8.2-A CPU。完全装有Armv8.4-A的CPU内核尚未出现。由于该功能的“旋钮”,无法满足Armv8 ISA的升级条件,并且版本无法升级。

但是,这种情况将在不久的将来改变。Arm CPU内核是下一代“ Matterhorn”,并且可以立即实现Armv8.6-A的许多功能。 Matterhorn是该指令集的主要里程碑。Arm将 Matterhorn的CPU代号规则从当前的希腊神话更改为Yamana名称,而且还切换了CPU体系结构以及代号。 Matterhorn可能是“ Armv9之前的CPU”。

过去两年中,Arv8.x指令扩展集中在安全性扩展上

过去,随着分阶段添加功能,Arm的指令集是在Arm的CPU核心IP中同步实现的。但是,自Armv8.2-A以来,它的实施并不顺利,新功能的积累也有所重叠。因此,如前所述,CPU内核的ISA版本似乎未从Armv8.2-A升级。

剩下这么多的原因是什么?它与Armv8.2-A及更高版本功能的内容有关。最后三代的Armv8.x扩展专注于安全性。特别是,Armv8.4-A和8.5-A主要是与安全相关的扩展。

从Meltdown和Spectre开始,这是为了处理CPU微体系结构上的安全性问题。2017年,CPU厂商出现了侧面通道攻击类型Meltdown和Spectre。因此,在过去几年中,开发高性能CPU的供应商(包括IntelAMD以及Arms)一直致力于将安全功能集成到CPU体系结构和微体系结构中。

就Arm而言,高度依赖Arm平台的Google已成为重要的合作伙伴,并在架构上采取了先进的安全措施。它内置在最新的ISA十进制版本中,例如Armv8.4-A(2017)和Armv8.5-A(2018)。

图:Armv8.xA体系架构

如果您查看上面每个Armv8.xA版本中的新功能,则可以看到对安全性的偏爱。在该图中,SIMD / FP(浮点)算术系统功能以绿色显示,安全功能以紫色显示,系统和内存功能以卡其色显示。安全功能从Armv8.3-A开始,并随着Armv8.4-A / Armv8.5-A迅速增加。

重点再次从安全转向深度学习

侧通道攻击问题极大地改变了高性能CPU架构的发展。在此之前,您只需要实现一种良好的加速技术,但是在Meltdown / Spectre之后,您现在需要检查该技术是否存在安全问题。并且已经有必要将用于边信道攻击的基本安全功能整合到体系结构/微体系结构中。

自2017年中以来,高性能CPU供应商一直在努力解决此问题。除Arm之外,包括Intel和AMD在内的所有高性能CPU供应商的当前目标是完善一种可免受侧通道攻击的体系结构。

Armv8-A指令集的演变清楚地表明了这种情况。Arm正在迁移到Matterhorn,其安全扩展由Armv8.5-A分隔。因此,下一个指令扩展Armv8.6-A不是偏向于安全性,而是专注于深度学习。

Arm在Armv8.2-A中支持FP16(16位半精度浮点算术),在Armv8.4-A中支持8位点积指令。其加强了对CPU的SIMD(单指令,多数据)操作的深度学习支持。Armv8.6-A进一步支持矩阵运算和BFloat16,以加强对深度学习的兴趣。将矩阵运算和BFloat16带入CPU的原因之一是支持边缘侧训练。支持在中间边缘进行轻度训练,而不是在云侧进行繁重训练。

本文由电子发烧友翻译自pc.watch

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388551
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222858
  • 指令集
    +关注

    关注

    0

    文章

    228

    浏览量

    24234
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为物联网及边缘 AI 工作负载优化)将纳入 Arm Flexible Access 方案,助力创新者以低成本、便捷的方式,在边缘侧获得先进的 AI 性能与安全保障
    的头像 发表于 10-29 15:27 727次阅读

    Telechips与Arm合作开发下一代IVI芯片Dolphin7

    Telechips宣布,将在与 Arm的战略合作框架下,正式开发下一代车载信息娱乐系统(IVI)系统级芯片(SoC)“Dolphin7”。
    的头像 发表于 10-13 16:11 753次阅读

    适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    电子发烧友网为你提供()适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM相关产品参数、数据手册,更有适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM的引脚图、接线图、封装
    发表于 09-05 18:34
    适用于<b class='flag-5'>下一代</b> GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    驱动下一代E/E架构的神经脉络进化—10BASE-T1S

    随着“中央+区域”架构的演进,10BASE-T1S凭借其独特优势,将成为驱动下一代汽车电子电气(E/E)架构“神经系统”进化的关键技术。
    的头像 发表于 07-08 18:17 797次阅读
    驱动<b class='flag-5'>下一代</b>E/E<b class='flag-5'>架构</b>的神经脉络进化—10BASE-T1S

    水平的 RISC-V 架构的 MCU,和 ARM 架构的 MCU 相比,运行速度如何?

    ARM 架构与 RISC-V 架构的 MCU 在同性能水平下的运行速度对比,需从架构设计原点、指令
    的头像 发表于 07-02 10:29 1200次阅读
    同<b class='flag-5'>一</b>水平的 RISC-V <b class='flag-5'>架构</b>的 MCU,和 <b class='flag-5'>ARM</b> <b class='flag-5'>架构</b>的 MCU 相比,运行速度如何?

    下一代高速芯片晶体管解制造问题解决了!

    版图应用于未来的 CFET 设计。研究人员认为,其最新的叉片设计可以作为未来垂直器件架构的过渡,为下一代工艺技术提供更平稳的演进路径。
    发表于 06-20 10:40

    下一代PX5 RTOS具有哪些优势

    许多古老的RTOS设计至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有这些旧设计都有专有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全认证和功能。
    的头像 发表于 06-19 15:06 870次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、能效比与开发效率上的挑战。以下从技术架构、性能突破、应用场景、生态系统及战略价值展开分析: 、技术架构:异构计
    的头像 发表于 05-29 09:54 4045次阅读

    Arm 公司面向汽车市场的 ​Arm Zena​ 深度解读

    Zena 基于 ​ Armv9 架构 ​ 和 ​ AE(Automotive Enhanced)IP 核 ​ 设计,融合了高性
    的头像 发表于 05-29 09:51 2036次阅读

    Arm解读Armv9 CPU为何是打造高性能、高能效移动计算的关键

    作者:Arm 终端事业部产品管理高级总监 Stefan Rosinger 在之前有关 Arm Cortex-X925 CPU 的文章中,Arm 技术专家曾探讨了每时钟周期指令数 (IP
    的头像 发表于 03-14 15:51 1311次阅读

    Arm 推出 Armv9 边缘 AI 计算平台,以超高能效与先进 AI 能力赋能物联网革新

    电子发烧友网报道(文/黄晶晶)当下,快速发展的 AI 正不断赋予边缘设备越来越先进的智能性,使边缘设备胜任越来越重要的任务。为应对边缘侧持续增长的 AI 需求,Arm 近日发布以全新基于 Armv9
    的头像 发表于 03-06 11:43 1774次阅读
    <b class='flag-5'>Arm</b> 推出 <b class='flag-5'>Armv9</b> 边缘 AI 计算平台,以超高能效与先进 AI 能力赋能物联网革新

    Arm发布基于Armv9架构的Cortex-A320处理器

    边缘 AI 需要更卓越的计算性能、更强大的安全性,以及更出色的软件灵活性。随着软件愈发复杂化,Armv9 架构应运而生,以提供先进的机器学习 (ML) 和 AI 功能,并具备增强的安全特性。该架构现已在 Cortex-A3xx
    的头像 发表于 02-27 17:10 1151次阅读

    Arm推出全球首个Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台以 Cortex-A320 CPU 和 Ethos-U85 NPU 为核心,专为物联网应用优化,支持运行超 10 亿参数的端侧 AI 模型,已获得包括亚马逊云科技 (AWS)、西门子和瑞萨电子等在内的多家行业领先企业的支持。
    的头像 发表于 02-27 17:08 1227次阅读

    基于Armv9架构的MediaTek天玑8400移动芯片问世

    如今,基于 Armv9 CPU 技术构建的人工智能 (AI) 旗舰智能手机立于技术前沿,为 AI 创新提供了前所未有的机遇。为了应对持续增长的 AI 工作负载的计算强度及复杂度,Armv9.2 CPU 集群带来了更强性能、更高效率,以及更多功能,为新
    的头像 发表于 12-24 14:18 1135次阅读

    文详解Arm架构Armv9.6-A中的最新功能

    Arm CPU 是当今人工智能 (AI) 赋能软件的关键,它可解释、处理和执行指令Arm 指令架构 (ISA) 作为硬件和软件的接口,指
    的头像 发表于 12-17 10:22 4621次阅读
    <b class='flag-5'>一</b>文详解<b class='flag-5'>Arm</b><b class='flag-5'>架构</b><b class='flag-5'>Armv</b>9.6-A中的最新功能