0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

重磅!Arm推出新一代指令集架构Armv9,整体性能跃升一级

电子工程师 来源:IT之家 作者:IT之家 2021-03-31 11:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Arm推出新一代指令集架构Armv9,以越来越强大的安全性和人工智能能力,应对无处不在的专业处理需求,这是Arm十年来最大的技术革新,上一代的Armv8发布于2011年10月。Arm表示,Armv9架构将在安全性和人工智能方面与英特尔相抗衡。

基于Arm架构的芯片出货量持续增长,过去五年出货超过1000亿颗。按照这个增长速度,全球100%的共享数据将很快在Arm芯片上进行处理,包括端点,数据网络或云中。随着AI物联网5G在全球范围内蓬勃发展,Armv9中的新功能将加速在每个应用程序中从通用计算向更专业的计算转变。

Arm首席执行官Simon Segars表示,Armv9在基于通用计算的经济性,设计自由度和可访问性的基础上,对普遍的专业/安全和强大的处理需求的推动下,它将在接下来的3000亿个基于Arm架构的芯片中处于最前沿。

据悉,Armv9可以动态建立Realms(领域),以保护重要数据和代码不受系统其余部分的影响。Armv9将包括SVE2(类似于英特尔的AVX指令集),以协助机器学习数字信号处理任务。

Arm承诺将在Armv9基础上提高整体性能,预计在接下来的两代移动和基础架构CPU中,CPU性能将提高30%以上,而硬、软件改善将进一步提高性能。Arm强调,所有现有软件都可以在基于Armv9的处理器上运行,而不会出现任何问题。但是,随着行业从通用计算向普遍存在的专用处理转变,每年两位数的CPU性能提升还远远不够。除了增强专业处理能力外,Arm的Total Compute设计方法还将通过针对性的系统级硬件和软件优化以及用例(use-case)性能的提高来加快总体计算性能。

Arm还表示,Armv9将为图像和语音识别等任务增加人工智能芯片的功能,在该领域,英伟达公司的芯片表现已经超过了英特尔,并帮助其市值超过了英特尔。

对于与英伟达的合并案,Simon Segars强调,“我们对与英伟达合并未来感到振奋,将我们无处不在的计算平台与他们深厚的人工智能专业知识结合在一起,将带来更强的工程能力。 ”

Arm预计,第一批基于Armv9的处理器将在今年年底之前上市。

与Armv8 区别:延续 AArch64 基准指令集 ,全面性能提升,还有重要扩展

安全性升级对于 Armv9 来说,其重要性相当于 64 位对于 Armv8。

自 2011 年 10 月 Arm 首次公布 Armv8 架构以来,已经有近 10 年的时间了,这是计算领域相当多变的 10 年,因为指令集架构通过移动领域到服务器领域的应用越来越多,现在开始在笔记本电脑和即将到来的台式机等消费设备市场上普及。这些年来,Arm 对 ISA 进行了各种更新和扩展,有些是重要的,有些也许很容易被忽略。

全新的 Armv9 架构,为 Arm 希望在未来十年成为下一代 3000 亿颗芯片的计算平台奠定基础。

Armv9 与 Armv8 到底有什么区别,才会在 ISA 的命名上有如此大的跳跃?

外媒分析称,说实话,单纯从 ISA 的角度来看,v9 可能并不像 v8 相比 v7 那样有根本性的跳跃,v8 曾用 AArch64 引入了完全不同的执行模式和指令集,而 AArch64 比 AArch32 有更大的微观架构影响,比如扩展寄存器、64 位虚拟地址空间等许多改进。

Armv9 延续了 AArch64 作为基准指令集的使用,然而在功能上增加了一些非常重要的扩展,值得在架构编号上做一个增量,可能让 Arm 也实现了一种软件的重新垒砌,不仅是新的 v9 功能,也包括我们这些年看到的各种 v8 扩展的发布。

获悉,Armv9 拥有三大新支柱,Arm 认为新架构的主要目标是:安全、AI 以及改进矢量和 DSP 能力。安全性是 v9 的一个非常大的话题,值得更深入地介绍新的扩展和功能细节,但谈到 DSP 和 AI 功能,可以是很直接的。

承诺与 Armv9 兼容的新 CPU 最大的新特性可能是开发者和用户马上就能看到的,那就是 SVE2 作为 NEON 的后续产品的基线。

可伸缩矢量扩展,也就是 SVE,在第一次实现的时候,早在 2016 年就宣布了,并首次在富士通的 A64FX CPU 核心中实现,现在日本的世界第一超级计算机Fukagu就采用了 SVE。SVE 的问题在于,这个新的可变向量长度 SIMD 指令集的首次迭代范围相当有限,而且更多的是针对 HPC 工作负载,缺少了许多通用性较强的指令,而这些指令仍然被 NEON 所覆盖。

SVE2 早在 2019 年 4 月就公布了,希望通过补充新的可扩展 SIMD 指令集所需的指令来解决这个问题,以服务于目前仍在使用 NEON(指 128 位 SIMD 单指令多数据扩展结构)的更多样的 DSP 类工作负载。

SVE 和 SVE2 除了增加各种现代 SIMD(单指令多数据)能力之外,好处在于它们的可变向量大小,从 128b 到 2048b 不等,允许可变 128b 粒度的向量,而不管实际硬件运行在什么地方。纯粹从矢量处理和编程的角度来看,这意味着软件开发者只需要编译一次代码,如果未来 CPU 会出现比如原生 512b 的 SIMD 执行流水线,代码就已经可以利用单位的全部宽度了。

另外,同样的代码也能在更保守的设计上运行,并具有更低的硬件执行宽度能力,这对 Arm 公司来说非常重要,因为他们设计了从物联网、移动设备到数据中心的 CPU。此外,它还能在 Arm 架构的 32b 编码空间内完成所有这些工作,而在 x86 上的其他实现则必须根据向量大小增加新的扩展和指令。

机器学习也被视为 Armv9 的一个重要部分,因为 Arm 看到未来几年越来越多的 ML 工作负载将变得普遍。在专用加速器上运行 ML 工作负载自然仍然是性能或能效关键的要求,然而,仍然会有大量新的较小范围的 ML 工作负载采用,这些工作负载将在 CPU 上运行。

矩阵乘法指令是这里的关键,并将代表着在整个生态系统中看到更大规模采用的重要一步,作为 v9 CPU 的基线功能。

一般来说,SVE2 可能是保证跳转到 v9 命名法的最重要因素,因为它是一个更明确的 ISA 功能,在日常使用中区别于 v8 CPU,这将保证软件生态系统去实际分化现有的 v8 堆栈。这其实已经成为 Arm 在服务器领域的一个相当大的问题,因为软件生态系统仍然是以 v8.0 为基础的软件包,可惜缺少了最重要的 v8.1 大系统扩展。

让整个软件生态系统向前发展,并且能够假设新的 v9 硬件具有新架构扩展的能力,这将有助于推动事情的发展,可能会解决目前的一些情况。

然而 v9 不仅仅是 SVE2 和新的指令,它还有一个非常大的重点就是安全,在这里我们会看到一些比较彻底的变化。

新的 Arm 保密计算架构 (CCA)试图通过基于硬件的安全环境保护敏感数据。这些所谓的 “领域”可以动态创建,以保护重要数据和代码不受系统其余部分的影响。

除了这些更具体的改进外,Arm 还承诺在 Armv9 基础上进行更全面的性能提升。该公司预计,在未来两次迭代中,CPU 性能将提高 30% 以上,并通过软件和硬件优化进一步提升性能。Arm 表示,所有现有软件都可以在基于 Armv9 的处理器上运行,没有任何问题。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11326

    浏览量

    225863
  • CCA
    CCA
    +关注

    关注

    0

    文章

    3

    浏览量

    7982
  • ML
    ML
    +关注

    关注

    0

    文章

    154

    浏览量

    35526
  • 富士通
    +关注

    关注

    2

    文章

    214

    浏览量

    56034
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    海奇半导体重磅发布新一代投影芯片

    3月26日,国家专精特新重点“小巨人”企业珠海海奇半导体有限公司新品发布会圆满举办,重磅推出新一代投影芯片及全系创新产品。
    的头像 发表于 03-26 16:47 900次阅读

    Datalogic将以新一代“智、速、绿”为体的单窗扫描平台Magellan 3600VSi和3700HSi重新定义POS端解决方案

    全球自动数据采集与工业自动化领导者Datalogic得利捷隆重推出新一代Magellan 3600VSi和3700HSi单窗扫描平台。该系列产品以突破性创新设计,全面提升人工收银通道与自助收银系统(SCO)的整体性能
    的头像 发表于 02-14 20:09 1.5w次阅读

    【「龙芯之光 自主可控处理器设计解析」阅读体验】+本书概览与龙芯指令集基础了解.docx

    本课程设计的实践指导书。 先从目录了解下本书内容 第章是基础知识的介绍,先介绍了系统芯片的基础知识,然后是处理器架构指令集,这
    发表于 01-15 23:07

    长晶科技推出新一代SGT 30V MOSFET

    长晶科技重磅推出新一代 SGT Gen2.0工艺。在30V电压平台,与Gen1.0相比,Fom值可降低50%,超同期欧美系水平12.5%;相比上一代,Rsp值可降低41.6%,超同期欧美系水平
    的头像 发表于 12-18 10:08 711次阅读
    长晶科技<b class='flag-5'>推出新一代</b>SGT 30V MOSFET

    武汉芯源MCU的指令集架构是什么?有哪些特点?

    武汉芯源MCU的指令集架构是什么,有哪些特点?
    发表于 12-08 06:59

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为物联网及边缘 AI 工作负载优化)将纳入 Arm Flexible Access 方案,助力创新者以低成本、便捷的方式,在边缘侧获得先进的 AI 性能与安全保障
    的头像 发表于 10-29 15:27 1188次阅读

    指令集测试的种纠错方法

    本文描述在进行指令集测试的种纠错方法 1.打开测试指令集对应的dump文件 dump文件是指由汇编文件进行反汇编之后,可以供人阅读指令的反汇编文件。其包含了每
    发表于 10-24 14:04

    risc-v P扩展() P指令集简介

    、16位、32位、64位的加减、乘法、移位、解压、打包等指令。 [size=17.3333px]同时也需要注意,P扩展中部分指令与其他指令集定重合。 [size=17.3333px
    发表于 10-23 07:40

    基于蜂鸟E203架构指令集K扩展

    蜂鸟E203是款基于RISC-V架构的微处理器,其指令集包含RV32I的基本指令集,RV32M的乘法扩展指令集,以及
    发表于 10-21 09:38

    深爱半导体 代理 SIC213XBER / SIC214XBER 高性能单相IPM模块

    SIC213XBER / SIC214XBER 全新高性能单相IPM模块系列!我们以全新ESOP-9封装与新一代技术,赋能客户在三大核心维度实现飞跃性提升:效率跃升、空间减负、成本优
    发表于 07-23 14:36

    水平的 RISC-V 架构的 MCU,和 ARM 架构的 MCU 相比,运行速度如何?

    ARM 架构与 RISC-V 架构的 MCU 在同一性能水平下的运行速度对比,需从架构设计原点、指令集
    的头像 发表于 07-02 10:29 1724次阅读
    同<b class='flag-5'>一</b>水平的 RISC-V <b class='flag-5'>架构</b>的 MCU,和 <b class='flag-5'>ARM</b> <b class='flag-5'>架构</b>的 MCU 相比,运行速度如何?

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、能效比与开发效率上的挑战。以下从技术架构性能突破、应用场景、生态系统及战略价值展开分析:
    的头像 发表于 05-29 09:54 4560次阅读

    ARM最强超大核Cortex-X925与小米玄戒O1的深度解析

    体验。 架构革新:从微架构到系统优化 指令集与扩展性 完整支持Armv9.2-A
    的头像 发表于 05-23 15:29 3987次阅读

    紫光展锐推出新一代旗舰智能座舱芯片平台A8880

    近日,在第二十一届上海国际汽车工业展览会(以下简称“上海车展”)期间,紫光展锐重磅推出新一代旗舰智能座舱芯片平台A8880,以强劲实力全面助力汽车座舱智能化迈向新征程。
    的头像 发表于 04-27 14:29 1931次阅读

    SoC集群服务器 与 ARM架构阵列服务器 关系

    。 核心特征‌:芯片集成、高密度算力、低功耗设计。 ARM架构阵列服务器‌ 基于ARM指令集的处理器集群,通过多节点协同工作提升
    的头像 发表于 04-24 07:49 1168次阅读
    SoC集群服务器 与 <b class='flag-5'>ARM</b><b class='flag-5'>架构</b>阵列服务器 关系