0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅谈Armv9的三个技术特性及引发的市场竞争力

jf_f8pIz0xS 来源:21ic中国电子网 作者:付斌 2021-04-15 18:08 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Arm架构在如今的电子行业中可以说是无处不在。自1990年Arm公司正式成立Armv4架构到2011年Armv8架构,短短21年架构经过了5次重大升级。而Armv8意味着Arm正是从AArch32迈进AArch64,凭借强大的实力在过去的五年基于Arm架构的设备出货量超过了1000亿。

十年转瞬,Armv9架构终于露出庐山真面目,适用于Arm全系列芯片的Armv9架构,这次的升级瞄准的则是日益强大的安全、人工智能AI)和无处不在的专用处理的需求。实际上,Armv9架构的推出也与正预示着行业的发展方向。凭借新架构,Arm提出了3000亿的目标。

Armv9的三个技术特性

根据Arm高级副总裁、首席架构师兼技术院士Richard Grisenthwaite的介绍,Armv9架构是基于Armv8既往成功的基础,并增添了针对矢量处理的DSP机器学习ML、安全等这三个技术特性。

Armv8之所以“统治”市场十年之久,最大的升级点便是引入了64架构,即AArch64,这也是Arm版本升级最大的一次改变。除此之外,AArch64摒弃了此前的处理器模式、优先级级别等传统概念,提出了EL(Exception level),并在兼容设计上定义了两套运行环境ES(Execution state)。这些也都被Armv9所继承,可以说Armv9是集大成者,将Arm三十多年的核心完美继承下来。

矢量处理的DSP、机器学习ML处理能力提升要归功于可伸缩矢量扩展(SVE2)和矩阵乘法指令的引入。相比SVE的128位矢量,SVE2可以支持多倍128位运算,最多2048位,因此才有如此魔力可以增强对在CPU上本地运行的5G系统、虚拟和增强现实以及ML工作负载的处理能力。

根据Richard Grisenthwaite的介绍,SVE2增强多项DSP和机器学习ML处理能力,例如Scatter-Gather DMA直接存储器访问,把它放到CPU架构中,能实现更多的循环,更大的DSP处理能力,从而支持更多的并行化。

安全能力提升则主要是通过Arm推出的全新的机密计算架构CCA(Confidential Compute Architecture)实现,根据介绍CCA通过打造基于硬件的安全运行环境来执行计算,保护部分代码和数据,免于被存取或修改,甚至不受特权软件的影响。同时还将基于此前的TrustZone安全技术引入动态创建机密领域(Realms)的概念,机密领域面向所有应用,运行在独立于安全或非安全环境之外的环境中,以实现保护数据安全的目的。

Armv9在算力上的提升

提到架构的升级,就离不开算力这一个话题,Armv9架构能够为Arm后两代产品提供30%的性能提升。根据介绍,以智能手机等移动平台使用的Cortex-X/A系列为例,X1/A78这一代的性能相比16nm A72提升2.5倍,下一代的Matterhorn架构及Makalu架构会保持30%以上的IPC性能提升。

除了CPU性能以外,Armv9还非常重视整体的性能提升,包括降低内存延迟(从150ns降至90ns)、频率提升(从2.6GHz到3.3GHz)内存带宽(从20GB/s到60GB/s)、缓存等。

Richard Grisenthwaite强调,Arm在新一代架构Armv9上将保持这个速度,预计未来两代移动和基础设施CPU的性能提升将超过30%。,这个数据是根据业界标准评测工具来衡量的,而且这样30%的算力提升完全是凭借于本身的架构而不是借助于制程工艺来实现。

另外,随着摩尔定律正在放缓,如何进一步提升算力呢?他认为,Arm将通过最大化地提升频率、带宽、缓存大小、并减少内存延迟,以最大化CPU性能。

除了CPU,Arm还表示Mali GPU会增加更多高级功能,例如VRS可变帧率渲染、RT光线追踪及其他高级渲染技术等。

由Armv9引发的市场竞争力

实际上,在去年Arm发布Arm® Cortex®-M55处理器和Arm Ethos™-U55神经网络处理器(NPU)两款重磅“性能炸弹”时,就已开始蓄力发展人工智能(AI)。Cortex-M55是Arm历来AI能力最为强大的Cortex-M处理器,能够大幅提升DSP与ML的性能,同时更省电。

反观行业趋势,应用开始要求提供更高的数字信号处理(DSP)性能,实时算法的复杂程度增加和浮点算法趋势下,DSP核或硬件加速单元越来越多被部署内嵌在器件之中。DSP一直影响着下一代产品创新,这是因为许多算法在字长和动态范围有着很高的要求,DSP可免去定点到浮点的转化工作加速产品上市,另外DSP浮点计算成本越来越接近定点计算。正因如此,便形成了Arm+DSP内核的黄金搭档。

另外,行业也正在将越来越多的机器学习工作负载变得更加普遍,虽然机器学习有着许多专用的加速器,不过相比来说大量的小范围机器学习的主力仍然是CPU,因此矩阵乘法指令成为关键。

在安全性能上,Arm曾在此前进行了多维度的功能增强,包括PSA认证、TrustZone等。目前PSA认证已经有有超过35个合作伙伴提供的60多种认证产品,而新推出的CCA则也将基于TrustZone提供更加安全的架构。

从Armv9着眼的点来看,行业正逐渐对算力功耗平衡性和安全性能要求提高。Arm架构可用在物联网的大部分设备之上,因此对这两项要求更加吃紧。大数据时代爆炸量的信息增长下,一方面将计算分成了多个维度,另一方面将会对数据安全提出更高的要求。

根据Arm的介绍,搭载ARMv9处理器的芯片最快在2021年年底就会面世,物联网发展日趋成熟,这个时间点恰好提升竞争力的好时机。市场或将拥有追求极致计算性能的高端产品、超低功耗的省电高手、主打安全可靠的产品。而Armv9经过架构的更新,能够从底层和非制程方向进行大改革,相信能为市场带来新的竞争力。

而在广为受关注的国内授权问题上,Arm强调:“Arm既有源于美国的IP,也有非源于美国的IP。经过全面的审查,Arm确定其Armv9架构不受美国出口管理条例(EAR)的约束。Arm已将此通知美国政府相关部门,我们将继续遵守美国商务部针对华为及其附属公司海思的指导方针。”
编辑:lyn

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • dsp
    dsp
    +关注

    关注

    561

    文章

    8276

    浏览量

    368317
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11331

    浏览量

    225912
  • arm9
    +关注

    关注

    2

    文章

    290

    浏览量

    56446
  • 机器学习
    +关注

    关注

    67

    文章

    8565

    浏览量

    137230
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    市场与新场景推动嵌入式系统研发走向统一开发平台

    对于嵌入式工程师与研发团队而言,工具不再只是辅助手段,而是决定开发效率、产品质量与长期市场竞争力的重要基础。
    的头像 发表于 04-24 15:10 104次阅读
    新<b class='flag-5'>市场</b>与新场景推动嵌入式系统研发走向统一开发平台

    ip6829支持苹果15w无线充吗?

    英集芯IP6829通过多线圈布局与兼容性设计,提升无线充电效率与用户体验,重塑中高端市场竞争力
    的头像 发表于 04-24 08:19 339次阅读
    ip6829支持苹果15w无线充吗?

    光缆单价:在市场竞争与政策引导下的走向

    光缆行业的发展既受到市场竞争的推动,也受到政策的影响。光缆单价作为市场的重要信号,其变化反映了市场竞争的激烈程度和政策的导向作用。 市场竞争对光缆单价的影响 价格
    的头像 发表于 04-14 09:42 135次阅读

    京东商品详情API在电商行业的竞争力分析

    市场竞争力的关键要素。京东商品详情API作为京东开放平台(宙斯JOS)的核心服务之一,聚焦商品全维度数据的高效获取与同步,在电商API生态中占据重要地位。本文将从核心竞争力、行业对比差异、现存短板及优化方向四维度,系统分析
    的头像 发表于 03-10 16:37 516次阅读

    单芯片智能电源管理芯方案TP4316:精准定义1A移动电源的细分市场竞争力

    TP4316是一款高度集成的1A移动电源单芯片解决方案。其核心优势在于精准集成了大关键功能:1A充放电管理满足细分市场基础需求;内置Type-C协议实现智能识别与兼容;NTC全场景温度保护确保电池安全。这一定位使产品在成本、安全与场景适配性上建立起独特
    的头像 发表于 01-24 11:51 486次阅读
    单芯片智能电源管理芯方案TP4316:精准定义1A移动电源的细分<b class='flag-5'>市场竞争力</b>

    【「芯片设计基石——EDA产业全景与未来展望」阅读体验】+ 芯片“卡脖子”引发对EDA的重视

    集成度、更低功耗、更高性能发展;加速新技术融合创新步伐,推动技术创新和产业升级,迈向更加智能化、高效化。3.连接设计与制造,促进设计与制造协同发展,提升产业链运行效率与市场竞争力;推动芯片产业精细
    发表于 01-20 20:09

    零碳园区如何重塑未来经济竞争力

    降本增效、产业升级、区域经济高质量发展的 “新引擎”。从吸引低碳企业入驻到降低长期运营成本,从催生绿色技术创新到获取全球市场认可,零碳园区正在多维度重塑未来经济竞争力的核心逻辑。本文结合国内外标杆园区实践,拆解零碳园区重塑经济
    的头像 发表于 12-18 11:36 888次阅读
    零碳园区如何重塑未来经济<b class='flag-5'>竞争力</b>?

    格科微电子荣膺项权威认可

    近期,格科获得由政府、媒体与专业机构颁发的项权威认可,覆盖CMOS图像传感器细分市场竞争力技术创新成果和质量管理体系建设大方向。
    的头像 发表于 12-01 16:30 631次阅读

    新紫光集团的核心竞争力是什么?

    在智能科技产业蓬勃发展的当下,新紫光集团作为具有全球竞争力的智能科技产业集团脱颖而出,其核心竞争力在多方面有着显著体现,主要涵盖全产业链布局、技术创新能力、全球市场影响
    的头像 发表于 11-26 14:09 593次阅读

    无线充qi2.2认证注意事项:6周拿下市场通行证

    无线充电Qi2.2标准更新,要求制造商注册会员、完成鉴权、通过测试,提升合规与市场竞争力
    的头像 发表于 11-13 08:29 719次阅读
    无线充qi2.2认证注意事项:6周拿下<b class='flag-5'>市场</b>通行证

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为物联网及边缘 AI 工作负载优化)将纳入 Arm Flexible Access 方案,助力创新者以低成本、便捷的方式,在边缘侧获得先进的 AI 性能与安全保障
    的头像 发表于 10-29 15:27 1207次阅读

    降本增效与绿色制造:选择UV防漆CA6001的四大商业价值

     在竞争日益激烈的电子制造业,材料选择直接影响生产效率和最终产品的市场竞争力。本文将从不含溶剂、快速固化、全面防护和环保合规四维度,阐述施奈仕UV防漆CA6001如何为企业创造显著
    的头像 发表于 10-17 18:03 935次阅读
    降本增效与绿色制造:选择UV<b class='flag-5'>三</b>防漆CA6001的四大商业价值

    国产电源芯片的技术突破与应用:以ASP4644为例看国产替代的市场竞争力

    市场格局、技术发展趋势以及国产替代的驱动因素,探讨了ASP4644芯片在国产替代进程中的市场竞争力,旨在为国产电源芯片的技术创新与产业发展提供参考。 一、引言 电源芯片作为电子设备中的
    的头像 发表于 09-15 17:41 1649次阅读

    季丰精密引进高精度坐标测量机

    在精密机械生产领域,一丝一毫的误差便可能导致产品性能下降,甚至引发严重质量事故;而生产效率,同样是决定市场竞争力的关键。
    的头像 发表于 08-28 16:58 1091次阅读
    季丰精密引进高精度<b class='flag-5'>三</b>坐标测量机

    晶源微 CSC7137D 芯片的成本优势在哪些市场竞争中更明显?

    在小功率电源芯片领域,成本控制与性能稳定往往是企业竞争的核心战场。晶源微CSC7137D作为一款高集成度原边反馈AC/DC芯片,凭借“少元件、高效率、强适配”的特性,将成本优势精准转化为市场竞争力
    的头像 发表于 07-16 10:11 898次阅读
    晶源微 CSC7137D 芯片的成本优势在哪些<b class='flag-5'>市场竞争</b>中更明显?