0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm十年最大升级的V9架构,剑指全面计算,CPU、GPU、系统IP三连发!

花茶晶晶 来源:电子发烧友网 作者:黄晶晶 2021-05-27 17:54 次阅读

电子发烧友网报道(文/黄晶晶)今年初,Arm公司发布Armv9架构,这是Arm公司十年来最重大的架构发布。随后,Arm发布了基于V9架构的面向服务器领域的处理器IP Neoverse V1和N2。

近日,Arm再次发布基于V9架构的一系列处理器IP,其中包括Cortex-X2、Cortex-A710、Cortex-A510等,以及Mali GPU IP、系统IP等。我们熟知的此前采用X1架构的处理器主要用于智能手机,而X2也将在今后用于提升智能手机的处理器性能。Arm高级副总裁兼终端事业部总经理Paul Williamson表示,Arm致力于打造全面计算解决方案,面向未来的计算时代,我们不能再简单地用PPA来衡量计算的性能。

Arm Cortex-X2、Arm Cortex-A710、Arm Cortex-A510,CPU全面升级

Arm Cortex-X2是Arm目前性能最强大的CPU,相比较X1它的性能提升16%。除了峰值性能外,Cortex-X2 还可在旗舰智能手机和笔记本电脑之间扩展,使Arm的合作伙伴可以根据市场需求来设计基于不同场景的计算能力。

Arm Cortex-A710是首款基于Armv9架构的大核CPU,与Cortex-A78相比,能效提升30% ,性能提升10%,机器学习性能翻倍。通过这些性能和效率的提升,当智能手机运行高要求的app时,用户将获得比以往更长的使用时间以及更优化的用户体验。



Arm Cortex-A510是Arm过去四年来推出的首款高效率小核,其性能提升35%,机器学习性能提升超过三倍。它所带来的性能水平已经接近几年前推出的上一代大核,这里前一代大核指的是Cortex-A73。与Cortex-A73相比,它的性能差距不到10%,但性能优化可达35%,因此非常高效的。它适用于智能手机、家用设备和可穿戴设备。

关于向64位过渡

Arm的计划是预计到2023年,Arm在移动应用的大核跟小核都将仅支持64位。目前,Cortex-X2、Cortex-A510已经是64位CPU,A710仍然支持32位。Arm高管表示,目前我们正持续与中国的手机应用商店合作伙伴密切携手,来分阶段实现向64位的过渡。另外,我们今天所宣布的64位迁移只是针对拥有丰富用户体验的移动应用领域。

Armv9-A CPU群集(cluster)

Armv9-A CPU 群集(cluster)的支柱是新款的动态共享单元( DynamIQ Shared Unit)DSU-110,该组件可为不同的细分市场提供各种解决方案。DSU-110 具备可扩展性、可支持多达八个 Cortex-X2内核配置的出色性能、安全性和机器学习功能,同时还能确保效率表现。基于Armv9-A CPU cluster的设备将在2022年发布。

在cluster中,通过Cortex-X2,达到30%峰值性能的提升,带来更快速、旗舰的用户体验,Cortex-A710 将实现高达30%的能效提升,这将改善智能手机持续使用的场景性能,例如游戏。小核Cortex-A510,它将提供35%的性能提升,不仅有助于提升cluster中多核性能的表现,也会提高日常任务的效率,例如浏览社交媒体新内容或是邮件。

Arm Mali GPU连续五年,年出货量超过十亿

2020年Mali GPU出货超过十亿个,这是连续第五年Mali的年出货量超过十亿。数据显示,Mali GPU驱动着80%的电视、超过半数的智能手机。它提供了最佳的手游、新的AI技术和应用程序的体验,同时强化了家庭娱乐与增强现实技术应用。



具体来看,新款Arm Mali-G710是针对旗舰智能手机和不断增长的Chromebook笔记本市场所推出的高性能GPU,在计算密集型体验方面(如 AAA 高保真游戏)的性能提升20%。对于各种与机器学习有关的任务(如全新相机和视频模式的图像增强),Mali-G710也带来了 35%的机器学习性能提升。

次旗舰GPUArm Mali-G610继承了Mali-G710的所有功能,但价格更低。Arm Mali-G510实现了性能和效率的完美平衡,在中端智能手机、旗舰智能电视和机顶盒上,实现了100%的性能提升以及22%的节能优化 ,从而延长了电池续航时间,提升了100%的机器学习性能。

Arm Mali-G310是Arm最高效的GPU,以最小的面积成本提供了最高的性能。通过 Mali-G310, Valhall 架构和高质量图形技术将被引入到更低成本的设备中,例如入门级智能手机、AR设备和可穿戴设备。

系统IP——CoreLink 700是全面计算的一部分

为了完善Armv9全面计算解决方案,也需要系统IP——CoreLink 700,它由基于大规模云计算部署互联技术的经验所构建,并针对CPU与GPU的需求量身打造。


它拥有Armv9的功能,例如内存标签扩展,它能带来改进的带宽和更短的时延,并为各档次的终端计算设备释放性能表现。

全面计算怎么理解?

Arm 全新的全面计算解决方案采用系统范围的整体优化方法,横跨硬件IP、物理 IP、软件、工具和标准,为Arm的合作伙伴提供更为广泛的选择,满足所有终端细分市场的应用场景和成本区间。

全面计算解决方案也将解锁整个生态系统的新体验,例如,专为移动设备设计、支持AI功能的交互式应用场景,可以使用户身临其境观看电视中丰富的8K内容。所有的这一切再加上安全技术作为基础,将为未来十年构建可信的数字化服务。

这些解决方案的核心是Arm的全新IP套件,包括首批 Armv9 Cortex CPU、具有出色图形功能的MaliGPU和全新的CoreLink系统IP。

当被问及目前Arm全面计算在哪些应用场景中拥有更高的接受度时,Arm高管表示,在终端领域,一部分是通过全面计算获得高性能的应用场景,比如游戏生态和拥有丰富人工智能功能的应用。还有一些是涉及安全功能的应用场景,如说安全交易、银行类的应用以及设备端个人数据保护等,Arm全面计算解决方案可以有效提升这些应用场景的安全性。还有,全面计算解决方案使我们生态系统中的所有软件开发者可以轻松地解锁最新设备上的性能。

提升游戏场景

以游戏为例,经测试的整个游戏内容中全面计算系统优化的结果显示,Cortex-A710 CPU在运行驱动工作负载时,带来了33%的性能提升;Mali-G710带来了20%的性能提升,系统级IP 提供了15%的效率提升。

以系统级满足AI多样化需求

Arm高管指出,如今AI的需求非常多样化,他们试图使用系统级方式满足全部的需求,全面计算解决文案很好地整合了Arm所有处理器所具有的强大AI功能。在不同的Arm IP上运行多样的AI工作负载带来不同的性能提升,例如Mali-G710平均35%的提升,Cortex-M55 高达700%的提升,注意这是针对能耗局限工作负载,例如关键字侦测等。



一般来说,以往的算力都会根据一些针对IP的系统运行标准进行衡量,而具体到全面计算解决方案,我们会根据现实世界的广泛用例进行衡量,例如,通过在Arm全面计算解决方案中使用系统级缓存功能,可以降低15%的系统能耗。

安全升级

安全是Armv9重要的功能之一,它过Armv9 技术引入到每一个设备中。例如Arm与谷歌共同开发的内存标签扩展等技术,它们能让开发者更易于辨识和预防内存安全问题。

在Arm成熟的TrustZone技术的基础上,安全的EL2能将TrustZone技术提升到新的水平,让独立安全的app相互隔离,减少黑客攻击。

小结:

Armv9架构是Arm十年来最大的升级,早前Arm已经表示它将是面向未来十年的计算基础。可以清晰地看到,此次面向终端设备发布的一系列产品,不仅在于提升处理器的性能,也在安全、人工智能方面融入了更多,这是Arm做为IP厂商以前瞻的眼光定义的未来,它以更灵活的方式满足终端设备的需求。

作者:黄晶晶 微信号:kittyhjj 欢迎交流!

本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8648

    浏览量

    361757
  • IP
    IP
    +关注

    关注

    5

    文章

    1403

    浏览量

    148269
  • V9
    V9
    +关注

    关注

    0

    文章

    2

    浏览量

    6062
收藏 人收藏

    评论

    相关推荐

    如何将CubeMX生成的FreeRTOS V9工程升级成FreeRTOS V10?

    发现CubeMX 自带的 FreeRTOS 版本太旧了, 是V9 而最新的FreeRTOS 是V10 而且调试起来 V9 配合MDK的V5 编译器 总会出现奇怪问题, 所以希望换到Fr
    发表于 04-25 07:08

    AMD计划生产基于Arm架构CPU

    英伟达已经开始设计基于 Arm 架构CPU。该处理器将运行微软 Windows 操作系统。此外,AMD 也计划生产基于 Arm
    的头像 发表于 10-27 10:53 670次阅读

    JLINKV8和V9的主要区别是什么?

    JlinkV8和V9的主要区别是什么
    发表于 10-10 08:24

    谈一谈ARM上市与RISC-V

    9月14日,世界上最知名的芯片IP公司Arm于纳斯达克挂牌交易。本次IPO,Arm公布的发行价格为51美元/股,发行市值约为540亿美元,最终收于63.59美元,完全摊薄后估值达到67
    发表于 09-30 12:22

    BM1684架构介绍

    一、概述 一图胜千言,先po一张架构图,如下所示: 二、TPU架构 2.1 DTCM DTCM是TPU内部的MCU ARM9的高速缓存空间(512KB),类似于CPU中的L1
    发表于 09-19 08:11

    异构计算场景下构建可信执行环境

    、Amdahl’s Law等定律也在逐步放缓或失效,这预示了计算结构将发生改变。计算结构会如何变化呢?目前主要有3类观点:1.近十年会发生架构的变化,即异构;2.近二
    发表于 08-15 17:35

    Arm Mali™ GPU OpenCL开发者指南

    Arm®生产马里家庭™ GPU。Bifrost、Valhall和第五代是马里的个™ GPU架构。 马里™
    发表于 08-10 07:47

    ARM领域管理扩展(RME)系统架构介绍

    本章介绍Realm Management Extension(RME)系统架构。RME架构是在[1]中指定,并且被定义为Armv9体系结构的A轮廓的扩展。 RME体系结构定义了符合
    发表于 08-09 07:52

    Gaudi2架构和软件的全面解释

    ,Gaudi2以其架构为基础,为数据中心和云的深度学习带来了新的性能和效率。 Gaudi2由SynapseAI®软件套件支持,该软件套件与TensorFlow和PyTorch框架集成。我们在哈瓦那的GitHub
    发表于 08-04 06:15

    基于磁贴的GPU架构优缺点

    本指南介绍了基于磁贴的GPU架构的优缺点。它还将ARM马里基于瓷砖的GPU架构设计与台式PC或控制台中常见的更传统的即时模式
    发表于 08-02 12:54

    两大架构RISC-VARM 的各种关系

    一、RISC-VARM 的相似之处 RISC-VARM 基本上都是 RISC(精简指令集计算机)。RISC-
    发表于 06-21 20:31

    Arm TCS23现迄今最快处理器IP组合,前瞻定义旗舰手机SoC性能,为生成式AI而来

    最近Arm推出2023 全面计算解决方案(TCS23),发布最新CPUGPU IP等产品。没有
    的头像 发表于 06-05 16:16 1306次阅读
    <b class='flag-5'>Arm</b> TCS23现迄今最快处理器<b class='flag-5'>IP</b>组合,前瞻定义旗舰手机SoC性能,为生成式AI而来

    RISC-V,正在摆脱低端

    在PC时代,Intel凭借X86架构称霸了PC市场数十年,但X86架构不对外授权,全球仅有Intel、AMD等少数几家公司可以使用这一架构研发芯片;移动互联网时代,
    发表于 05-30 14:11

    下一代天玑旗舰移动芯片将采用 Arm 最新 CPUGPU IP

    MediaTek 下一代天玑旗舰移动芯片将采用 Arm 最新 CPUGPU IP — Cortex-X4、Cortex-A720 以及Immortalis-G720
    的头像 发表于 05-29 22:30 456次阅读

    Arm Cortex-X4推进了CPU性能的前沿领域

    和Cortex-X3 CPU的IPC性能提高到两位数,这些CPU是在Armv9架构上建立的。所有的Cortex-X CPU都是我们Corte
    发表于 05-29 18:25