0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从Arm TCS23看Arm对移动设备未来的洞察

21克888 来源:电子发烧友网 作者:黄晶晶 2023-07-03 09:46 次阅读

5月29日Arm正式推出 Arm 2023 全面计算解决方案(TCS23), 包含基于全新第五代 GPU 架构、可实现终极视觉体验的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能领先的全新 Armv9 CPU 集群,以及可为数百万 Arm 开发者提供更易访问软件的全新增强技术,为整个系统的关键工作负载带来了显著提升。

近日,在媒体技术日活动上,多位Arm技术专家来到现场分享了TCS23的技术特征以及智能移动设备发展的前瞻洞察。Arm 产品营销副总裁 Ian Smythe首先介绍了TCS23的整体性能优势。

全新 Armv9 Cortex 计算集群已连续三年实现两位数的性能提升。TCS23的计算集群包括超大核Cortex-X4,大核处理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,专门为了满足高要求的多线程用例而设计。基于第五代架构的 GPU即Immortalis-G720,专为旗舰智能手机而设计,可带来 15% 的性能提升,减少了多达 40% 的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形。提供 64 位计算性能、支持安全创新,迁移到 64 位系统的任务已经完成。Arm 的内存标记扩展MTE 功能,支持开发者在应用部署前后,都能检测和避免内存安全漏洞。Ian还表示,在接下来的几年里,我们将在包括 Krake GPU 和 Blackhawk CPU 等关键 IP 上加大投入,以满足合作伙伴对于计算和图形性能的要求。

TCS23全面计算解决方案包括工具、软件以及各种硬件产品,例如Arm 架构以及再底层的物理 IP、POP IP。TCS23在底层 IP上有了全新的更新,同时在工具上也提供了新的产品,在GPU上新品,进一步提高性能和效率。同时,Arm还推出了仅支持 64 位、且基于 Armv9.2 架构的CPU集群,提供了全新的系统级IP 以及开发工具。

全面升级CPU核,以及DSU-120支持最高多达14个内核的可扩展配置


Cortex-X4 是Arm打造过性能最快速的CPU,与 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并带来可以显著降低功耗多达 40% 的高能效微架构。而面积仅增加了 10%,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。不论是更快速的即时应用响应,或是更流畅的网页浏览体验, Cortex-X4 的增强性能将为设备带来显著的升级。包括 3A 级游戏、全天候生产力和后台任务在内的用例,是移动设备中极其重要的部分,而能效则是高效运行此类用例必不可少的关键。

全新的大核处理器 Cortex-A720 和全新小核 Cortex-A520,与其上一代相比,双双在能效方面都提高了 20%。Cortex-A720 是业界主流的 CPU IP,可提高持续性能,是新 CPU 集群的核心主力,而Cortex-A520 是我们最出众的高效性能核心。

由于高端移动设备的芯片设计越来越复杂,要面对用户体验的升级、新软件功能的需求和更高性能和效率的持续突破,TCS23基于全新 Armv9.2 架构搭建,可以为客户提供突破能效和性能边界所需的前沿技术,客户可以基于 TCS23 进行不同配置,从而自行创建可扩展性高的计算解决方案。这里不仅包括智能手机,还有高端数字电视、机顶盒等等。



Arm 终端事业部产品管理高级总监Kinjal Dave谈到,在Armv9.2 计算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,还有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于两年前推出的 DSU-110 开发, 针对 DSU 的各方各面进行了优化提升。 在扩展性方面,新款 DSU-120 支持最高多达 14 个的内核和更大的L3缓存,可助力构建比前代产品更强大、性能更高的 CPU 集群。无论是搭载于高性能笔记本电脑中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所组成的集群,还是用于旗舰智能手机中的由单核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所组成的集群,高度可扩展的 DSU 都为 Arm 2023 全面计算解决方案(TCS23)奠定了根基。

DSU-120 还提供了全新的先进功能,例如智能节能模式,它有助于提高整个 CPU 集群的效率。更高级别的效率表现能延长特定集群所针对的任何消费电子设备的工作天数。DSU-120 还新增了24MB 和 32MB的 L3 缓存配置选项,进而使得对应集群拥有更高的性能和更低的系统功耗。



在高端数字电视和机顶盒,以及中端智能手机应用中,TCS23配置侧重于提供具有超高可扩展性的高级图形和计算性能,实现出色的用户体验。举例来说,数字电视可以具备多视图功能,例如同时在屏幕上显示视频通话、视频流应用和 AI 应用等多个任务。更高的性能还可实现先进机器学习功能,以提升相机和视频应用场景的相关用户体验。

除此之外,TCS23 为注重成本的市场准备了多款配置选择,例如由全新 Cortex-A520 提供支持的可扩展 CPU 小核集群,以及可扩展的 Mali GPU。

GPU的三大关键提升

第五代架构提高了所有 GPU 的系统级图形性能,聚焦三个关键处理趋势,即场景复杂性、更出色的图形性能和内存系统能耗功率。




随着开发者纷纷设法实现更优质的视觉效果,移动设备上的场景复杂性也呈爆炸式增长。现在面临的挑战在于,更高的场景复杂性会让几何相关的内存访问占据过多的可用带宽,并最终影响性能。

为了处理这些更复杂的场景,图形管道首先引入了延迟顶点着色 (DVS) 以重新定义 Arm GPU 中的图形数据流。DVS 利于性能随内核数增加而提升,使 Arm 的合作伙伴能够在未来达到更高的性能水平。DVS 还有助于在高度复杂的游戏场景中保持稳定帧率,同时为未来下一代的几何内容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度纹理的性能影响。DVS 的引入意味着超复杂几何形状的场景可被渲染,并可节省处理能力。

Arm认为内存系统能耗功率是导致处理器散热达到极限的主要因素。在第五代架构中,希望为 GPU 分配更多的内存系统效能以达到更好的视觉效果,同时也希望可以进一步节约能耗功率,以延长电池续航时间。

除了引入第五代架构外,Immortalis 和 Mali GPU 的整体设计在性能和效率方面也实现了大幅提升。Immortalis-G720 支持十核或更多核心,并可选用优化的物理 IP 来加速 SoC 设计。Mali-G720 和 Mali-G620 的超强可扩展性有助于为广泛的消费电子设备带来优质的图形功能,例如智能手机、笔记本电脑、数字电视、机顶盒 (STB) 和可穿戴设备。Mali-G720 可支持六到九个核心,而 Mali-G620 可支持至多五个核心,可助力 Arm授权许可合作伙伴在更多市场中实现设计工作的快速复用。



3D 场景重建是一个关键的机器学习应用场景,可以在移动 GPU上渲染真实场景的新颖视图。并且在该应用下,与 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的内存带宽减少了22%。

开发者可利用 Unity ML-Agents插件在游戏和模拟中训练智能代理。在 GDC 2023 上,Arm展示了在移动 SoC 上处理 100 个类似代理和复杂图形的超强表现。



Arm通过广泛的 GPU 工具和资源保持对游戏开发者的生态系统支持。可从Arm Mobile Studio免费下载多种解析、性能分析和调试工具,以帮助开发者优化其应用的性能和效率。

软件优化不可或缺

以TCS23 中的软件来看包括三大支柱,即性能、安全以及开发者的可访问性。Arm 终端事业部生态系统及工程高级总监 Geraint North详细解析了TCS23 软件部分的提升。

机器学习是软件工作中非常重要的部分,因此在 TCS23 中我们更新了软件技术库。比如 Arm NN 以及 Arm Compute Library (ACL),这些都是开源的软件技术库,开发者可以利用它来优化在 Armv9架构 CPU 和 GPU 上面机器学习的复杂性。

自 2023 年 1 月以来,Arm NN和 ACL 已经通过谷歌的 Google Play Store 在安卓系统上提供,而且已经有超过 1 亿日活跃用户。此外,到 2024 年,不管是Arm NN还是 ACL 都可以使用谷歌的移动平台,意味着开发者能够在可下载的项目,在默认状态下更新到网络最新的版本,同时意味着能在基于 Arm 架构上实现开发者获得最高可能的机器学习的潜力。

多年以来,Arm一直在大量提供不断优化中的Mali GPU,赋能开发者,为他们免费提供了强大的开发工具,从而能够让他们在基于 Mali GPU 上实现最佳效果的设计。同时Arm还与全球主要的游戏引擎工作室进行多年的合作,一起推动图形技术的进步,并且以一种非常可扩展的方式实现产品的优化。

Arm 还为开发者提供丰富的培训以及最佳实践信息文件的分享,让开发者可以在开始构建图形时不断去改善他们的创意

除此之外,Arm 还为最新的工艺节点和库优化了IP,并且利用其在 RTL 方面的专长配置物理 IP,以此在先进的技术上为基于Arm架构的产品设计、制造提供了优化的EDA流程与物理实现。

软件越多越复杂,相对应漏洞也会增长,Arm 的内存标记扩展MTE 功能通过“锁”和“密钥”的设置避免内存安全漏洞。值得一提的是,TCS23是一个完全支持64位的集群,以利用完整的64位移动生态系统的优势。

小结:

TCS23基于最新一代的Armv9.2 架构,同时基于全新的DynamIQ共享单元之上,带来更多的可扩展性和更细致的电源控制模式,确保客户在需要的时候可以获得完整的性能和带宽,在不需要的时候可以通过非常细的颗粒度去降低功率。

从Arm对TCS23的部署也能够看到解决方案的灵活性和弹性,适用于智能手机、笔记本电脑等不同领域。与此同时,对于安全性、AI运算以及生态都进行大量优化和拓展。TCS23给广大客户提供了非常好的可扩展性,以期发挥架构带来的更大优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    134

    文章

    8653

    浏览量

    361832
  • 移动设备
    +关注

    关注

    0

    文章

    466

    浏览量

    54237
收藏 人收藏

    评论

    相关推荐

    一文读懂RISC-V与ARM

    RISC-V和ARM是近年来备受关注的两种处理器架构。RISC-V是一种基于精简指令集计算(RISC)原理的开源指令集架构(ISA),而ARM是一种专有ISA,由于其长期存在于嵌入式系统和移动
    的头像 发表于 04-08 11:14 176次阅读
    一文读懂RISC-V与<b class='flag-5'>ARM</b>

    TCS23的软件栈和FVP加速移动生态的产品开发方案一览

    今年五月,Arm 发布了 2023 全面计算解决方案 (TCS23)。TCS23 是面向移动计算的完整 IP 组合,也是我们有史以来最佳的面向智能手机的高端解决方案。
    的头像 发表于 12-13 16:37 228次阅读
    <b class='flag-5'>TCS23</b>的软件栈和FVP加速<b class='flag-5'>移动</b>生态的产品开发方案一览

    Arm笃定服务器市场,定制化芯片构建基础设施的未来

    ”为主题,围绕人工智能、机器学习、物联网、基础设施、汽车、终端、移动计算等行业热点话题展开。在此次大会上,Arm传递出对于服务器市场的处理器技术以及合作生态的最新洞察,并介绍了所推出的相关技术产品以大力支持基础设施的加速建设。
    的头像 发表于 12-04 14:42 957次阅读
    <b class='flag-5'>Arm</b>笃定服务器市场,定制化芯片构建基础设施的<b class='flag-5'>未来</b>

    Arm携手MediaTek和vivo将TCS23运用于新一代旗舰智能手机

    2023 年五月,Arm 宣布推出移动计算平台——2023 全面计算解决方案 (Arm TCS23)。
    的头像 发表于 11-29 10:09 327次阅读

    MiniARM M23A ARM嵌入式工业控制模块手册

    电子发烧友网站提供《MiniARM M23A ARM嵌入式工业控制模块手册.pdf》资料免费下载
    发表于 10-09 16:21 0次下载
    MiniARM M<b class='flag-5'>23</b>A <b class='flag-5'>ARM</b>嵌入式工业控制模块手册

    Arm中国”是障碍吗?Arm未来是光明的

    Arm面临重大挑战,包括估值过高和增长预测不确定。
    的头像 发表于 08-29 09:54 631次阅读

    ARM Cortex-M23设备通用用户指南

    Cortex-M23处理器是一款入门级32位ARM Cortex处理器,专为各种嵌入式应用而设计。 它为开发人员提供了显著的好处,包括: ·简单的架构,易于学习和编程。 ·超低功耗、高能效运行
    发表于 08-23 07:35

    Arm芯片的下一站是PC市场吗?

    ‍‍‍‍‍‍‍‍‍‍‍‍随着 Arm 架构芯片在移动设备、嵌入式设备中的普及,凭借算力、功耗、生态上的快速发展,Arm 架构芯片正大举进攻高
    发表于 07-22 15:26 386次阅读
    <b class='flag-5'>Arm</b>芯片的下一站是PC市场吗?

    移动设备部署机器学习,Arm谈如何赋能移动AI

    计算解决方案 (TCS23) 持续引领这样的应用趋势。在最近,Arm高级副总裁兼终端事业部总经理Chris Bergey接受媒体采访,分享了Arm移动AI发展的看法以及
    的头像 发表于 07-07 14:47 418次阅读
    <b class='flag-5'>移动</b><b class='flag-5'>设备</b>部署机器学习,<b class='flag-5'>Arm</b>谈如何赋能<b class='flag-5'>移动</b>AI

    ArmTCS23参考设计,看明年的手机性能提升

    其实Arm前一阵已经正式发布了TCS23(Total Compute Solutions 23)平台,以及对应的IP产品,包括Cortex-X4、A720、A520这些Armv9架构的CPU IP
    的头像 发表于 07-02 08:46 565次阅读
    从<b class='flag-5'>Arm</b>的<b class='flag-5'>TCS23</b>参考设计,看明年的手机性能提升

    Arm TCS23现迄今最快处理器IP组合,前瞻定义旗舰手机SoC性能,为生成式AI而来

    最近Arm推出2023 全面计算解决方案(TCS23),发布最新CPU和GPU IP等产品。没有意外,高通和联发科的下一代旗舰手机SoC将采用Arm最新的CPU架构Cortex-X4,并且联发科还将
    的头像 发表于 06-05 16:16 1311次阅读
    <b class='flag-5'>Arm</b> <b class='flag-5'>TCS23</b>现迄今最快处理器IP组合,前瞻定义旗舰手机SoC性能,为生成式AI而来

    Cadence与Arm合作通过其新的全面计算解决方案(Total Compute Solutions)加速移动设备芯片的开发

      内容提要: 新推出的 Arm TCS23 和 Cadence 工具为芯片流片提供了捷径 Cadence 对其 RTL-to-GDS 数字流程进行了精细优化,为 Arm Cortex-X4
    发表于 06-03 09:44 351次阅读

    全新的Arm全面计算解决方案实现基于Arm技术的移动未来

    Arm® 今日宣布推出 2023 全面计算解决方案(TCS23),该解决方案将成为最重要的移动计算平台,为智能手机带来绝佳的解决方案。TCS23 提供一整套针对特定工作负载而设计与优化
    的头像 发表于 05-30 15:46 303次阅读
    全新的<b class='flag-5'>Arm</b>全面计算解决方案实现基于<b class='flag-5'>Arm</b>技术的<b class='flag-5'>移动</b><b class='flag-5'>未来</b>

    全新的Arm全面计算解决方案实现基于Arm技术的移动未来

    Arm 高级副总裁兼终端事业部总经理 Chris Bergey 表示:“TCS23包含了基于全新第五代 GPU 架构、可实现终极视觉体验的全新Arm Immortalis GPU,助力 Ar
    的头像 发表于 05-30 15:37 342次阅读
    全新的<b class='flag-5'>Arm</b>全面计算解决方案实现基于<b class='flag-5'>Arm</b>技术的<b class='flag-5'>移动</b><b class='flag-5'>未来</b>

    如何使用ESP8266和TAOS TCS23的颜色识别板?

    我设法使用 ESP8266 和 TAOS TCS230 颜色识别模块实现了颜色识别板。我必须采取一些技巧才能让 GPIO 能够处理方波输入和频率,但最终让它工作并实现了原型板。这是项目的描述
    发表于 05-24 08:46