0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从Arm TCS23看Arm对移动设备未来的洞察

21克888 来源:电子发烧友网 作者:黄晶晶 2023-07-03 09:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

5月29日Arm正式推出 Arm 2023 全面计算解决方案(TCS23), 包含基于全新第五代 GPU 架构、可实现终极视觉体验的全新Arm Immortalis GPU,助力 Arm 面向下一代人AI保持性能领先的全新 Armv9 CPU 集群,以及可为数百万 Arm 开发者提供更易访问软件的全新增强技术,为整个系统的关键工作负载带来了显著提升。

近日,在媒体技术日活动上,多位Arm技术专家来到现场分享了TCS23的技术特征以及智能移动设备发展的前瞻洞察。Arm 产品营销副总裁 Ian Smythe首先介绍了TCS23的整体性能优势。

全新 Armv9 Cortex 计算集群已连续三年实现两位数的性能提升。TCS23的计算集群包括超大核Cortex-X4,大核处理器 Cortex-A720 和小核 Cortex-A520。也推出了全新DSU-120 ,专门为了满足高要求的多线程用例而设计。基于第五代架构的 GPU即Immortalis-G720,专为旗舰智能手机而设计,可带来 15% 的性能提升,减少了多达 40% 的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形。提供 64 位计算性能、支持安全创新,迁移到 64 位系统的任务已经完成。Arm 的内存标记扩展MTE 功能,支持开发者在应用部署前后,都能检测和避免内存安全漏洞。Ian还表示,在接下来的几年里,我们将在包括 Krake GPU 和 Blackhawk CPU 等关键 IP 上加大投入,以满足合作伙伴对于计算和图形性能的要求。

TCS23全面计算解决方案包括工具、软件以及各种硬件产品,例如Arm 架构以及再底层的物理 IP、POP IP。TCS23在底层 IP上有了全新的更新,同时在工具上也提供了新的产品,在GPU上新品,进一步提高性能和效率。同时,Arm还推出了仅支持 64 位、且基于 Armv9.2 架构的CPU集群,提供了全新的系统级IP 以及开发工具。

全面升级CPU核,以及DSU-120支持最高多达14个内核的可扩展配置


Cortex-X4 是Arm打造过性能最快速的CPU,与 Cortex-X3 相比,Cortex-X4 的性能提高了15%,并带来可以显著降低功耗多达 40% 的高能效微架构。而面积仅增加了 10%,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。不论是更快速的即时应用响应,或是更流畅的网页浏览体验, Cortex-X4 的增强性能将为设备带来显著的升级。包括 3A 级游戏、全天候生产力和后台任务在内的用例,是移动设备中极其重要的部分,而能效则是高效运行此类用例必不可少的关键。

全新的大核处理器 Cortex-A720 和全新小核 Cortex-A520,与其上一代相比,双双在能效方面都提高了 20%。Cortex-A720 是业界主流的 CPU IP,可提高持续性能,是新 CPU 集群的核心主力,而Cortex-A520 是我们最出众的高效性能核心。

由于高端移动设备的芯片设计越来越复杂,要面对用户体验的升级、新软件功能的需求和更高性能和效率的持续突破,TCS23基于全新 Armv9.2 架构搭建,可以为客户提供突破能效和性能边界所需的前沿技术,客户可以基于 TCS23 进行不同配置,从而自行创建可扩展性高的计算解决方案。这里不仅包括智能手机,还有高端数字电视、机顶盒等等。



Arm 终端事业部产品管理高级总监Kinjal Dave谈到,在Armv9.2 计算集群中除了全新 Cortex-X4、Cortex-A720 和 Cortex-A520 CPU,还有DynamIQ Shared Unit DSU-120。全新的 DSU-120基于两年前推出的 DSU-110 开发, 针对 DSU 的各方各面进行了优化提升。 在扩展性方面,新款 DSU-120 支持最高多达 14 个的内核和更大的L3缓存,可助力构建比前代产品更强大、性能更高的 CPU 集群。无论是搭载于高性能笔记本电脑中的由十核 Cortex-X4 和四核 Cortex-A720 CPU 所组成的集群,还是用于旗舰智能手机中的由单核 Cortex-X4、四核 Cortex-A720 和四核 Cortex-A520 所组成的集群,高度可扩展的 DSU 都为 Arm 2023 全面计算解决方案(TCS23)奠定了根基。

DSU-120 还提供了全新的先进功能,例如智能节能模式,它有助于提高整个 CPU 集群的效率。更高级别的效率表现能延长特定集群所针对的任何消费电子设备的工作天数。DSU-120 还新增了24MB 和 32MB的 L3 缓存配置选项,进而使得对应集群拥有更高的性能和更低的系统功耗。



在高端数字电视和机顶盒,以及中端智能手机应用中,TCS23配置侧重于提供具有超高可扩展性的高级图形和计算性能,实现出色的用户体验。举例来说,数字电视可以具备多视图功能,例如同时在屏幕上显示视频通话、视频流应用和 AI 应用等多个任务。更高的性能还可实现先进机器学习功能,以提升相机和视频应用场景的相关用户体验。

除此之外,TCS23 为注重成本的市场准备了多款配置选择,例如由全新 Cortex-A520 提供支持的可扩展 CPU 小核集群,以及可扩展的 Mali GPU。

GPU的三大关键提升

第五代架构提高了所有 GPU 的系统级图形性能,聚焦三个关键处理趋势,即场景复杂性、更出色的图形性能和内存系统能耗功率。




随着开发者纷纷设法实现更优质的视觉效果,移动设备上的场景复杂性也呈爆炸式增长。现在面临的挑战在于,更高的场景复杂性会让几何相关的内存访问占据过多的可用带宽,并最终影响性能。

为了处理这些更复杂的场景,图形管道首先引入了延迟顶点着色 (DVS) 以重新定义 Arm GPU 中的图形数据流。DVS 利于性能随内核数增加而提升,使 Arm 的合作伙伴能够在未来达到更高的性能水平。DVS 还有助于在高度复杂的游戏场景中保持稳定帧率,同时为未来下一代的几何内容提供支持。Immortalis-G720 有助于控制 HDR 渲染中使用的高深度纹理的性能影响。DVS 的引入意味着超复杂几何形状的场景可被渲染,并可节省处理能力。

Arm认为内存系统能耗功率是导致处理器散热达到极限的主要因素。在第五代架构中,希望为 GPU 分配更多的内存系统效能以达到更好的视觉效果,同时也希望可以进一步节约能耗功率,以延长电池续航时间。

除了引入第五代架构外,Immortalis 和 Mali GPU 的整体设计在性能和效率方面也实现了大幅提升。Immortalis-G720 支持十核或更多核心,并可选用优化的物理 IP 来加速 SoC 设计。Mali-G720 和 Mali-G620 的超强可扩展性有助于为广泛的消费电子设备带来优质的图形功能,例如智能手机、笔记本电脑、数字电视、机顶盒 (STB) 和可穿戴设备。Mali-G720 可支持六到九个核心,而 Mali-G620 可支持至多五个核心,可助力 Arm授权许可合作伙伴在更多市场中实现设计工作的快速复用。



3D 场景重建是一个关键的机器学习应用场景,可以在移动 GPU上渲染真实场景的新颖视图。并且在该应用下,与 Immortalis-G715 相比,Immortalis-G720 的峰值性能提高了25%,占用的内存带宽减少了22%。

开发者可利用 Unity ML-Agents插件在游戏和模拟中训练智能代理。在 GDC 2023 上,Arm展示了在移动 SoC 上处理 100 个类似代理和复杂图形的超强表现。



Arm通过广泛的 GPU 工具和资源保持对游戏开发者的生态系统支持。可从Arm Mobile Studio免费下载多种解析、性能分析和调试工具,以帮助开发者优化其应用的性能和效率。

软件优化不可或缺

以TCS23 中的软件来看包括三大支柱,即性能、安全以及开发者的可访问性。Arm 终端事业部生态系统及工程高级总监 Geraint North详细解析了TCS23 软件部分的提升。

机器学习是软件工作中非常重要的部分,因此在 TCS23 中我们更新了软件技术库。比如 Arm NN 以及 Arm Compute Library (ACL),这些都是开源的软件技术库,开发者可以利用它来优化在 Armv9架构 CPU 和 GPU 上面机器学习的复杂性。

自 2023 年 1 月以来,Arm NN和 ACL 已经通过谷歌的 Google Play Store 在安卓系统上提供,而且已经有超过 1 亿日活跃用户。此外,到 2024 年,不管是Arm NN还是 ACL 都可以使用谷歌的移动平台,意味着开发者能够在可下载的项目,在默认状态下更新到网络最新的版本,同时意味着能在基于 Arm 架构上实现开发者获得最高可能的机器学习的潜力。

多年以来,Arm一直在大量提供不断优化中的Mali GPU,赋能开发者,为他们免费提供了强大的开发工具,从而能够让他们在基于 Mali GPU 上实现最佳效果的设计。同时Arm还与全球主要的游戏引擎工作室进行多年的合作,一起推动图形技术的进步,并且以一种非常可扩展的方式实现产品的优化。

Arm 还为开发者提供丰富的培训以及最佳实践信息文件的分享,让开发者可以在开始构建图形时不断去改善他们的创意

除此之外,Arm 还为最新的工艺节点和库优化了IP,并且利用其在 RTL 方面的专长配置物理 IP,以此在先进的技术上为基于Arm架构的产品设计、制造提供了优化的EDA流程与物理实现。

软件越多越复杂,相对应漏洞也会增长,Arm 的内存标记扩展MTE 功能通过“锁”和“密钥”的设置避免内存安全漏洞。值得一提的是,TCS23是一个完全支持64位的集群,以利用完整的64位移动生态系统的优势。

小结:

TCS23基于最新一代的Armv9.2 架构,同时基于全新的DynamIQ共享单元之上,带来更多的可扩展性和更细致的电源控制模式,确保客户在需要的时候可以获得完整的性能和带宽,在不需要的时候可以通过非常细的颗粒度去降低功率。

从Arm对TCS23的部署也能够看到解决方案的灵活性和弹性,适用于智能手机、笔记本电脑等不同领域。与此同时,对于安全性、AI运算以及生态都进行大量优化和拓展。TCS23给广大客户提供了非常好的可扩展性,以期发挥架构带来的更大优势。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388746
  • 移动设备
    +关注

    关注

    0

    文章

    521

    浏览量

    55775
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm推出面向游戏引擎的神经图形软件开发套件

    。这一开放、前瞻性的创新首次将 PC 级别的人工智能 (AI) 图形技术引入移动设备,为未来端侧 AI 的发展奠定了基础。
    的头像 发表于 11-26 11:03 199次阅读
    <b class='flag-5'>Arm</b>推出面向游戏引擎的神经图形软件开发套件

    什么是ARM架构?你需要知道的一切

    智能手机到工业边缘计算机,ARM®架构为全球数十亿台设备提供动力。ARM®以其效率优先的设计和灵活的许可模式而闻名,已迅速
    的头像 发表于 09-11 14:48 749次阅读
    什么是<b class='flag-5'>ARM</b>架构?你需要知道的一切

    Arm神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,移动设备上实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 上增添专用神经加速器的技术,首次在移动设备上实现 PC 级别的 AI 图形性能,为未来的端侧
    的头像 发表于 08-14 17:59 2524次阅读

    一文了解Arm神经超级采样 (Arm Neural Super Sampling, Arm NSS) 深入探索架构、训练和推理

    本文将从训练、网络架构到后处理和推理等方面,深入探讨 Arm 神经超级采样 (Arm Neural Super Sampling, Arm NSS) 的工作原理,希望为机器学习 (ML) 工程师和
    的头像 发表于 08-14 16:11 2493次阅读

    Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    管理总监RonanNaughton微软AI框架首席软件工程经理GeorgeWu随着人工智能(AI)成为当今个人电脑(PC)和移动设备使用体验(聊天机器人到生产力提升
    的头像 发表于 06-03 16:47 725次阅读
    <b class='flag-5'>Arm</b> 与微软合作,为基于 <b class='flag-5'>Arm</b> 架构的 PC 和<b class='flag-5'>移动</b><b class='flag-5'>设备</b>应用提供超强 AI 体验

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP
    的头像 发表于 05-29 10:12 3008次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    面向移动端市场的 ​ Arm Lumex ​ 深度解读 ​ Arm Lumex ​ 是 Arm 公司面向移动
    的头像 发表于 05-29 09:54 4054次阅读

    Arm携手微软共筑云计算和PC未来

    Arm 和微软正携手共筑未来,从而使创新不受设备功耗或不同部署环境的限制。在上周举行的微软 Build 大会上,Arm 的愿景实现再次得到体现 —— 致力于确保微软的整个软件生态系统都
    的头像 发表于 05-28 14:08 746次阅读

    国产ARM主板:自主创新的崛起与未来挑战

    以下是一篇关于国产ARM主板的详细文章,内容涵盖技术特点、市场现状、应用场景及未来趋势,适合作为技术科普或行业分析参考:一、国产ARM主板的定义与背景ARM架构因其低功耗、高能效的特点
    的头像 发表于 03-21 13:44 1005次阅读
    国产<b class='flag-5'>ARM</b>主板:自主创新的崛起与<b class='flag-5'>未来</b>挑战

    Arm解读Armv9 CPU为何是打造高性能、高能效移动计算的关键

    CPU 性能的关键指标的重要性。与主要将频率作为性能指标的做法不同,IPC 衡量的是 CPU 每个时钟周期内能处理的指令数。对于移动设备而言,电池续航和散热管理是影响实际应用、用户体验和设备处理复杂
    的头像 发表于 03-14 15:51 1317次阅读

    MWC2025亮点放送 探索Arm如何塑造移动端技术未来

    一年一度的世界移动通信大会 (MWC) 汇集行业领袖、创新者和技术爱好者,举办地西班牙巴塞罗那变身为全球技术创新中心,前沿科技在此星光熠熠。MWC 作为移动通信行业现状的晴雨表和未来趋势的风向标
    的头像 发表于 03-14 15:40 1275次阅读
    MWC2025亮点放送 探索<b class='flag-5'>Arm</b>如何塑造<b class='flag-5'>移动</b>端技术<b class='flag-5'>未来</b>

    Arm预测2025年芯片设计发展趋势

    Arm未来技术的发展方向及可能出现的趋势有着广泛而深刻的洞察。在《Arm 解析未来行业技术趋势——AI 篇》中,我们预测了该领域的 11
    的头像 发表于 01-20 09:52 1565次阅读

    Arm 技术预测:2025 年及未来的技术趋势

    专业化、互联的全球半导体供应链有着充分的了解,覆盖数据中心、物联网、汽车、智能终端等所有市场。因而,Arm未来技术的发展方向及未来几年可能出现的主要趋势有着广泛而深刻的洞察。 基于
    发表于 01-14 16:43 473次阅读
    <b class='flag-5'>Arm</b> 技术预测:2025 年及<b class='flag-5'>未来</b>的技术趋势

    ARM主板定制流程与成本

    在当今快速发展的科技环境中,定制化的硬件解决方案越来越受到企业和开发者的青睐。ARM架构作为一种高效能、低功耗的处理器架构,广泛应用于嵌入式系统、移动设备和物联网设备等领域。为了满足特
    的头像 发表于 01-06 13:21 883次阅读
    <b class='flag-5'>ARM</b>主板定制流程与成本

    2025年1000亿!Arm立了一个小目标!

    在近日深圳召开的以“让我们携手重塑未来”为主题的“ArmTechSymposia年度技术大会”上,Arm终端事业部产品管理副总裁JamesMcNiven莅临现场发表了热情洋溢的讲话,并透露了Arm
    的头像 发表于 12-17 16:43 1370次阅读
    2025年1000亿!<b class='flag-5'>Arm</b>立了一个小目标!