0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm解读Armv9 CPU为何是打造高性能、高能效移动计算的关键

Arm社区 来源:Arm 2025-03-14 15:51 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

作者:Arm 终端事业部产品管理高级总监 Stefan Rosinger

在之前有关 Arm Cortex-X925 CPU 的文章中,Arm 技术专家曾探讨了每时钟周期指令数 (IPC) 作为评估 CPU 性能的关键指标的重要性。与主要将频率作为性能指标的做法不同,IPC 衡量的是 CPU 每个时钟周期内能处理的指令数。对于移动设备而言,电池续航和散热管理是影响实际应用、用户体验和设备处理复杂工作负载的关键所在。因而,IPC 对于评估移动设备性能而言,至关重要。

更高的频率 ≠ 最优表现

IPC 越高,表示在一个时钟周期内执行的指令越多;即便时钟速度较慢,也能带来更好的性能。这对于内存受限的工作负载尤为重要,因为其性能会受到 CPU 外部因素的制约。更高的 IPC 使得 CPU 能以更低的频率运行,从而减少电量消耗和功耗,设备发热也会缓解。这对于需要保持稳定性能的移动设备来说,尤为有利。

虽然高频 CPU 乍听起来很有吸引力,但它并不能反映性能的全貌。频率表示 CPU 每秒完成的时钟周期数量,而 IPC 则表示每个周期所完成的工作量。事实上,最高频率很少会用到。例如,对于游戏和其他算力要求较高的工作负载来说,并不会以最大频率使用 CPU,大多数时间反而是以中档频率运行。此时的能效更高,可以延长电池续航时间并降低设备温度,而这两者是提升整体用户体验的重要指标。

在相同的时间周期内,具有更高 IPC 的 CPU 在处理实际应用和复杂工作负载时会表现出更优的性能。即便是当今具有复杂计算需求的 AI 应用(例如聊天机器人、实时语言翻译和虚拟助手),在 IPC 更高的 CPU 上运行时也会表现得更加出色。此外,就能效而言,在一个周期内执行更多的指令意味着可以更快地完成任务,使得 CPU 处于高能耗状态的时间减少,从而节省电池电量。

卓越的架构设计

在基于 Armv9 架构的 CPU 设计中,可伸缩向量扩展 (SVE2) 是提高 IPC 的关键所在。这一架构特性采用新的专用向量指令,是加速智能手机关键工作负载和应用的理想之选。

SVE2 可将 HDR 视频解码速度提高约 10%,这样用户在主流应用上观看点播视频时,能获得更长的电池续航时间。此外,通过加速常用的图像处理库,SVE2 还增强了视频通话期间用户体验的流畅度,同时提高了画面质量。其中包括更好的摄像头旋转体验,以及图像滤镜的切换和使用体验。

不仅如此,SVE2 还不受向量长度的影响,这意味着代码开发将支持更大的向量长度,例如 256 位。由此可确保与移动计算未来发展的兼容性,包括未来更注重逻辑扩展,而非 RAM 的先进工艺节点。移动端市场将因此能够适应更大的向量长度,有利于游戏和 AI 模型中 SVE 代码的呈现。

通过深入研究设计,IPC 性能可借助一系列特定的微架构改进得以提高。其中包括但不限于:

超标量乱序执行

分支预测和预取器

数据推测

适当的缓存选择

Arm Cortex CPU 一直在逐年推进各种类似的微架构改进,以实现更高的性能水平。

面向移动端的最新 Armv9 CPU

上述的架构特性和微架构提升是 Arm 面向移动端市场的最新 Armv9 CPU 的核心所在。作为 MediaTek 天玑 9400(已被搭载于 vivo X200 系列等旗舰智能手机)的核心,Cortex-X925 对私有 L2 缓存进行了升级,从 2MB 增加到 3MB。再加上 Cortex-X925 能够更加快速、高效地预取数据和复杂指令,从而显著增强了 CPU 的整体性能和能效。得益于此,Arm 计算平台在 2024 年实现了惊人的两位数 IPC 性能提升。

如此一来,终端用户能够享受到一系列实际性能的提升,包括更快的应用响应速度、更好的游戏体验、更流畅的视频流媒体传输、更快的网页浏览和顺畅的多任务处理。同时,更高的 IPC 也带来了能效的提升,延长了用户的沉浸式体验。

与此同时,Cortex-A725 作为 CPU 工作负载的主力,也进行了一系列针对性更新,着力于需要持续出色性能的关键 AI 和游戏用例。与 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。

在 Armv9.2 集群中,每个 CPU 组件都能应对广泛的实际用例和复杂的工作负载。例如,Cortex-X925 可处理应用启动和网页浏览的“突发”工作负载,而 Cortex-A725 则可以在常见的移动端用例(包括游戏、网页浏览、基于摄像头的应用和视频流媒体)中持续提供稳定性能,以延长设备的使用时间(即电量耗尽之前,用户可在设备上使用某些用例的平均时间)。

打造无可比拟的移动端体验

从根本上说,移动设备需要兼具性能与能效,而 IPC 的提升恰好能同时满足这个需求。用户因而能更长时间体验各种需要高算力的应用。最新的 Armv9 CPU 将卓越的 IPC 水平与高时钟频率相结合,将性能和能效提升到一个更高的水平,从而为最终用户带来更加出色的用户体验。这也正是为什么全球 99% 的智能手机都基于 Arm 计算平台打造的原因之一。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9618

    浏览量

    394514
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11378

    浏览量

    226480
  • IPC
    IPC
    +关注

    关注

    3

    文章

    384

    浏览量

    55139
  • 移动计算
    +关注

    关注

    0

    文章

    31

    浏览量

    10499

原文标题:内有剧透!打造高性能、高能效移动计算的关键是?

文章出处:【微信号:Arm社区,微信公众号:Arm社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Arm 推出Performix:开创AI智能体性能优化新纪元

    工具,通过深度整合Arm计算平台的性能数据洞察与优化能力,为规模化拓展高性能高能的AI智能体
    的头像 发表于 05-08 09:20 789次阅读

    探秘 ZA9L1:高性能安全 32 位 ARM 微控制器

    探秘 ZA9L1:高性能安全 32 位 ARM 微控制器 在电子设备日新月异的今天,高性能且安全的微控制器成为了众多应用领域的核心需求。今天,我们就来深入了解一下 Maxim 推出的
    的头像 发表于 04-04 15:15 673次阅读

    Arm首款自研AGI CPU尽显Arm之优!单线程释放强大性能,同等机架塞更多CPU功耗还更低

    最近,Arm 发布首款自研的数据中心 CPUArm AGI CPU,专为代理式 AI 基础设施打造,可实现单机架
    的头像 发表于 03-27 09:12 441次阅读
    <b class='flag-5'>Arm</b>首款自研AGI <b class='flag-5'>CPU</b>尽显<b class='flag-5'>Arm</b>能<b class='flag-5'>效</b>之优!单线程释放强大<b class='flag-5'>性能</b>,同等机架塞更多<b class='flag-5'>CPU</b>功耗还更低

    Arm亲自下场!自研首款数据中心AGI CPU发布!

    Arm今日发布首款由 Arm 设计的数据中心 CPU——Arm AGI CPU,专为代理式 AI 基础设施
    的头像 发表于 03-25 08:39 3238次阅读
    <b class='flag-5'>Arm</b>亲自下场!自研首款数据中心AGI <b class='flag-5'>CPU</b>发布!

    Arm率先适配腾讯混元HY-1.8B-2Bit模型

    计算平台,Arm 率先完成了对该模型的成功适配。HY-1.8B-2Bit 现已能够在搭载启用第二代可伸缩矩阵扩展 (SME2) 技术的 Armv9 计算平台的
    的头像 发表于 02-10 17:29 2179次阅读

    Arm Unlocked 2025深圳站圆满落幕

    继上海、首尔站之后,Arm Unlocked 2025 AI 技术峰会深圳站圆满落幕。在面对持续增长的人工智能 (AI) 算力需求,Arm 正持续推进“平台优先”战略,在高性能高能
    的头像 发表于 11-04 18:01 1517次阅读

    Arm Flexible Access方案引入Armv9边缘AI计算平台

    全球首个 Armv9 边缘 AI 计算平台(专为物联网及边缘 AI 工作负载优化)将纳入 Arm Flexible Access 方案,助力创新者以低成本、便捷的方式,在边缘侧获得先进的 AI
    的头像 发表于 10-29 15:27 1364次阅读

    全新Arm C1 CPU集群推动移动端侧AI转型

    速响应的应用、低延迟的 AI 助手,覆盖到高级相机功能和实时语音处理,意味着端侧 AI 体验朝向智能化、沉浸式,以及高要求等方向发展,伴随而来便是对高性能高能边缘计算的空前需求。
    的头像 发表于 09-15 14:27 2423次阅读
    全新<b class='flag-5'>Arm</b> C1 <b class='flag-5'>CPU</b>集群推动<b class='flag-5'>移动</b>端侧AI转型

    负载减少50%!Arm用AI重新定义移动端图形渲染

    是一项非常艰巨的任务。   Arm 终端事业部产品管理总监 Steve Steele 表示,Arm 始终专注于为市场提供高能计算能力,特
    发表于 08-20 08:00 4251次阅读
    负载减少50%!<b class='flag-5'>Arm</b>用AI重新定义<b class='flag-5'>移动</b>端图形渲染

    探索CPU架构的奥秘,揭秘高性能计算的隐形引擎

    的深海,揭开那些隐藏在高性能计算背后的神秘面纱。1.取指令(Fetch)程序计数器(PC):CPU通过程序计数器获取下一条指令的内存地址。指令读取:从存储器或缓存中读
    的头像 发表于 08-13 11:58 1034次阅读
    探索<b class='flag-5'>CPU</b>架构的奥秘,揭秘<b class='flag-5'>高性能</b><b class='flag-5'>计算</b>的隐形引擎

    优化电机控制以提高能

    的电机系统。 电机材料与设计的持续改进,已推动能性能取得重大突破。从非晶材料与高性能磁体的应用,到轴承技术的演进及电机体积的缩减,这些创新正引领着电机技术的未来发展。随着对新材料和新设计的不断探索
    发表于 06-11 09:57

    ARM Mali GPU 深度解读

    ARM Mali GPU 深度解读 ARM Mali 是 Arm 公司面向移动设备、嵌入式系统和基础设施市场设计的图形处理器(GPU)IP
    的头像 发表于 05-29 10:12 5169次阅读

    Arm 公司面向 PC 市场的 ​Arm Niva​ 深度解读

    面向 PC 市场的 ​ Arm Niva ​ 深度解读Arm Niva ​ 是 Arm 公司为 PC 市场推出的核心计算平台,属于其“
    的头像 发表于 05-29 09:56 1997次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、能比与开发效率上的挑战。以下从技术架构、
    的头像 发表于 05-29 09:54 4691次阅读

    Arm 公司面向汽车市场的 ​Arm Zena​ 深度解读

    面向汽车市场的 ​ Arm Zena ​ 深度解读 Arm Zena 是 Arm 公司面向智能汽车领域推出的核心计算平台,属于其“平台优先”
    的头像 发表于 05-29 09:51 2809次阅读