0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Arm发布Cortex X4,功耗可降低40%!

旺材芯片 来源:EETOP 2023-05-30 15:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

今天,ARM发布了新一代的移动处理器内核,包括Cortex-X4、Cortex-A720、Cortex-A520,预计将很快用于骁龙8 Gen 3以及天玑9300等处理器。值得一提的是,新的核心基于Arm v9.2架构,并且只支持64位指令集,不再支持32位移动应用。

13bd3cb4-fe1e-11ed-90ce-dac502259ad0.png

13d45df4-fe1e-11ed-90ce-dac502259ad0.png

Arm Cortex-X4,这是该公司的下一代旗舰性能核心,也是迄今为止设计的最高性能Arm核心。

据了解,新发布的 Cortex-X4 超大核相比 Cortex-X3 在性能上提升了 15% 左右,但是在能耗方面有比较大的改善,宣称在相同频率下可以降低 40% 的功耗。而 A720 作为 A715 性能核心的升级迭代版本,效率提升了 20%。Cortex-A520 相比上代的 Cortex-A510 效率提升 22%。

网上此前已经爆出骁龙 8 Gen 3 采用的是 1+5+2 的丛集结构,其中 "1" 指的是 Cortex-X4 超大核,而 "5" 猜测是 Cortex-A720 性能核心,而 "3" 则是 Cortex-A520 的能效核心,安兔兔跑分更是达到了 160 万分,相比骁龙 8 Gen 2 提升明显。而天玑 9300 处理器预计同样会采用 ARM 发布的新移动处理器内核,性能表现令人期待。

Arm表示,Cortex-X4的前端已经发生了一些重大变化。指令获取传递已经被完全重新设计了。与Cortex-A715一样,Cortex-X似乎也紧随其后,也完全放弃了宏操作缓冲区。相反,Cortex-X4拓宽了流水线,支持多达10条指令。指令缓存也得到了相应的增强。带宽增加到每周期10条指令。

新的分支预测器的准确性也得到了提高,在实际工作负载中观察到的停滞现象明显减少。随着指令高速缓存和宏操作高速缓存的变化,分支预测错误的惩罚被统一起来,并减少到10个周期。

后端部分也得到了增强。在执行单元的整数方面,Arm将之前几代的MUL单元更新为完整的MAC单元。这意味着X4现在有2个整数MAC单元。还增加了第三个分支单元。最后,还添加了两个额外的整数ALU,总共有8个——其中6个位于专用流水线上。

13f19388-fe1e-11ed-90ce-dac502259ad0.png

140ca1fa-fe1e-11ed-90ce-dac502259ad0.png

Cortex-X4的乱序缓冲区从Cortex-X3的320增加了20%,达到了384个。事实上,Arm每一代都会将ROB增加10%至30%左右。从一个角度来看,Cortex-X4的ROB现在比英特尔的Sunny Cove核心更大,后者只有352个条目,尽管远远不及令人惊叹的Golden Cove的512个条目ROB。

142afe02-fe1e-11ed-90ce-dac502259ad0.png

在浮点数方面,Arm对除法器/平方根单元进行了完全流水线化。管道和单元本身保持不变。

在内存子系统方面,Arm重新平衡了流水线。以前,Cortex-X3具有两个通用的地址生成单元(AGU)和一个专用的加载AGU,而现在的Cortex-X4只有一个通用AGU,同时配备了两个加载AGU和一个存储AGU。

1437c3b2-fe1e-11ed-90ce-dac502259ad0.png

Cortex-X4上的私有L2缓存也得到了扩大。系统集成商现在可以选择集成高达2 MiB的L2缓存,这将使L2缓存与上一代相比翻倍。如果需要的话,在更受限制的环境下,系统设计师可以选择使用较小的缓存大小。Arm表示,较大缓存不会增加延迟。这个选项可以在具有大内存占用的应用程序中实现更高的性能,因为它可以更频繁地引用靠近核心的内存。

144724e2-fe1e-11ed-90ce-dac502259ad0.png

总的来说,Cortex-X4在ISO频率和L3(尽管具有较大的L2缓存)方面提供了约13%的IPC改进。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • ARM
    ARM
    +关注

    关注

    135

    文章

    9499

    浏览量

    388555
  • 移动处理器
    +关注

    关注

    0

    文章

    135

    浏览量

    23439
  • 骁龙
    +关注

    关注

    2

    文章

    1055

    浏览量

    38779

原文标题:Arm发布Cortex X4,功耗可降低40%!

文章出处:【微信号:wc_ysj,微信公众号:旺材芯片】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    为什么cortex-M0+功耗低?

    功耗Cortex-M0+:优化为 2级流水线(取指+解码、执行)。 减少流水线层级,降低每个周期激活的电路规模,直接减少动态功耗。 流水线冲突概率
    发表于 11-19 08:15

    STM32C031x4/x6:面向主流应用的Arm® Cortex®-M0+ 微控制器

    STMicroelectronics的STM32C0x Arm^® ^Cortex ^®^ -M0+ 32位MCU安装了高性能Arm Cortex
    的头像 发表于 10-27 15:05 332次阅读
    STM32C031<b class='flag-5'>x4</b>/<b class='flag-5'>x</b>6:面向主流应用的<b class='flag-5'>Arm</b>® <b class='flag-5'>Cortex</b>®-M0+ 微控制器

    MSPM0G1507 80MHz Arm® Cortex-M0®+ MCU技术手册

    MSPM0G150x 微控制器 (MCU) 是 MSP 高度集成、超低功耗 32 位 MCU 系列的一部分,基于增强型 Arm Cortex-M0+ 32 位核心平台,工作频率高达 8
    的头像 发表于 09-30 09:08 578次阅读
    MSPM0G1507 80MHz <b class='flag-5'>Arm</b>® <b class='flag-5'>Cortex</b>-M0®+ MCU技术手册

    在NuMicro® Cortex M0/M4系列中使用SWD(串行线调试)时,为什么进入掉电模式后功耗不会降低呢?

    在NuMicro® Cortex M0/M4系列中使用SWD(串行线调试)时,为什么进入掉电模式后功耗不会降低
    发表于 08-29 07:40

    Texas Instruments MSPM0L110x Arm® Cortex®-M0微控制器深度解析

    Texas Instruments MSPM0L110x Arm^®^ Cortex ^®^ -M0微控制器 (MCU) 是MSP高度集成、超低功耗32位MSPM0 MCU系列的一部分
    的头像 发表于 08-25 09:56 686次阅读
    Texas Instruments MSPM0L110<b class='flag-5'>x</b> <b class='flag-5'>Arm</b>® <b class='flag-5'>Cortex</b>®-M0微控制器深度解析

    MSPM0L110x Arm Cortex-M0+微控制器技术解析

    Texas Instruments MSPM0L110x Arm^®^ Cortex ^®^ -M0微控制器 (MCU) 是MSP高度集成、超低功耗32位MSPM0 MCU系列的一部分
    的头像 发表于 08-22 14:41 771次阅读
    MSPM0L110<b class='flag-5'>x</b> <b class='flag-5'>Arm</b> <b class='flag-5'>Cortex</b>-M0+微控制器技术解析

    雅特力AT32L021系列低功耗ARM®Cortex®-M0+微控制器

    雅特力AT32L021系列低功耗ARM®Cortex®-M0+微控制器AT32L021系列是雅特力科技推出的一款高性能、低功耗ARM®
    发表于 06-05 08:58

    Analog Devices Inc. MAX32675C超低功耗Arm® Cortex®-M4F MCU数据手册

    Analog Devices MAX32675C超低功耗Arm® Cortex®-M4F MCU是高度集成的混合信号微控制器,适用于工业应用,特别适用于
    的头像 发表于 06-03 10:04 670次阅读
    Analog Devices Inc. MAX32675C超低<b class='flag-5'>功耗</b><b class='flag-5'>Arm</b>® <b class='flag-5'>Cortex</b>®-M<b class='flag-5'>4</b>F MCU数据手册

    ARM最强超大核Cortex-X925与小米玄戒O1的深度解析

    ARM Cortex-X925:架构革新与性能巅峰的全新标杆 作为ARM迄今最强大的CPU核心,Cortex-X925基于Armv9.2-A架构打造,通过三级流水线优化、23条发射
    的头像 发表于 05-23 15:29 2892次阅读

    正点原子Linux最小系统板RK3506B资料发布!超低功耗,满载功耗低发热小,实现性能与能效双突破!

    正点原子Linux最小系统板RK3506B资料发布!超低功耗,满载功耗低发热小,实现性能与能效双突破! 正点原子RK3506B开发板基于RK3506B处理器,搭载四核强芯,3
    发表于 05-15 15:27

    MAX32655低功耗Arm Cortex-M4 FPU微控制器和Bluetooth 5.2引擎技术手册

    MAX32655微控制器(MCU)是一款先进的片上系统(SoC),采用Arm Cortex ^®^ -M4F CPU,高效执行复杂的函数和算法计算,额定温度范围为-
    的头像 发表于 05-08 11:36 667次阅读
    MAX32655低<b class='flag-5'>功耗</b>、<b class='flag-5'>Arm</b> <b class='flag-5'>Cortex-M4</b> FPU微控制器和Bluetooth 5.2引擎技术手册

    HMC370LP4/370LP4E x4有源倍频器SMT技术手册

    HMC370LP4(E)是一款利用InGaP GaAs HBT技术制造而成的有源微型x4倍频器,采用4x4 mm无铅表面贴装封装。 在5V电源电压下,功率输出为0 dBm(典型值)且相对输入功率
    的头像 发表于 04-17 11:30 664次阅读
    HMC370LP<b class='flag-5'>4</b>/370LP<b class='flag-5'>4</b>E <b class='flag-5'>x4</b>有源倍频器SMT技术手册

    MSPM0G1505 80MHz Arm® Cortex-M0®+ MCU数据手册

    MSPM0G150x 微控制器 (MCU) 是 MSP 高度集成、超低功耗 32 位 MCU 系列的一部分,该系列基于增强型 Arm Cortex-M0+ 32 位内核平台,运行频率高
    的头像 发表于 04-15 14:08 873次阅读
    MSPM0G1505 80MHz <b class='flag-5'>Arm</b>® <b class='flag-5'>Cortex</b>-M0®+ MCU数据手册

    MSPM0G3106 80MHz Arm® Cortex-M0®+ MCU数据手册

    MSPM0G310x 微控制器 (MCU) 是 MSP 高度集成、超低功耗 32 位 MCU 系列的一部分,基于增强型 Arm Cortex-M0+ 32 位内核平台,运行频率高达 8
    的头像 发表于 04-15 11:44 894次阅读
    MSPM0G3106 80MHz <b class='flag-5'>Arm</b>® <b class='flag-5'>Cortex</b>-M0®+ MCU数据手册

    MSPM0C1103 24MHz Arm® Cortex-M0®+ MCU数据手册

    MSPM0C110x 微控制器 (MCU) 是 MSP 高度集成的超低功耗 32 位 MCU 系列的一部分,基于增强型 Arm Cortex-M0+ 内核平台,运行频率高达 24MHz
    的头像 发表于 04-15 09:39 1044次阅读
    MSPM0C1103 24MHz <b class='flag-5'>Arm</b>® <b class='flag-5'>Cortex</b>-M0®+ MCU数据手册