0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

PC上的ARM:功率还是效率?

h1654155971.8456 来源:EDA365 作者:EDA365 2020-07-03 09:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

正如人们普遍预期的那样,苹果最终宣布放弃英特尔CPU。在技术的过渡阶段,苹果在库比蒂诺将该芯片项目称为Apple Silicon。这样,作为知名品牌,Apple将其业务扩展到了CPU,而且是基于ARM架构的处理器,由TSMC制造,该公司生产的芯片几乎满足了IT领域的所有知名人士的要求。

随着苹果的高调加入,ARM又获得了一次“胜利”。实际上,高性能计算的“新巅峰”也是基于ARM处理器的。最近,富士通(Fujitsu)设计的超级计算机Fugaku,凭借峰值功率将近514 petaflops的算力,远远超过了竞争对手,成为本年TOP500超算的冠军。值得注意的是,作为一个时代的标志-第一台基于Intel的超级计算机仅排在第五位,算力约为101 petaflops。 ARM处理器在移动领域的主导地位一直是无可争议的。而Fugaku在HPC领域的成功给那些一直认为ARM可以征服服务器世界的人们带来希望。

PC上的ARM:功率还是效率?

让我们从PC世界开始,以Apple为PC和服务器的ARM芯片制造商的假设模型。并将其与其他鲜为人知的服务器领域的ARM CPU制造商进行比较。苹果已经表示,每消耗一瓦特的功率,苹果硅处理器具有很高的功率,但从未宣称它们将成为纯功率的怪物。因此,注意力转向了计算能力和能耗之间的关系。这一主题在移动世界中得到了很好的解决,但在PC世界中却一直很艰难。 许多技术观察家指出,对于苹果公司,ARM在移动领域广泛使用的Big.Little风格方法在PC领域已被“淘汰”。即生产混合CPU:具有许多核心,分为两种类型。一些功能强大但消耗量很大,而其他一些能耗较低但性能也不是很强大。Big.Little模型提供了仅在执行非常苛刻的工作负载时才激活功能最强大的内核。在其余情况下,将使用消耗较少能量的内核。 相反,传统方法将所有核心视为“通才”。最多可以变化的是活动核心的数量和峰值工作频率(对于Intel Turbo Boost等系统)。总体而言,这些情况下的能源效率较低。面向混合CPU的方法是否可以在甚至必须执行苛刻工作负载的功能强大的PC上运行?服务器呢?业界一直被这些所困惑。

图:2020年6月Top500排名的第一部分

这完全取决于具有混合CPU的PC或服务器的功能。随着处理负载的增加,“性能”内核变得越来越普遍,因为它们是运行时间最长的内核。因此,如果我们设想PC或服务器长时间承受大量负载,则低能耗内核几乎消失了。实际上,我们回到了传统的运营模式。因此,混合型CPU 对于通用计算机,笔记本电脑或台式机似乎是合理的。服务器?少得多。

数据中心的疑问

Fugaku的首要地位能否为ARM在服务器领域的普及提供积极信号?它本身当然是一个有趣的事件。但是,很难说可以从中再次推断出什么。与实际上似乎相当稳定的方案相比:那些对拥有ARM服务器感兴趣的人已经拥有了它们,其他人则留在了窗外。 Fugaku发送的信息是,对于ARM世界来说,专注于采用多核的方法是多么重要。Fugaku拥有730万核。举一个链接到更多标准ARM服务器(经典的两个插槽机架模型)的示例,Ampere的服务器基于80核Altra CPU,而128核的Altra Max 处理器也将与今年年底问世。 拥有这么多内核并不一定意味着要在地面上投入如此多的力量。必须充分利用所有可用内核,以提高效率。因此,它们必须支持高度并行的应用程序。要么是因为它们被设计为具有它,要么是因为它们在可以预见的环境中运行。就像由大量容器管理的云原生应用程序。 同时保持数十个或数百万个内核繁忙并不容易。除了工作负载并行性之外,还需要一些机制和技术,以使内核本身不会竞争访问诸如内存和存储之类的“慢”资源。此外,具有许多内核的处理器仍然很昂贵,并且在数据中心领域,这并不是节能的天才。 综合考虑所有这些因素,并理解为什么AMD比英特尔更青睐多核,并且在芯片设计上似乎更加保守。倾向于“依靠”大量支持其处理器的GPU内核。相比之下,ARM解决方案本身更多地以CPU为中心。 应该强调的是,对于意大利人来说,2020年6月的Top500排名是不错的选择。现在,在十大超级计算机中,有美国和中国系统。这次也有两个意大利的。ENI的HPC5在第六位-使其成为欧洲最强大的超级计算机 -和Cinoni的马可尼-100在第九。因此,意大利是唯一在前十名中拥有两台超级计算机的欧洲国家。
责任编辑:pj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 苹果
    +关注

    关注

    61

    文章

    24616

    浏览量

    208789
  • PC
    PC
    +关注

    关注

    9

    文章

    2169

    浏览量

    159793
  • ARM处理器
    +关注

    关注

    6

    文章

    361

    浏览量

    43397
  • 华秋DFM
    +关注

    关注

    20

    文章

    3516

    浏览量

    6554
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何更精确地测量功率转换器效率-横河WT5000

    科瑞杰-横河功率分析仪的一个主要测试应用就是测量功率转换器的效率,影响转换器效率因素有很多,如何通过设置正确的同步源让转换器效率测得更准确。
    的头像 发表于 04-24 18:24 1189次阅读
    如何更精确地测量<b class='flag-5'>功率</b>转换器<b class='flag-5'>效率</b>-横河WT5000

    使用功率分析仪 PW8001对SiC功率器件的铁路逆变器的效率评估

    使用功率分析仪 PW8001 和 AC/DC 高压分压器 VT1005,可以测量使用 SiC 功率半导体的逆变器的效率。 测试对象 支持高压输入/输出的高效率逆变器 问题 用于铁路等运
    的头像 发表于 04-24 16:34 196次阅读
    使用<b class='flag-5'>功率</b>分析仪 PW8001对SiC<b class='flag-5'>功率</b>器件的铁路逆变器的<b class='flag-5'>效率</b>评估

    Cadence在Arm Neoverse扩展其EDA产品组合

    随着人工智能的普及,全球对计算能力永无止境的需求只会持续增长。随着计算需求的增长,由于片系统 (SoC) 复杂性增加、上市时间缩短以及对每瓦能耗效率和每瓦性能提升的需求,本地芯片设计变得更加复杂
    的头像 发表于 03-18 15:23 2255次阅读
    Cadence在<b class='flag-5'>Arm</b> Neoverse<b class='flag-5'>上</b>扩展其EDA产品组合

    MWC 2026 | 广和通率先实现新一代模组功率等级1(PC1),赋能高功率FWA应用

    3月4日,在2026年世界移动通信大会(MWC 2026),广和通宣布率先实现基于MediaTek T930平台以及高通X85/X82平台模组功率等级1(Power Class 1, 简称PC1)的技术落地。
    的头像 发表于 03-06 22:46 650次阅读
    MWC 2026 | 广和通率先实现新一代模组<b class='flag-5'>功率</b>等级1(<b class='flag-5'>PC</b>1),赋能高<b class='flag-5'>功率</b>FWA应用

    MWC 2026 | 广和通率先实现新一代模组功率等级1(PC1),赋能高功率FWA应用

    3 月4日,在 2026年世界移动通信大会(MWC 2026),广和通宣布率先实现基于 Media T ek  T930平台以及 高通 X85/X82平台模组功率等级1(Power Class 1
    的头像 发表于 03-05 09:39 561次阅读

    单核性能提升35%!剑指中高端AI PC市场,骁龙X2 Plus CES

    Windows on Arm平台的主流及中档笔记本市场,以高性能、低功耗和高算力,挑战英特尔和AMD在PC领域的市场地位。
    的头像 发表于 01-06 15:01 1.3w次阅读
    单核性能提升35%!剑指中高端AI <b class='flag-5'>PC</b>市场,骁龙X2 Plus CES<b class='flag-5'>上</b>新

    PC1060内置GaN功率因数校正转换芯片技术手册

    PC1060 是一款工作在临界模式和断续模式的功率因数校正芯片,重载工作在临界导通模式,在负载减轻时无缝切换到断续导通模式。芯片内置了 700V/101mΩ低内阻氮化镓功率管,芯片内置软启动、输入欠
    发表于 12-02 16:24 0次下载

    Arm神经技术是业界首创在 Arm GPU 增添专用神经加速器的技术,移动设备实现PC级别的AI图形性能

    Arm 神经技术是业界首创在 Arm GPU 增添专用神经加速器的技术,首次在移动设备实现 PC 级别的 AI 图形性能,为未来的端侧
    的头像 发表于 08-14 17:59 2954次阅读

    Arm Neoverse N2平台实现DeepSeek-R1满血版部署

    今年年初,开源大语言模型 (LLM) DeepSeek 在国内外人工智能 (AI) LLM 领域掀起热议。它在模型架构和训练、推理方法实现创新,在性能和工程效率带来了显著提升,并在成本效率
    的头像 发表于 07-03 14:37 1463次阅读
    <b class='flag-5'>Arm</b> Neoverse N2平台实现DeepSeek-R1满血版部署

    Arm 与微软合作,为基于 Arm 架构的 PC 和移动设备应用提供超强 AI 体验

    ArmKleidiAI与ONNXRuntime的集成,为Windows和安卓操作系统带来了显著的AI性能优化,实现高达2.6倍的AI推理速度提升,从而加速应用体验。联合作者:Arm终端事业部产品
    的头像 发表于 06-03 16:47 1019次阅读
    <b class='flag-5'>Arm</b> 与微软合作,为基于 <b class='flag-5'>Arm</b> 架构的 <b class='flag-5'>PC</b> 和移动设备应用提供超强 AI 体验

    Arm 公司面向 PC 市场的 ​Arm Niva​ 深度解读

    面向 PC 市场的 ​ Arm Niva ​ 深度解读 ​ Arm Niva ​ 是 Arm 公司为 PC 市场推出的核心计算平台,属于其“
    的头像 发表于 05-29 09:56 1923次阅读

    Arm 公司面向移动端市场的 ​Arm Lumex​ 深度解读

    子系统(CSS)​ ​ 在移动端的落地形态,Lumex 旨在通过高度集成化的软硬件方案,解决移动设备在 AI 性能、能效比与开发效率的挑战。以下从技术架构、性能突破、应用场景、生态系统及战略价值展开分析: 一、技术架构:异构计算与能效优化 Lumex 基于 ​ Armv
    的头像 发表于 05-29 09:54 4616次阅读

    Arm携手微软共筑云计算和PC未来

    计算平台并从中受益。无论是在 Microsoft Azure 的云端还是在 Windows on Arm PC 的边缘侧,开发者可以在任何地方加速其应用和工作负载。
    的头像 发表于 05-28 14:08 1081次阅读

    Arm与微软合作加速边缘设备的AI体验

    随着人工智能 (AI) 成为当今个人电脑 (PC) 和移动设备使用体验(从聊天机器人到生产力提升)中不可或缺的一部分,这些设备对 CPU 高效、可扩展的推理需求也在持续增长。Arm 与微软正携手合作
    的头像 发表于 05-28 13:54 954次阅读

    PC4213大功率异步降压控制芯片中文手册

    /90mΩ功率管支持3A电流输出可通过设置FB引脚的分压电阻可设置输出恒值.PC4213采用固定频率的PWM 控制方式,典型开关频率为100KHz。轻载时会进入跳周期模式以获得高转换效率PC
    发表于 05-20 16:25 0次下载