0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

强悍的AWS Graviton4处理器及其背后的Arm Neoverse

Felix分析 来源:电子发烧友 作者:吴子鹏 2024-12-19 00:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)在今年的亚马逊re:Invent 2024大会上,该公司正式对外发布了旗下第四代自研Arm芯片——Graviton4。作为目前最强大的Graviton处理器,Graviton4相较于上一代产品带来了巨大的性能提升。同时,为Graviton4赋能的Arm Neoverse也跟着受到了更多的关注。

强悍的Graviton4处理器

据介绍,Graviton4处理器每个核心都能提供比上代强30%的性能,vGPU数量和内存容量也是上一代的3倍,能将处理大型Java应用的速度提升45%,可以为企业提供更低成本和高效的高性能计算解决方案。

除了内核性能的提升,亚马逊还着重提升了Graviton4处理器的存储性能,首次创建了双插槽NUMA内存集群。Graviton4处理器配备了高达1.5 TB的DDR5主内存,运行频率为5.6 GHz,提供12个内存通道。与之相比,上一代Graviton 3处理器使用了4.8 GHz主频的DDR5内存,只有8个内存通道。并且,单个Graviton4处理器的内存插槽就可以提供537.6 GB/秒的带宽,能够轻松应对HPC负载。

此前,亚马逊针对Graviton4处理器发布过一些测试实例,通过这些实例体现了这颗处理器强大的性能。比如,基于Graviton4处理器构建UE5 Dedicated Server,据亚马逊的说法,最新的Graviton 4实例是迄今为止亚马逊为各种workload设计的最强大并且最高效节能的CPU。Graviton 4的实例R8g相较于Graviton 3的实例R7g有大约30%的性能提升。实例R8g压测使用Lyra Starter Game项目,通过增加AI Bot和GameClient的方式来增加Dedicated Server(简称DS)的负载,通过对比不同机型以及不同参数编译出的DS在server full的情况下的CPU使用率和帧率(FPS)来对比性能。

结果显示,Graviton 4的实例在UE Dedicated Server应用场景下:
·相较于Graviton 3有约 25+%的性价比提升(均使用优化参数编译);
·相较于Intel Sapphire Rapids和AMD Genoa有30%~35%的性价比提升;
·使用Graviton针对C/C++的优化参数来编译Dedicated Server对性能提升约10%~25%。

根据外媒的测试,在相同的vCPU数量下,新的Graviton4处理器内核大致与Intel Sapphire Rapids性能相当,同时能够与AMD EPYC“Genoa”相媲美,并始终表现出极佳的代际提升。这都离不开Arm Neoverse的赋能。

Graviton4 处理器背后的Arm Neoverse

Graviton4 处理器基于Arm Neoverse V2平台,这颗核心发布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司内部代号“Demeter”项目下的产品,Arm Neoverse V2平台涵盖Armv9架构的新特性,包括高性能浮点和向量指令支持,以及SVE/SVE2、Bfloat16和INT8 MatMul等特性。这些特性为AI/机器学习 (ML) 以及高性能计算 (HPC) 工作负载提供了卓越性能。

根据Arm官方的介绍信息,得益于全面增强的核心性能、内存带宽和高达两倍的L2缓存大小(每核2MB),Neoverse V2可以在云和ML应用程序上提供两倍于Neoverse V1的性能。根据Arm工程团队实际运行EDA工作负载所得出的结果,Graviton4 提供的RTL仿真工作负载性能比Graviton3高出 37%。同时,Neoverse V2具有出色的平台扩展性,当与新的CMN-700核心网状网络配对时,Neoverse V2 CPU可以配置多达256个内核和512MB的系统级缓存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定义PHY来连接计算、内存和加速器,实现高效、高速的芯片连接。

看过Graviton4处理器的性能之后,人们对下一代Arm服务器会更加期待,这些产品将搭载最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技术,Neoverse CSS V3则是V系列芯片IP的首款Neoverse CSS产品,单芯片性能可提高50%。官方的资料显示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,拥有6个DDR5 内存控制器、4个 I/O 控制器和两个芯片间互连,并支持PCIe Gen5和CXL3.0。通过芯片间互联,可以升级至128核。相对于此前的 Neoverse CSS N2,其单芯片性能可提高50%。

除了核心的提升,Arm将继续投入并进一步强化软件生态系统,从而使开发者能够更加轻松地在 Arm平台上构建其应用,并充分利用 Arm计算平台所提供的卓越性能和效率优势。

结语

亚马逊Graviton4处理器是Arm处理器历史上的一次巨大成功,性能全面对标x86处理器当前的旗舰产品。在Graviton4处理器背后,Neoverse V2内核起到了巨大的赋能作用,这让产业界对于下一代基于Neoverse CCS V3 核心的Arm处理器更加期待。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20149

    浏览量

    247202
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TDA4VL-Q1处理器技术文档总结

    TDA4VE TDA4AL TDA4VL 处理器系列基于进化的 Jacinto™ 7 架构,面向智能视觉相机应用,并建立在 TI 十多年来在视觉处理
    的头像 发表于 10-10 09:47 1775次阅读
    TDA<b class='flag-5'>4</b>VL-Q1<b class='flag-5'>处理器</b>技术文档总结

    TDA4AL-Q1处理器的技术文档摘要

    TDA4VE TDA4AL TDA4VL 处理器系列基于进化的 Jacinto™ 7 架构,面向智能视觉相机应用,并建立在 TI 十多年来在视觉处理
    的头像 发表于 10-10 09:40 1526次阅读
    TDA<b class='flag-5'>4</b>AL-Q1<b class='flag-5'>处理器</b>的技术文档摘要

    亚马逊云科技在中国区域推出Amazon Graviton4实例 以自研芯片驱动企业算力升级

    Graviton4处理器的Amazon Elastic Compute Cloud(Amazon EC2)C8g、M8g和R8g实例,针对客户不同类型的工作负载进行优化。与Amazon Graviton3
    的头像 发表于 09-10 20:51 549次阅读

    国民技术能否开展一个M7处理器的试用活动。

    国民技术最近推出了M7处理器,看起来能力很强,电子发烧友能不能联合国民技术开展一个M7使用的活动,让大家了解下M7核的国民技术。
    发表于 05-20 22:04

    解读基于Arm Neoverse V2平台的Google Axion处理器

    云计算需求在人工智能 (AI) 时代的爆发式增长,推动了开发者寻求性能优化且高能效的解决方案,以降低总体拥有成本 (TCO)。Arm 致力于通过 Arm Neoverse 平台满足不断变化的需求,
    的头像 发表于 04-21 13:47 891次阅读

    瑞芯微RK3562处理器的基本特性

    RK3562是瑞芯微新推出的高性能、低功耗四核应用处理器芯片,内置多种功能强大的嵌入式硬件引擎,具有高性能的存储接口。本文主要介绍RK3562处理器的基本特性以及Smart-RK3562行业定制主控板评估套件。
    的头像 发表于 02-25 17:05 2559次阅读
    瑞芯微RK3562<b class='flag-5'>处理器</b>的基本特性

    AWS Graviton4处理器上运行大语言模型的性能评估

    亚马逊云科技 (AWS) 新一代基于 Arm 架构的定制 CPU —— AWS Graviton4 处理器已于 2024 年 7 月正式上线
    的头像 发表于 02-24 10:28 1238次阅读
    在<b class='flag-5'>AWS</b> <b class='flag-5'>Graviton4</b><b class='flag-5'>处理器</b>上运行大语言模型的性能评估

    自主创新,安全可控:申威SW831处理器与国产终端产品推荐

    在信息技术领域,自主可控的硬件技术是保障国家安全和产业发展的核心基础。作为国产处理器的代表之一, 申威(Sunway)SW831处理器 凭借其高性能、低功耗和高度安全性,成为国产信息化设备的核心
    的头像 发表于 02-21 15:38 3475次阅读

    Arm技术助力Google Axion处理器加速AI工作负载推理

    Arm Neoverse V2 平台赋能的 Google Axion 处理器已在 Google Cloud 上正式上线,其中,C4A 是首款基于 Axion 的云虚拟机,为基于 C
    的头像 发表于 02-14 14:11 959次阅读
    <b class='flag-5'>Arm</b>技术助力Google Axion<b class='flag-5'>处理器</b>加速AI工作负载推理

    RV1109处理器概述

    RV1109处理器是一款集成了先进技术的高性能芯片,其主要特性彰显了在多个领域的强大应用能力。 该处理器搭载了双核设计,结合了ARM Cortex-A7处理器核心与RISC-V MCU
    的头像 发表于 02-08 17:04 1909次阅读

    面向NXP i.MX8处理器的电源解决方案

    电子发烧友网站提供《面向NXP i.MX8处理器的电源解决方案.pdf》资料免费下载
    发表于 12-24 15:53 0次下载
    面向NXP i.MX8<b class='flag-5'>处理器</b>的电源解决方案

    Arm Neoverse 驱动 AWS Graviton4,加速云计算新时代

    满足性能提升、成本降低以及符合监管和可持续发展目标的新能效基准。 近日,Arm与亚马逊云科技(AWS)的长期合作,正致力于通过专用芯片和计算技术,推动云计算向更高性能、更高效和更可持续的方向发展。在AWS re:Invent 2
    的头像 发表于 12-23 17:38 964次阅读

    TPS659118 66AK2G02处理器用户指南

    电子发烧友网站提供《TPS659118 66AK2G02处理器用户指南.pdf》资料免费下载
    发表于 12-23 14:40 0次下载
    TPS659118 66AK2G02<b class='flag-5'>处理器</b>用户指南

    ArmAWS合作深化,AWS Graviton4展现显著进展

    :Invent 2024大会上,AWS进一步展示了其基于Arm架构的AWS Graviton4处理器的显著进展。
    的头像 发表于 12-18 14:17 849次阅读

    Arm NeoverseAWS Graviton4加速云计算创新

    随着人工智能 (AI) 技术的迅猛发展,云计算领域正在经历显著变革。愈发复杂的 AI 应用对计算解决方案的性能、效率和成本效益提出了更高要求。在云端部署工作负载的客户正在重新评估其所需的基础设施,以满足现代工作负载需求,其中不仅包括提高性能和降低成本,还涵盖了需符合监管要求或可持续发展目标的新能效基准。
    的头像 发表于 12-17 10:16 759次阅读