0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AMD能在服务器领域实现领跑吗

半导体产业纵横 来源:半导体产业纵横 作者:半导体产业纵横 2022-11-15 10:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

AMD能在服务器领域实现领跑吗?

由于验证周期长,服务器行业转向新供应商的速度很慢。安全的选择是坚持现有的供应商,无论是几十年前的 IBM,还是现在的英特尔。不过,AMD表示“坚持使用至强并不安全”。

fd6b8160-6411-11ed-8abf-dac502259ad0.png

第四代 Epyc Genoa 的发布标志着 AMD 在大多数性能指标上连续三代击败英特尔。Rome和Milan让云玩家开始大量购买 AMD,而Genoa可能会征服剩余的大多数市场和终端用户。SemiAnalysis 认为,Genoa和Sapphire Rapids的差距大于Milan和Ice Lake之间的差距。这种差距只会持续扩大到 2024 年底,但可能会在 2025 年出现 Sierra Forrest 和 Granite Rapids之间减少。

fda2143c-6411-11ed-8abf-dac502259ad0.png

AMD 正在推出越来越多的 CPU 变体。虽然 CPU 用于通用工作负载,但针对各种终端市场的定制正在增加。在第 4 代中,有 4 个变体。Genoa是通用的和主流的。

Bergamo 适用于云原生工作负载。IO die 和平台与 Genoa 共享,所以很多方面都相似,只是将 Zen 4 核心替换为 Zen 4C 核心,它具有相同的核心架构和 L2 缓存,每个核心只有一半的 L3 缓存。Zen 4C 的内核布局以牺牲频率为代价实现密度最大化。

Genoa还将有另一个名为 Genoa X 的变体,用于“技术”。这是一个奇怪的定义,但它适用于计算流体动力学、EDA 和其他需要更多缓存的工作负载。Genoa X 将是 Genoa具有 3D V-Cache 和多个潜在的变体。

Siena是给电信公司和边缘的。由于较低的功率和资本支出需求,我们还会说它适用于某些企业部署。从内存到核心数量,Siena大概是Genoa或Bergamo的 1/2。

最后,AMD 的下一代被称为 Turin,预计将在 2024 年上半年推出。它有更多的系列和变体。

fdf1593e-6411-11ed-8abf-dac502259ad0.png

总结一下, Genoa 的性能是 Milan 的 2 倍左右,而功耗只有适度的增加。由于增加了 AVX512 和超大的内存带宽提升,浮点增益更大

fe2ffe00-6411-11ed-8abf-dac502259ad0.png

规格没有什么大的改变,96 个内核、12 个 DDR5 通道和 160 个 PCIe Gen 5 通道(其中 64 个支持 CXL)。附加 CXL 的内存加密对于多租户云架构的安全性至关重要。CXL 内存 ASIC/设备不需要支持来支持加密,这不依赖于任何特定的 ASIC。

fe5f2ae0-6411-11ed-8abf-dac502259ad0.png

Genoa 的核心是 Zen 4 核心。性能大幅提升,IPC 提高了 14%,由于 L2 大小增加了 2 倍,显著提高了频率和平均延迟。前端占 IPC 改进的 40%,加载/存储改进占 24%,分支预测占 20%,L2 缓存/执行引擎每个是 8%。

fe985f0e-6411-11ed-8abf-dac502259ad0.png

AVX512是一个浮点向量指令库。英特尔以 512 位宽实现它,但这也意味着它在芯片层面的成本太高,而且英特尔没有在客户端芯片上包含该功能。此外,当 AVX512 点亮时,芯片的时钟速度会下降,芯片上的其他工作负载也会受到影响。AMD 通过将其拆分为跨 256 位单元的多个周期,走了一条更加智能的路线。这意味着不存在noisy neighbor问题,并且芯片面积影响仍然很小。

fec424cc-6411-11ed-8abf-dac502259ad0.png

安全性总是很重要, AMD 比英特尔具有优势的多个核心和 SOC 级别的安全功能。最值得注意的一个与 SMT 或超线程有关。Ampere Computing 喜欢提出每个内核运行多个线程是不安全的论点。带有 SEV-SNP 的 AMD 正在应对这个问题。如果实现此功能,安全客户线程可以选择在共享核心上有活动的同级线程时不运行。这可以防止旁通道攻击,例如 Spectre 和 Meltdown。

feef1448-6411-11ed-8abf-dac502259ad0.png

随着第四代 Epyc 的推出,IO Die 可以说是一个更大、更重要的变化。它建立在 N6 进程节点上,而不是像 CPU 小芯片那样的 N5。IO 芯片现在得到了加强,可以通过一个更大的、具有更多层的封装与 12 个小芯片通信

另一个值得注意的点是插座完全重新设计。安装机制更坚固,引脚间距更窄,为 0.94 x 0.81mm。尺寸从 58mm x 75mm 增加到 72mm x 75mm。对于像 Unimicron 这样的公司来说,更大的封装和更多的层是一件大事

AMD 的 IO 可扩展性非常值得关注。他们使用具有组合功能的 SerDes。从本质上讲,这些 SerDes 可以具有多种特性,使得所连接的选项非常可配置。该平台可以配置 3 个或 Infinity 结构通道,从而在 2S 配置中实现可扩展的 PCIe 通道数。每台 2S 服务器可以有 3 个 Infinity 结构通道和 160 个 PCIe 通道以及另外 12 个用于平台的 PCIe 链路,或者用于平台的 4 个 IFIS、128 个 PCIe 和 12 个 PCIe。每个 16x PCIe 根联合体可以缩减为 9 个 PCIe 设备,其中 1 个 8x 设备 + 8 个 1x 设备。

ff6f6b66-6411-11ed-8abf-dac502259ad0.png

鉴于Genoa大幅提高 IO 速度,正确利用该带宽至关重要。增强的 AVIC 减少了虚拟化 IO 设备的开销。这可以实现更高的带宽利用率和更少的 CPU 开销。Milan有一个更早的版本,但它更像是原型。现在使用 Genoa,IO 设备具有接近原生的性能。使用运行 InfiniBand 的 Nvidia 的 Mellanox Connect X7 进行的测试。

ff99337e-6411-11ed-8abf-dac502259ad0.png

Genoa在内存成本方面进行了关键改进,这是服务器 BOM 的 50%,这一点不容小觑。

值得注意的是对 72 位和 80 位 DIMM 的支持。大多数服务器将使用 80 位 ECC,但一些超大规模服务器希望减少到 72 位。相对于非 ECC 内存所具有的 64 位,仍有一些 ECC 功能,但比广泛使用的关键任务 80 位要少。这里的优点是用于奇偶校验检查的 DRAM 裸片减少了 1 个。“有界故障”功能也有助于解决此问题,因为如果在存储设备中检测到错误,则可以映射这些问题。

另一个重要特征是双列与单列内存。Milan 和大多数 Intel 平台,双列内存对于最大化性能至关重要。例如,Milan有 25% 的性能增量。在Genoa,这一比例降至 4.5%。这是另一个可观的成本改进,因为可以使用更便宜的单列内存。

Genoa的内存延迟比Milan高,Genoa为 118ns,而Milan为 105ns。AMD 表示,其中只有 3ns 来自更大的 IO 芯片,Genoa为 73ns,而Milan为 70ns。大多数内存延迟影响来自 DDR5 内存设备本身。DDR5 上为 35ns,而 DDR4 上为 25ns。这是由于 DDR5 不成熟、更大的存储库大小以及架构中的其他变化导致的更宽松的时序。内存延迟影响很大,但 SOC 级别的微小增加令人惊讶。

ffff2828-6411-11ed-8abf-dac502259ad0.png

IO Die 到 Core Complex Die 的连接得到了极大的改进。每比特传输的功率降至2pj/bit 以下。作为参考,EMIB 声称为 ~0.5pj/bit。最值得注意的方面是有一个新的 GMI3-Wide 格式。对于客户Zen 4 和前几代 Zen 小芯片,IOD 和 CCD 之间有 1 个 GMI 链接。使用 Genoa,在较低的核心数、较低的 CCD SKU 中,可以将多个 GMI 链路连接到 CCD。这是可用于较低核心数 SKU 的带宽的大幅增加。具体来说,这将有助于关系数据库和高频 SKU,其中每核许可成本很高。

电源管理得到增强。Genoa 有 2 种基本的电源管理模式,性能确定性或电源确定性。由于热和硅的变化,不同芯片上的不同工作负载之间可能存在许多差异。考虑到制造涉及数千个工艺步骤,硅不是确定性的。

性能决定论适用于希望获得持续性能的公司。它在允许的情况下消耗更少的功率,并且性能保持稳定。大多数客户会选择此选项,因为稳定性至关重要。

功率确定性是为了保持功耗稳定并提高和降低性能。考虑到硅抽签、热预算和工作负载等因素,芯片将提高和降低时钟速度。

除了电源管理模式外,Genoa 芯片还有一个可配置的 TDP。峰值提升行为将根据选择的选项而有所不同。时钟提升基于可靠性和峰值功率传输。高活动工作负载将以较低的频率运行。考虑了系统和芯片裕量。与消费级平台相比,功率预算不会长期超出。TDP 只能超过 10 毫秒。

003ad8c8-6412-11ed-8abf-dac502259ad0.png

AMD 通常支持 CXL 1.1,但支持 Type 3 内存设备的 CXL 2.0。

006b20c8-6412-11ed-8abf-dac502259ad0.png

值得一提的是,CXL 的 64 个通道可以分成 16 个 4x 器件。Sapphire Rapids不具备 CXL 通道分叉的能力。如果一个连接 4x 或 8x CXL 设备,这将消耗所有 16 个通道。Emerald Rapids 修复了该功能,但那是一年之后的事情。虚拟机管理程序无法更改来宾的内存分配,这对于在云中使用 CXL 附加内存的用户来说是巨大的。

AMD 的性能支柱是每插槽性能领先、每核心性能领先、所有工作负载和细分市场的领先地位,以及 TCO 和可持续性方面的领先地位。

00aa354c-6412-11ed-8abf-dac502259ad0.png

中端 Genoa 芯片与 2 个高端 Xeon 芯片的 1 个比较最好地说明了这一点。AMD 具有更高的性能、更低的功耗、更低的 CPU 成本、更少的内核。

AMD 的领先优势是开创性的。需要注意的一件事是,当每个内核的软件许可成本开始发挥作用时,这种领先优势在 TCO 方面会进一步扩大。这在运行 VMMark 的企业基准测试中得到了最好的体现。VMMark 每个磁贴运行 19 个具有代表性的 VM,然后查看可以运行多少磁贴以及速度。Genoa速度更快,可以处理更多的虚拟机。

010862e8-6412-11ed-8abf-dac502259ad0.png

SKU 命名非常简单明了,每个数字都表示关键信息。

01587c06-6412-11ed-8abf-dac502259ad0.png

AMD 使 SKU 堆栈保持简单。与英特尔不同,没有一堆 SKU 锁定功能。有3个通用类别和18个SKU。核心性能 (F)、核心密度和平衡/TCO 优化。他们基于 1 个插槽与 2 个插槽支持进行细分。每个核心的价格也保持相对平稳。

019133a2-6412-11ed-8abf-dac502259ad0.png

在 Genoa 中,AMD 在整数工作负载上的每核性能领先通常约为 50%,在浮点上则高达 96%,后者大部分是由于内存带宽和缓存。

01ca82a6-6412-11ed-8abf-dac502259ad0.png

SQL 基准测试值得注意,因为在一些数据库基准测试中,AMD 由于其较高的核心到核心延迟而落后。他们仍然会在其中许多方面落后,但在一些常用的方面差距正在缩小。Sapphire Rapids 的单片和 4 管芯高级封装方法的优势在于,这些海量关系数据库将大大降低内核之间的延迟。

01ff0c2e-6412-11ed-8abf-dac502259ad0.png

在 HPC 性能比较中,96C 显示它仍然受到内存带宽的限制,但 32C 与 32C 显示Genoa的带宽优势是巨大的。

02406b10-6412-11ed-8abf-dac502259ad0.png

服务器整合是这里的重头戏。

02918d7e-6412-11ed-8abf-dac502259ad0.png

如果使用 2P 与 2P 或 2P 与 1P 服务器,数字会有所不同,但结果是相似的。通常 3 个 CPU 合并为 1 个 CPU。

02e91d32-6412-11ed-8abf-dac502259ad0.png

过去,AMD面对着一些问题,如工作负载不会在其中扩展,一些应用程序甚至会崩溃。Genoa拥有如此多的核心,能够访问大多数软件 ISV,因此Genoa结束了过去时期大部分痛苦。

032392dc-6412-11ed-8abf-dac502259ad0.png

最后一个点是关于机密计算。机密计算意味着软件不需要信任拥有硬件的所有者,同时能够保证数据安全。静态和动态数据,加密是一个很好理解的答案,但在使用中,答案很复杂。虽然Genoa并没有完全实现机密计算的愿景,但它在该领域带来了许多创新,使其更加接近。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5647

    浏览量

    139013
  • 服务器
    +关注

    关注

    13

    文章

    10094

    浏览量

    90875

原文标题:详解AMD Genoa

文章出处:【微信号:ICViews,微信公众号:半导体产业纵横】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    历史首次!AMD服务器CPU市占率达50%

    英特尔持平。根据AMD的数据显示,自EPYC CPU推出以来,其在服务器领域的市场份额由2018年的2%提升到2024年上半年的34%。在持平之后未来竞争将变得更加激烈。       回看每一代
    的头像 发表于 08-11 03:20 9959次阅读
    历史首次!<b class='flag-5'>AMD</b><b class='flag-5'>服务器</b>CPU市占率达50%

    看点:AMD服务器CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    给大家带来一些业界资讯: AMD服务器CPU市场份额追上英特尔 根据市场研究机构PassMark的统计分析数据显示,AMD 公司在服务器CPU 市场取得重大进展,市占率首次达到50%,
    的头像 发表于 07-25 14:41 807次阅读
    看点:<b class='flag-5'>AMD</b><b class='flag-5'>服务器</b>CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    授时服务器在交通领域中的关键作用与应用

    革命性的变革。它不仅提升了交通系统的运行效率,还为智能交通的发展提供了坚实的技术基础。本文将深入探讨授时服务器在交通领域中的实现方式及其重要性。授时服务器:交通管理的
    的头像 发表于 07-03 16:49 473次阅读
    授时<b class='flag-5'>服务器</b>在交通<b class='flag-5'>领域</b>中的关键作用与应用

    欧洲服务器免费ip地址怎么获取?#欧洲服务器 #免费IP地址 #服务器

    服务器
    jf_57681485
    发布于 :2025年06月13日 11:15:04

    DNS服务器无法访问?2分钟快速排查与解决!#DNS服务器 #DNS #服务器

    服务器
    jf_57681485
    发布于 :2025年06月10日 14:55:34

    国外bgp服务器多少钱?# 服务器

    服务器
    jf_57681485
    发布于 :2025年04月24日 14:19:00

    新加坡服务器延迟大吗?真相在这里#新加坡服务器 #服务器

    服务器
    jf_57681485
    发布于 :2025年04月18日 13:48:50

    NTP校时服务器 时钟同步服务器

    服务器
    jf_75250307
    发布于 :2025年03月19日 20:56:34

    服务器数据恢复—如何预防服务器故障与恢复服务器数据!

    服务器常见故障: 硬件故障:磁盘损坏、电池故障等。 软件问题:操作系统崩溃、未知的程序运行错误等。 病毒破坏:勒索病毒加密、删除服务器数据等。 不可控力量;服务器浸水、火烧、机房倒塌等导致
    的头像 发表于 03-11 12:36 814次阅读

    独立服务器和云服务器哪个快一些?

    独立服务器和云服务器哪个快一些?在数字服务部署中,独立服务器与云服务器的速度差异并非绝对,需结合资源配置与应用场景综合判断。以下是UU云对独
    的头像 发表于 02-05 10:08 799次阅读

    双北斗校时服务器、双北斗授时服务器、双北斗对时服务器、双北斗NTP服务器

    双北斗时间服务器具有许多优势,使其成为时间同步领域的佼佼者。首先,北斗卫星导航系统具有高精度、高稳定性和高实时性的特点,为北斗时间服务器提供了可靠的时间源。其次,北斗时间服务器采用了先
    的头像 发表于 01-21 09:24 792次阅读
    双北斗校时<b class='flag-5'>服务器</b>、双北斗授时<b class='flag-5'>服务器</b>、双北斗对时<b class='flag-5'>服务器</b>、双北斗NTP<b class='flag-5'>服务器</b>

    联想发布基于第五代AMD EPYC处理服务器产品

    近日,联想携手AMD共同举办“异构智算,稳定高效——联想算力基础设施新品发布会”。本次发布会上,联想重磅发布8款基于第五代AMD EPYC处理服务器产品——联想问天、ThinkSy
    的头像 发表于 12-16 16:23 1200次阅读

    负载均衡服务器服务器如何连接?

    负载均衡服务器服务器如何连接?负载均衡服务器服务器可通过多种方式连接,包括直接连接、交换机连接、路由连接以及云计算环境中的连接。小型网
    的头像 发表于 12-09 13:41 764次阅读