0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据中心CPU芯粒化及互联方案分析-PART2

奇异摩尔 来源: 奇异摩尔 2023-12-20 18:51 次阅读

随着生成式AI注入数据中心的步伐加快,CPU 在数据中心的部署变得愈发重要,为应对数据中心CPU性能提升挑战,Chiplet和互联技术的双剑合璧,经芯片巨头在自身产品体系中的多次实践,显现出蓬勃的生机和其普适性的一面。

2023年1月,英特尔第四代至强可扩展处理器Sapphire Rapids(SPR)首次亮相。SPR是一款专门针对AI工作负载优化的CPU,具有典型的Multi-Die架构,其亮点包括更高的核心数量、改进的缓存层次结构以及增强的互联技术。对英特尔来说,它也是剑指AMD EPYC,意在夺回HPC市场的野心之作。

更多的核心,更强的性能

2dca0610-9f21-11ee-8b88-92fbcf53809c.jpg

英特尔称,ERP整体性能和每瓦性能指标均处于领先地位。与前一代处理器相比,基础算力提升53%,人工智能性能提升10倍,5G vRAN性能提升2倍,网络&存储性能提升2倍,数据分析性能提升3倍,科学计算性能提升3.7倍。如此卓越的性能提升主要来自核心数量的大幅增长,以及高效的互联方案。

2dde4e0e-9f21-11ee-8b88-92fbcf53809c.jpg

1、50%核心数量增长+单核性能增强

SPR是英特尔首个Chiplet设计的Xeon处理器,由四个相同的die(芯粒)组成,die间通过英特尔的EMIB技术连接。其中,每个Die包含15个CPU内核,并分别配有自己的内存和IO控制器等各功能单元。核心部分为英特尔7工艺的Golden Cove P核(大核),设计支持60核,实际启用56核,总核心数较上一代IceLake增长了50%。

2df4ea10-9f21-11ee-8b88-92fbcf53809c.jpg

SPR延续了英特尔的服务器处理器策略:优先考虑扩展核心数量,同时提供强大的计算能力,以大幅提高CPU在处理大量数据,如进行科学计算、机器学习、图形处理时的性能。

最终,SPR实现了105MB Total LLC,307GB/s Memory Bandwidth,在SPECrate@2017_int_base基准测试中,得分为495。

如前文所述,除了CPU核数提升之外,SPR在CPU单核性能上也做了优化,如提高了CPU的各级缓存的大小,还为每个核心引入了两个512位的FMA单元,同时支持一级对AMX指令集,旨在进一步提升性能。

2:优化缓存层次结构

除了核心性能的优化,Golden Cove的一项重大改进是缓存层次结构,这也是SPR与AMD EPYC系列的显著区别之一:每个Golden Cove核心除了包2MB L2缓存外,还搭载了1.875MB的LLC切片,每个Die总28.125M LLC为56个核心所共享(SPR总缓存达112.5 MB)。相较客户端Golden Cove,SPR在处理大量数据的应用程序时,能提供更好的性能表现。

对于需要频繁访问LLC的数据密集型工作负载,LLC集成在核心中可以大幅度减少LLC控制器和缓存间的连接,降低功耗。这种设计也为跨线程访问提供了极大的灵活性。在需要时,一个核心可以访问全部的LLC,一个LLC也可以服务于多个核心。

不过,这种跨线程访问的缺点也很明显,在某些情境,如需要跨越两个Die以上的远端存储访问时,可能会增加LLC控制器的工作负载,造成较高的延迟和Workload balance的不均衡。

3、优化设计成本

由于集成了多达60个核心(实际应用了56个)使得英特尔制造一个SoC芯片变得不切实际,从而转向Chiplet和2.5D先进封装,并通过Multi-Die架构简化设计和制造。

基于Multi-Die架构,英特尔只需要设计两组镜像的掩模,再旋转这两个模具即可。不过,这种架构也为Die间的互联带来了挑战。

互联:由繁至简

为了连接数量繁多的核心和缓存,英特尔在EMIB链路上运行了一个巨大的Mesh结构,将所有核心连接到它们各自的LLC切片,以及SPR上的其他组件,如内存控制器、各种加速器和其他I/O设备中,形成一个多Die的系统结构。

网络加速单元

作为升级的重点,SPR在每个Die中嵌入了一个DSA网络加速单元,可以在特定网络工作负载中实现数倍的效率提升。该加速单元具有400Gb/s互联带宽,160Gb/s压缩带宽,每秒能够做出400M的负载平衡决策。

DSA全称为Data Streaming Accelerator,主要针对内存的搬移和传输的操作进行加速,能提高存储、网络和数据密集型工作负载的性能,类似于GPU等外部加速器。

在数据中心中,DSA可以更有效地处理如进行如压缩/解压缩、加/解密、内存搬移等特定工作负载,带来大幅的性能提升。某些场景下,只需一个核心或部分核心就能够处理复杂的工作负载,提高芯片的能效比。这也是英特尔为代表的头部企业开始热衷在处理器中内置加速器的因素之一。

基于 RoCE V2 协议自研 RDMA 技术,奇异摩尔自研Domain Specific Accelerator 系列专用领域加速器系列,具备高速以太网互联能力,提供可编程的专用数据处理加速算法,同时集成了多种通用数据处理硬件加速器,高带宽,高吞吐,硬件灵活可配置、软件可编程,可实现芯粒/芯片间的高速传输。

2e098ff6-9f21-11ee-8b88-92fbcf53809c.jpg

D2D:DDR5 & EMIB

互连系统方面,每个Die配有2个128位的DDR5内存接口,DDD5采用优化版的EMIB工艺,单个EMIB的D2D带宽高达500GB/s,功耗仅为0.5pj/bit,延迟(PHY Latency end-to-end TX+RX) 2.4ns。从die间功耗和延迟的方面来看,SPR已接近一个SoC。

为了进一步增强内存带宽,EMIB技术首次支持HBM扩展,并特别为SPR设计了一种HBM变体,通过EMIB连接四个HBM,实现内存性能方面的显著提升。

2e1d764c-9f21-11ee-8b88-92fbcf53809c.jpg

Chip2Chip:UPI & PCIe

在SPR中,每个Die还搭载了32个PCIe 5(CXL 1.1),以及24个UPI。配置为每个插槽80xPCIeGen5通道;以及24个UPI,支持最多8个芯片的互连,也意味着Sapphire Rapids芯片最多可以组建8路计算平台。

2e2ff2e0-9f21-11ee-8b88-92fbcf53809c.jpg

挑战与解决方案

因可简化设计,Multi-Die架构在2颗芯粒的互联架构中显现出显著的性价比优势,但一旦芯粒超过2个,就会面临互联挑战。

2e48aa38-9f21-11ee-8b88-92fbcf53809c.jpg

2023年5月,英特尔公布了SPR的下一代处理器,Emerald Rapids(ERP)。总体来说,英特尔基于SPR 相同的平台和较新的Raptor Cove核心,通过优化物理设计,实现了“巨大的PPW”改进。但令人瞩目的改变是,ERP的芯粒数量减少到两个,这一架构上的回退也从侧面反映出Mutil die模式下,多Die互联难度之高。

此外,因芯粒数量减少导致芯片尺寸过大,加之先进工艺的使用,也带来了成本高涨的问题;再次,在Mutil die架构中,为了维持高带宽和低功耗,EMIB的使用也会相应的增加成本,ERP的生产成本实际上比 SPR 更高。假设成品率和芯片可回收性完美,相比 SPR-MCC,EMR 只能在每个晶圆上生产 34 个 CPU,低于每个 SPR 晶圆 37 个 CPU。如果考虑到完美良率之外的任何因素,EMR 的成本就会更高。

相比之下,AMD 则选择了一种更为简单的方案,通过独立IO Die和CCD中的LLC集群,避免了复杂的多核互连问题。

下一站:Central IO Die

2e697e0c-9f21-11ee-8b88-92fbcf53809c.jpg

Hot Chips 2023 上,英特尔将旗下数据中心芯片分为两类,Granite 和 Sierra ,二者都基于chiplet设计,并首次使用了独立的 I/O 芯粒,通过 EMIB技术与计算单元封装在一起。英特尔服务器处理器正式转向Central IO Die架构。

随着核心数量的增长和多die模式的流行,过去几年中,各大计算芯片企业逐渐从Multi-Die模式转向Central IO Die模式。以 IO Die 为代表的新兴互联技术正在打破芯片内固有的互联方式。片内互联技术向“更高的集成度、更短的距离、更高的效率”转变。

在国内赛道,奇异摩尔作为片内互联领域的代表企业,核心产品涵盖2.5D interposer、2.5D IO Die、3D Base Die、NDSA、全系列Die2Die IP及相关Chiplet系统解决方案。

Central IO Die通过将IO功能从算芯片中分离出来,整合多种互联接口,让计算单元通过IO Die进行统一互联,可以极大程度的简化互联设计,增加带宽、并降低多Die间的互联延迟。AMD Zen系列、Ampere 和 AWS 的 Graviton3 都在采用一个或多个不同的 IO芯粒。数据中心处理器Central IO Die 的模式正在到来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10451

    浏览量

    206583
  • 数据中心
    +关注

    关注

    15

    文章

    4189

    浏览量

    70116
  • chiplet
    +关注

    关注

    6

    文章

    380

    浏览量

    12419
  • 奇异摩尔
    +关注

    关注

    0

    文章

    32

    浏览量

    3203
  • 芯粒
    +关注

    关注

    0

    文章

    48

    浏览量

    64

原文标题:数据中心CPU芯粒化及互联方案分析-PART2

文章出处:【微信号:奇异摩尔,微信公众号:奇异摩尔】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    #预端接光缆 #24光缆 #数据中心

    数据中心光缆
    jf_51241005
    发布于 :2023年12月08日 11:01:21

    数据中心高密度MPO/MTP布线系统解决方案

    IEC 61754-7,TIA 604-5,Telcordia GR-1435-CORE,当然我们可以根据客户需求提供定制产品,例如光纤的数、类型、长度等。典型应用场景--数据中心储存区域网1
    发表于 01-18 15:31

    锐捷助互联数据中心网络自动、可视运维

    实现Overlay网络业务配置自动,运营方只需要把控NO及其北向的业务相关系统就能实现网络相关配置的自动进程。当互联网行业进入到云计算时代,其数据中心网络需要快速响应上层应用的实时
    发表于 01-25 09:42

    数据中心布线方案数据中心怎样选择光纤布线?

    MTP光纤跳线可支持100米的数据传输。 上述就是易飞扬通信为大家介绍的在数据中心选择光纤布线解决方案。 易飞扬提供有源光缆的长度定制服务,可以满足您多样的需求。想了解更多详细信息
    发表于 04-20 14:40

    高性能ETU-link光模块应用于数据中心

    随着数据中心从10G升级到40G甚至100G。如今,高带宽、高端口密度以及低功耗要求都需要光纤技术来解决。而且当前的光纤技术已经是一种批量产品、低成本的技术,广泛地用于交换机互联和服务器接口等
    发表于 09-14 17:04

    2019北京数据中心展览会

    认证、基础设施维护、IT服务及运维。5.产业应用:云计算、大数据数据中心租赁。观众构成:1.模块数据中心数据云箱、机房解决
    发表于 09-25 11:26

    数据中心市场的十大趋势

    2.招聘需求数据科学家使用分析技术将大数据转化为有价值和有用的结论。随着云数据中心从信息存储基础设施转变为按需云
    发表于 12-31 22:23

    数据中心互联解决方案

      数据中心互联解决方案  随着数据中心在全球的大规模部署,数据中心对于100Gbps模块的需求时代已经到了,而对于10G/40Gbps模
    发表于 07-03 10:36

    高效率的快速部署 玩转模块数据中心 相关资料推荐

    当前,企业的快速增长都源于数字的应用,而数字的核心就是数据中心。如何应对数字转型对数据中心带来的巨大压力,这给传统IT带来了很大的挑战
    发表于 07-05 07:31

    数据中心是什么

    真正的价值作用,促使社会的快速变革。数据中心能多耗电:作为互联网的物理基础,数据中心一直是个相对神秘的话题.
    发表于 07-12 07:10

    模块数据中心的主要组成部分

    数据中心的组成如图所示。二、模块数据中心组成示意图(1)机柜模块数据中心最大可配置28台机柜,机柜包括服务器机柜、网络机柜和综合布线柜。
    发表于 09-08 07:17

    模块数据中心组成示意图

    组成示意图(1)机柜模块数据中心最大可配置28台机柜,机柜包括服务器机柜、网络机柜和综合布线柜。(2)机柜外观模块数据中心配置的机柜尺寸
    发表于 09-08 08:07

    什么是数据中心

    数据中心是企业用来容纳其关键业务应用程序和信息的物理设施。随着它们的发展,重要的是要长期考虑如何保持它们的可靠性和安全性。什么是数据中心数据中心通常被称为单个事物,但实际上它们由许多技...
    发表于 09-15 06:46

    互联数据中心安全管理方案

    本文介绍互联数据中心网络架构主要特征和多层设计原则,分析互联数据中心面临的主要安全威胁,对其安全规划和部署实施提出
    发表于 08-12 09:56 1718次阅读
    <b class='flag-5'>互联</b>网<b class='flag-5'>数据中心</b>安全管理<b class='flag-5'>方案</b>

    电路原理(第7版).part2

    电路原理(第7版).part2
    发表于 03-01 21:31 0次下载