0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔Sapphire Rapids架构重磅创新,树立下一代数据中心处理器标准

话说科技 来源:话说科技 作者:话说科技 2021-08-20 13:47 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

回望过去一年,科技处于所有人如何沟通、工作、娱乐和应对新冠肺炎疫情的核心。事实证明,强大的计算能力至关重要。展望未来,我们面临庞大的算力需求。

在2021年英特尔架构日活动上,英特尔重磅介绍其全新引领行业标准的数据中心架构Sapphire Rapids,搭载了全新的性能核以及多种加速器引擎。同时详细介绍了英特尔全新的基础设施处理器(IPU)以及超凡的数据中心GPU架构Ponte Vecchio,其具备英特尔迄今为止最高的计算密度。这些新架构将为即将推出的高性能产品注入动力,并为英特尔的下一个创新时代奠定基础,以满足世界对高计算能力日益增长的需求。

下一代英特尔至强可扩展处理器(代号为“Sapphire Rapids”)

Sapphire Rapids代表了业界在数据中心平台上的一大进步。该处理器可在不断变化且要求日益增高的数据中心使用中提供可观的计算性能,并对工作负载进行优化,以在云、微服务和AI等弹性计算模型上提供高性能。

Sapphire Rapids的核心是一个分区块、模块化的SoC架构,采用英特尔的嵌入式多芯片互连桥接(EMIB)封装技术,在保持单晶片CPU接口优势的同时,具有显著的可扩展性。Sapphire Rapids提供了一个单一、平衡的统一内存访问架构,每个线程均可完全访问缓存、内存和I/O等所有单元上的全部资源,由此实现整个SoC具有一致的低时延和高横向带宽。

Sapphire Rapids基于Intel 7制程工艺技术,采用英特尔全新的性能核微架构,该架构旨在提高速度,突破低时延和单线程应用性能的极限。

Sapphire Rapids提供业界广泛的数据中心相关加速器,包括新的指令集架构和集成IP,以在各种客户工作负载和使用中提升性能。新的内置加速器引擎包括:

·英特尔®加速器接口架构指令集(AIA)——支持对加速器和设备的有效调度、同步和信号传递

·英特尔®高级矩阵扩展(AMX)——Sapphire Rapids中引入的新加速引擎,可为深度学习算法核心的Tensor处理提供大幅加速。其可以在每个周期内进行2000次INT8运算和1000次BFP16运算,实现计算能力的大幅提升。使用早期的Sapphire Rapids 芯片,与使用英特尔AVX-512 VNNI 指令的相同微基准测试版本相比,使用新的英特尔AMX 指令集扩展优化的内部矩阵乘法微基准测试的运行速度提高了7 倍以上,为AI 工作负载中的训练和推理上提供了显着的性能提升

·英特尔®数据流加速器(DSA)——旨在卸载最常见的数据移动任务,这些任务会导致数据中心规模部署中的开销。英特尔DSA改进了对这些开销任务的处理,以提供更高的整体工作负载性能,并可以在CPU、内存和缓存以及所有附加的内存、存储和网络设备之间移动数据

这些架构上的改进使Sapphire Rapids能够为云、数据中心、网络和智能边缘中广泛的工作负载和部署模式提供开箱即用的性能。该处理器旨在通过先进的内存和下一代I/O,包括PCIe 5.0、CXL 1.1、DDR5和HBM技术,来推动行业技术转型。

基础设施处理器(IPU)

IPU是一种可编程的网络设备,旨在使云和通信服务提供商减少在中央处理器(CPU)方面的开销,并充分释放性能价值。

英特尔基于IPU的架构有以下主要优势:

·基础设施功能和客户工作负载的强分离使客户能够完全控制CPU

·云运营商可以将基础设施任务卸载到IPU上,更大化实现CPU利用率和收益

·IPU可以管理存储流量,减少时延,同时通过无磁盘服务器架构有效利用存储容量。借助IPU,客户可以通过一个安全、可编程、稳定的解决方案更好地利用资源,使其能够平衡处理与存储

英特尔认识到“单一产品无法满足所有需求”,因此对其IPU架构进行了更深入的研究,并推出了以下IPU家族的新成员——均为应对多样化数据中心的复杂性而设计。

Mount Evans是英特尔的首个ASIC IPU。Mount Evans是与一家一流的云服务提供商共同设计和开发的,它融合了多代FPGASmartNIC的经验。

·超大规模就绪,提供高性能网络和存储虚拟化卸载,同时保持高度控制

·提供业界一流的可编程数据包处理引擎,支持防火墙和虚拟路由等用例

·使用硬件加速的NVMe存储接口,该接口扩展自英特尔傲腾技术,以模拟NVMe设备

·采用英特尔®高性能Quick Assist技术,部署高级加密和压缩加速

·可使用现有普遍部署的DPDK、SPDK等软件环境进行编程,并且可以采用英特尔Barefoot Switch部门开创的P4编程语言来配置管线

Oak Springs Canyon是一个IPU参考平台,基于英特尔®至强D 处理器(Intel® Xeon-D)和拥有业界领先的功率、效率、性能的英特尔® Agilex™FPGA构建:

·卸载Open Virtual Switch(OVS)等网络虚拟化功能以及NVMe over Fabric和RoCE v2等存储功能,并提供硬化的加密模块,提供更安全、高速的2x 100Gb以太网网络接口

·让英特尔的合作伙伴和客户能够使用英特尔®开放式FPGA开发堆栈(英特尔®OFS)定制其解决方案,这是一款可扩展、开源软件和硬件基础设施

·使用现有普遍部署的软件环境进行编程,包括已在x86上优化的DPDK和SPDK

英特尔N6000加速开发平台,代号为“Arrow Creek”,是专为搭载至强服务器设计的SmartNIC。其特性包括:

·在功耗、效率和性能方面处于行业领先地位的英特尔Agilex FPGA。用于高性能的100GB网络加速的英特尔以太网800系列控制器

·支持多种基础设施工作负载,使通信服务提供商(CoSP)能够提供灵活的加速工作负载,如Juniper Contrail、OVS和SRv6,它以英特尔PAC-N3000的成功为基础,该产品已在部分业界一流的CoSP中部署。

XeHPC和Ponte Vecchio

Ponte Vecchio基于XeHPC微架构,提供业界领先的每秒浮点运算次数(FLOPs)和计算密度,以加速AI、HPC和高级分析工作负载。英特尔公布了XeHPC微架构的IP模块信息;包括每个Xe核的8个矢量和矩阵引擎(称为XMX XeMatrix eXtensions);切片和堆栈信息;以及包括计算、基础和XeLink单元的处理节点的单元信息。在架构日上,英特尔表示,早期的Ponte Vecchio 芯片展示了领先的性能,在流行的AI 基准测试中创造了推理和训练吞吐量的行业记录。1英特尔A0芯片性能提供了高于45 TFLOPS的FP32吞吐量,高于5 TBps的内存结构带宽,以及高于2 TBps的连接带宽。同时,英特尔分享了一段演示视频,展示了ResNet推理性能超过43,000张图像/秒和超过每秒3400张图像/秒的ResNet训练,并且这两项性能都有望实现行业领先。1

Ponte Vecchio由多个复杂的设计组成,这些设计以单元形式呈现,然后通过嵌入式多芯片互连桥接(EMIB)单元进行组装,实现单元之间的低功耗、高速连接。这些设计均被集成于Foveros封装中,为提高功率和互连密度形成有源芯片的3D堆叠。高速MDFI互连允许1到2个堆栈的扩展。

计算单元是一个密集的多个Xe内核,是Ponte Vecchio的核心。

·一块单元有8个Xe内核,总共有4MB一级缓存,是提供高效计算的关键

·基于台积电先进的N5制程工艺技术

·英特尔已通过设计基础设施设置和工具流程以及方法,为测试和验证该节点的单元铺平了道路

·该单元具有极其紧凑的36微米凸点间距,可与Foveros进行3D堆叠

基础单元是Ponte Vecchio的连接组织。它是基于Intel 7制程工艺的大型芯片,针对Foveros技术进行了优化。

·基础单元是所有复杂的I/O 和高带宽组件与SoC 基础设施——PCIe Gen5、HBM2e 内存、连接不同单元MDFI链路和EMIB桥接

·采用高2D互连的超高带宽3D连接时延很低,使其成为一台无限连接的机器

·英特尔技术开发团队致力于满足带宽、凸点间距和信号完整性方面的要求

Xe链路单元提供了GPU之间的连接,支持每单元8个链路。

·对HPC和AI计算的扩展至关重要

·旨在实现支持高达90G的更高速SerDes

·该单元已被添加到“极光”(Aurora)百亿亿次级超级计算机的扩展解决方案中

Ponte Vecchio已走下生产线进行上电验证,并已开始向客户提供限量样品。Ponte Vecchio预计将于2022年面向HPC和AI市场发布。

fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20329

    浏览量

    254806
  • 英特尔
    +关注

    关注

    61

    文章

    10319

    浏览量

    181064
  • 数据中心
    +关注

    关注

    18

    文章

    5759

    浏览量

    75197
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    TI 携手 NVIDIA 推出面向下一代 AI 数据中心的完整 800 VDC 电源架构

    与可靠性。   新闻亮点: ●  TI 与  NVIDIA 合作, 为下一代 AI 数据中心开发了完整的 800 VDC 电源解决方案。 ●  作为此次合作的部分, TI 展示了
    的头像 发表于 03-20 14:23 2.7w次阅读
    TI 携手 NVIDIA 推出面向<b class='flag-5'>下一代</b> AI <b class='flag-5'>数据中心</b>的完整 800 VDC 电源<b class='flag-5'>架构</b>

    Molex产品组合推动下一代数据中心高速互连

    云计算、物联网、VR/AR、数字孪生、人工智能(AI)……这些让科技圈热血沸腾的技术背后,都有个共同的底层逻辑——它们都是以海量数据处理作为支撑的。因此,无论是哪条赛道上的竞争,都会体现为数字基础设施建设上的比拼,即新
    的头像 发表于 03-12 10:38 598次阅读

    18A工艺首发!英特尔推出下一代PC处理器,77%游戏性能暴涨+180TOPS算力

    1月6日,在CES 2026上,英特尔发布了代号为Panther Lake 的全新 Core Ultra 3 系列处理器上市产品阵容。该系列处理器基于18A 制程节点打造的AI PC计算平台,代表了
    的头像 发表于 01-07 07:56 2w次阅读
    18A工艺首发!<b class='flag-5'>英特尔</b>推出<b class='flag-5'>下一代</b>PC<b class='flag-5'>处理器</b>,77%游戏性能暴涨+180TOPS算力

    d-Matrix与Andes晶心科技合作打造下一代AI推理加速

    Raptor 推理架构处理器。本次合作代表着针对数据中心规模的 AI计算工作,以存储为中心的计算 (memory-centric computing) 与开放
    的头像 发表于 12-17 10:47 1150次阅读

    新思科技ZeBu助力富士通数据中心创新

    全球企业和政府正积极寻求解决方案,应对数据中心能耗迅速增长问题,开发下一代“绿色”数据中心——既具备高性能,又兼具高能效的设施。全球科技巨头富士通在先进处理器开发领域已领先 60 年,
    的头像 发表于 12-17 10:26 840次阅读

    打造智算基石:英特尔携手本土生态发布全域液冷服务

    路冷板式全域液冷服务。该创新方案由全本地生态赋能,实现了关键热源的高比例液冷覆盖,在提升可靠性与能效的同时,显著降低能耗与运维成本,为数据中心散热与能效树立全新标杆。
    的头像 发表于 11-20 14:31 566次阅读
    打造智算基石:<b class='flag-5'>英特尔</b>携手本土生态发布全域液冷服务<b class='flag-5'>器</b>

    英特尔携本地生态伙伴发布双路冷板式全域液冷服务,引领数据中心散热与能效革新

    1月19日,在重庆举办的2025英特尔技术创新与产业生态大会上,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔®至强®6900系列性能核
    发表于 11-19 21:21 1643次阅读
    <b class='flag-5'>英特尔</b>携本地生态伙伴发布双路冷板式全域液冷服务<b class='flag-5'>器</b>,引领<b class='flag-5'>数据中心</b>散热与能效革新

    安森美SiC器件赋能下一代AI数据中心变革

    安森美(onsemi)凭借其业界领先的Si和SiC技术,从变电站的高压交流/直流转换,到处理器级的精准电压调节,为下一代AI数据中心提供了从3kW到25-30kW HVDC的供电全环节高能效、高密度
    的头像 发表于 10-31 13:47 972次阅读

    NVIDIA和英特尔合作推动产品组合创新

    NVIDIA和英特尔今日宣布达成合作,将共同开发多定制化的数据中心和个人计算产品,以加速超大规模计算、企业级及消费级市场的各类应用与工作负载的处理
    的头像 发表于 09-23 14:29 886次阅读

    今日看点丨英伟达入股英特尔;寒武纪:网传订单信息不实

    NVLink 技术实现架构无缝互连 --融合 NVIDIA 在 AI 与加速计算领域的优势,以及英特尔先进的 CPU 技术与 x86 生态,为客户提供前沿解决方案。   在数据中心领域,英特
    发表于 09-19 10:21 1117次阅读

    聚焦液冷痛点:英特尔UQD互换性认证助力数据中心高效发展

    认证的技术创新之道,及其对降低数据中心运维复杂度、提升系统可靠性、助力液冷产业规模化的重要性。 英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示:“作为AI模型运行和硬件部署
    的头像 发表于 08-20 15:25 1450次阅读

    安森美携手英伟达推动下一代AI数据中心发展

    安森美(onsemi,美国纳斯达克股票代号:ON)宣布与英伟达(NVIDIA)合作,共同推动向800V直流(VDC)供电架构转型。这变革性解决方案将推动下一代人工智能(AI)数据中心
    的头像 发表于 08-06 17:27 1678次阅读

    NVIDIA 采用纳微半导体开发新一代数据中心电源架构 800V HVDC 方案,赋能下一代AI兆瓦级算力需求

    800V HVDC电源架构开发,旗下GaNFast™氮化镓和GeneSiC™碳化硅技术将为Kyber机架级系统内的Rubin Ultra等GPU提供电力支持。   NVIDIA推出的下一代800V
    发表于 05-23 14:59 3334次阅读
    NVIDIA 采用纳微半导体开发新<b class='flag-5'>一代数据中心</b>电源<b class='flag-5'>架构</b> 800V HVDC 方案,赋能<b class='flag-5'>下一代</b>AI兆瓦级算力需求

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速产品系列。包括全新英特尔锐炫™ Pro B系列GPU——
    的头像 发表于 05-20 12:27 5639次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b><b class='flag-5'>重磅</b>发布新<b class='flag-5'>一代</b>GPU,图形和AI性能跃升3.4倍

    英特尔2025年Q1营收127亿美元,数据中心与AI业务可圈可点

    表现超出预期,这主要得益于超大规模云服务商对于AI服务和存储计算的CPU机头节点需求。 英特尔至强处理器作为数据中心领域旗舰级产品,凭借丰富的产品组合、卓越的性能和能效,正在高效驱动
    的头像 发表于 04-25 17:46 927次阅读