0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

安装量超1亿颗!发力数据中心和5G云网性能提升,英特尔发布第四代至强可扩展处理器

zhangyingwlw 来源:电子发烧友网 作者:章鹰 2023-01-13 01:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1月11日下午,以“芯加速 行至远”为主题的第四代英特尔至强新品发布会在北京正大中心盛大举行。英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰正式介绍了英特尔第四代至强可扩展处理器,英特尔至强CPU Max系列(代号
“Sapphire Rapids HBM”)以及英特尔数据中心GPU Max系列(代号“Ponte Vecchio”)。

poYBAGO_7uWAHIuMAApNfYgjEhc690.png

图:英特尔市场营销集团副总裁、中国区数据中心销售总经理

兼中国区运营商销售总经理 庄秉翰


至强处理器的发展历程

作为数据中心平台和解决方案的技术引领者,英特尔产品为全球的客户和行业伙伴提供了坚实的算力基础。目前,至强处理器的安装量已超过一亿——从运行IT服务的本地服务器其中包括全新的即服务商业模式,到管理互联网流量的网络设备,再到进行边缘计算的无线基站和云服务等。

自2017年Intel推出第一款至强和扩展处理器以来,英特尔已经向全球客户交付了超过8,500万颗的至强可扩展处理器,支持了全世界数据中心。在过去2年,第三代至强可扩展处理器已经在全球累计出货1,500万颗。

pYYBAGO_7xGASxKvAAXf-R-97Vs133.png

图:英特尔市场营销集团副总裁兼中国区总经理 王稚聪


英特尔市场营销集团副总裁兼中国区总经理王稚聪表示:“中国5G网络建设具有重大的意义,使得网络和计算逐渐融为一体,使得感知、计算、数据、存储、数据中心得以实现无缝连接,由此在中国形成了一个巨大的网络。国家提出“东数西算”,运营商朋友在做算力网络的构建,都是在中国有非常宏大的构想,能够把远端的大型数据中心,以及算力逐渐蔓延到边缘,以及网络的智能调度、切片,以及前端的传感统一调度起来。

由此之上建立的数据流,以及对工作负载平衡的处理,AI的各种加速,提供了一个非常丰富而充满乐趣和创造力的环境。第四代英特尔至强可扩展处理器的发布,就是面对这样的计算环境,助力合作伙伴新业务需求。”

七大神器助力第四代至强服务器打造超强能力

庄秉翰指出,第四代至强服务器芯片采用Intel7的制程工艺制造,具有全新的芯片架构,通过集成高性能和更多的内核数量,业内高需求的数据中心工作负载的相关加速器,以及业界领先的DDR5,CXL1.1,PCIe5.0和高带宽内存,以提供高吞吐量、低时延性能,让加速无所不在。

pYYBAGO_70SAUS-WABi6vVvG1xY419.png

图:第四代至强服务器芯片展示

pYYBAGO_712ABZjqAAcE8as9jqA942.png


这些加速体验体现在全新的至强平台所提供的七大算力神器。

一、加速深度学习,实时推理和训练性能提升的IntelAMX加速器;

二、加速处理网络数据系统及系统性的性能提升的Intel VOD加速器;

三、加速在存储网络工作负载中常见的流数据移动的Intel DSA加速器;

四、加速在数据分析工作负载中内存占用优化和查询吞吐量的Intel IAA加速器;

五、加速在网络吞吐量以及压缩解压缩功能的IntelQAT加速器;

六、加速平台安全性能的Intel安全技术策略组合;

七、提供内置高带宽内存的Intel至强CPU Max系列。

pYYBAGO_762AF6HZAA6LA6VJLUc244.png


与前一代相比,第四代英特尔至强可扩展处理器通过内置加速器将目标工作负载的平均每瓦性能提升了2.9倍,在优化电源模式下每个CPU节能高达70瓦,并对性能只产生极低的影响,同时将总体拥有成本降低52%到66%。

可持续性

第四代英特尔至强可扩展处理器拥有丰富的内置加速器,意味着英特尔能够提供平台级的功率节省,并缓解对额外独立加速方面的需求,帮助客户实现可持续发展目标。此外,新的优化电源模式可以为某些工作负载带来高达20%的插槽节能,而对性能的影响仅有不到5%。风冷和液冷的创新进一步降低了数据中心的总能耗,且第四代至强可扩展处理器在英特尔工厂制造时,运用了超过90%的可再生电力,并同时配备了一流的水资源回收设施。

人工智能

在AI方面,与前一代相比,通过内置英特尔高级矩阵扩展(英特尔AMX)加速器,第四代英特尔至强可扩展处理器将PyTorch实时推理和训练性能提升了10倍。第四代英特尔至强还将广泛的AI工作负载的推理和训练性能提升到新的高度。英特尔至强CPU Max系列在这些功能的基础上针对自然语言处理进行了扩展,将大型语言模型的处理速度提升多达20倍。借助英特尔的AI软件套件,开发者可以使用自己选择的AI工具,提高生产力并加快AI开发速度。该套件可以从工作站进行移植,使其可以在云中扩展,并一直扩展到边缘。同时,该套件已经针对400多个机器学习和深度学习AI模型进行了验证,涵盖所有商业细分领域最常见的AI应用场景。

网络

第四代英特尔至强包含一系列针对高性能、低时延网络和边缘工作负载进行了特别优化的处理器产品。对于如今电信、零售、制造和智慧城市等行业正在推动更加软件定义的未来,这些处理器将发挥关键性基石作用。对于5G核心工作负载,内置加速器有助于提高吞吐量和降低时延,而电源管理的升级则提高了平台的响应能力和能效。此外,与前几代相比,第四代英特尔至强在不增加功耗的情况下提供多达两倍的虚拟无线接入网(vRAN)容量。这使通信服务提供商能够将每瓦性能提高一倍,满足其关键的性能、扩展和能效需求。

科学计算

第四代英特尔至强可扩展处理器和英特尔Max系列产品具备可扩展、平衡的架构,其中整合了CPU、GPU和oneAPI的开放软件生态系统,适用于科学计算和AI等领域要求严苛的计算工作负载,旨在帮助解决全球最具挑战性的问题。

第四代英特尔至强内置英特尔AMX专属AI加速器,大幅提升矩阵乘法运算,为人工智能加速提供了全新方式,与上一代(FP32)相比,内置英特尔高级矩阵扩展(英特尔AMX)(BF16)的PyTorch实时AI推理和训练性能提高了10倍。结合通用CPU计算单元,第四代英特尔至强可扩展处理器可以端到端运行任何AI工作负载。

英特尔至强CPU Max系列是集成高带宽内存的x86处理器,能够在无需变更代码的情况下为科学计算工作负载加速。英特尔数据中心GPU Max系列提供极高的计算密度,且具有多种产品规格以满足不同的客户需求。

英特尔至强CPU Max系列可提供64GB的高带宽内存(HBM2e),为科学计算和AI工作负载大幅提高了数据吞吐量。与第三代英特尔至强可扩展处理器的高端SKU相比,英特尔至强CPU Max系列可为如能源、地球系统建模等一系列实际应用提供高达3.7倍的性能提升。

pYYBAGO_792ASj9EAAld6btSBFM879.png 

此外,英特尔数据中心GPU Max系列在单个产品上整合47个小芯片,集成了超过1000亿个晶体管,为诸如物理、金融服务和生命科学等极具挑战性的工作负载带来更高的吞吐量。相较上一代产品,英特尔数据中心GPU Max系列和至强CPU Max系列的结合,可以使生命与材料科学领域LAMMPS处理性能提升12.8倍。

合作案例分享

腾讯云星星海实验室研发总监曾钦杵现场分享一下腾讯云与英特尔的合作状况。

poYBAGO_8AiAJ6eKAAdeSHtKVR0337.png


腾讯云在云服务器方面,基于英特尔最新的Sapphire Rapids CPU进行了全面升级,推出了腾讯云第七代云服务器,标准型的S7和内存型的M7这样的云实例,这两款产品全面应用了腾讯云和英特尔的全新软硬件技术,充分发挥了目前产品的新特性,在计算、存储和网络多方面都做了全方位的性能提升。

腾讯云星星海自研服务器,基于Sapphire Rapids CPU可以提供先进的IO处理能力,包括目前最新一代的PCIe Gen 5,以及下一代IO接口标准CXL1.1,内存接口部分也从DDR4升级到了最新的DDR5内存接口。在存储领域,可以提供高达100万IOPS的存储性能,通过傲腾持久内存的助力,我们可以实现端到端的存储延时,达到40ms的级别,真正意义上达到了10纳秒云存储的新的性能指标。

在网络配置方面,星星海自研服务器通过搭载腾讯自研的“银杉”智能网卡,网络性能可以提供高达5000万PPS的网络性能。面对不同的业务场景,Sapphire Rapids提供了多个全新的内嵌的加速器。

中国电信5G云网能力提升,Intel第四代至强处理器助阵

随着5G网络的广泛应用,每一年移动数据流量增长50%,主要来自各种视频内容的增长,占到了全部流量的66%。要支撑流量增长的要求,运营商需要极大地增加网络容量和吞吐能力,加速网络工作负载的系统级处理性能。

天翼云云网产品事业部的杨鑫分享了和英特尔的合作,解决运营商工作负载不断提升的挑战。

经过十年的发展,天翼云目前已经是全球最大的运营商云和国内最大的混合云。据IDC今年发布的报告,天翼云在公有云IaaS市场已经排名第三,成为国内一线云服务提供商。

poYBAGO_8CuAcVlmAAUcamjut7Y711.png


中国电信和英特尔一起合作推出天翼云的第八代云主机,基于英特尔第四代英特尔至强可扩展处理器。基于英特尔的芯片架构,天翼云第八代弹性云主机可以支持128vCPU的大规格实例,支持8通道的DDR5内存,包括单条的内存带宽高达4800MT/S,性能较上一代有大幅度提升。

基于第四代英特尔至强可扩展处理器的英特尔DLB的特性,天翼云有超过200万的政企客户,很多政企客户除了提供普通的互联网上云,对政企客户我们重点提供了云专线、SD-WAN和VPN上云,而这个上云会采用IPSec加密隧道来做处理。传统的方式对性能有较大的影响,特别是大带宽的场景下,它是占据了某颗CPU的转发能力,影响同CPU的其他业务量的传输,而造成丢包、拥塞的业务质量下降。而通过和英特尔的合作,天翼云利用CPU的英特尔DLB硬件加速特性,针对IPSec的大象流处理做了优化。相比之前的纯软件方案,英特尔DLB的加速方案稳定可靠,带来了更好的线性扩展,最高可以达到4倍以上的吞吐收益,有效解决了在入云环节针对大象流加密处理的业务难题。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20419

    浏览量

    255958
  • 英特尔
    +关注

    关注

    61

    文章

    10356

    浏览量

    181532
  • 数据中心
    +关注

    关注

    18

    文章

    5907

    浏览量

    75300
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英特尔至强6+与AI时代的数据中心变革

    电子发烧友综合报道 6月1日,在台北国际电脑展(COMPUTEX)前夕,英特尔发布了首款采用Intel 18A制程的至强6+(代号Clea
    的头像 发表于 06-02 09:17 5839次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6+与AI时代的<b class='flag-5'>数据中心</b>变革

    英特尔推出全新至强6+、网络与AI系统解决方案,推动智能体AI落地生根

    6月1日,英特尔宣布数据中心领域最新进展,推出全新英特尔至强6+处理器
    的头像 发表于 06-01 13:35 2572次阅读
    <b class='flag-5'>英特尔</b>推出全新<b class='flag-5'>至强</b>6+、网络与AI系统解决方案,推动智能体AI落地生根

    英特尔至强6“芯”动GTC 2026,为英伟达DCG Rubin解锁系统级性能

    的关键阶段,至强系列处理器为GPU加速AI系统,提供架构一致性与强大扩展能力所发挥的重要支撑作用。 英特尔公司副总裁兼数据中心战略项目总经理
    的头像 发表于 03-19 16:43 554次阅读

    18核/24核双旗舰!英特尔酷睿Ultra 200S Plus发布,游戏性能大涨15%

    Ultra 200S 系列相同的Arrow Lake架构设计,但其多线程性能最高提升103%(对此需理性看待:该数据对比对象为全新酷睿 Ultra
    的头像 发表于 03-12 16:27 1.1w次阅读
    18核/24核双旗舰!<b class='flag-5'>英特尔</b>酷睿Ultra 200S Plus<b class='flag-5'>发布</b>,游戏<b class='flag-5'>性能</b>大涨15%

    英特尔携本地生态伙伴发布双路冷板式全域液冷服务,引领数据中心散热与能效革新

    1月19日,在重庆举办的2025英特尔技术创新与产业生态大会上,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔
    发表于 11-19 21:21 1716次阅读
    <b class='flag-5'>英特尔</b>携本地生态伙伴<b class='flag-5'>发布</b>双路冷板式全域液冷服务<b class='flag-5'>器</b>,引领<b class='flag-5'>数据中心</b>散热与能效革新

    Melexis推出第四代汽车LIN电机驱动MLX81350

    Melexis推出第四代汽车LIN电机驱动MLX81350,可为电机提供高达5W(0.5A)的功率。该驱动专为电动汽车(EV)的空调风门与自动通风系统设计,具备高性价比,不仅能实现
    的头像 发表于 11-08 17:04 3146次阅读

    到端:英特尔展示全栈AI能力,覆盖、边、PC多场景

    2025年9月25日,杭州——今日,在2025云栖大会上,英特尔与阿里带来了多项基础设施创新成果,包括兼容多代际服务(支持第五
    的头像 发表于 09-26 17:27 1889次阅读
    从<b class='flag-5'>云</b>到端:<b class='flag-5'>英特尔</b>展示全栈AI能力,覆盖<b class='flag-5'>云</b>、边、PC多场景

    派恩杰第四代碳化硅产品在AI基建的应用

    在 AI 基建中,碳化硅(SiC)凭借高频高效、耐高温、高功率密度等特性,成为解决 “算飙升与能耗、空间、散热瓶颈” 矛盾的核心材料。从数据中心的电源系统到边缘 AI 设备的稳定运行,派恩杰第四代碳化硅正深度渗透到 AI 基建
    的头像 发表于 08-18 15:56 1878次阅读

    Wolfspeed推出第四代性能碳化硅MOSFET

    Wolfspeed 推出第四代 (Gen 4) 1200 V 车规级碳化硅 (SiC) 裸芯片 MOSFET 系列,专为严苛的汽车环境设计。Wolfspeed 第四代性能碳化硅 MOSFET,可在 185°C 下持续工作,助力
    的头像 发表于 08-11 16:54 3716次阅读

    派恩杰发布第四代SiC MOSFET系列产品

    近日,派恩杰半导体正式发布基于第四代平面栅工艺的SiC MOSFET系列产品。该系列在750V电压平台下,5mm × 5mm芯片尺寸产品的导通电阻RDS(on)最低可达7mΩ,达到国际
    的头像 发表于 08-05 15:19 2103次阅读
    派恩杰<b class='flag-5'>发布</b><b class='flag-5'>第四代</b>SiC MOSFET系列产品

    英特尔至强6助力阿里第九企业级ECS实例100天赢得万家客户青睐

    近日,搭载英特尔® 至强® 6性能处理器的阿里第九企业级ECS实例
    的头像 发表于 07-29 15:44 766次阅读

    新唐科技发布第四代Gerda系列车用HMI显示IC

    新唐科技日本有限公司 (NTCJ) 将于 2025 年 5 月开始量产第四代 Gerda 系列车用HMI[1]显示IC,共三款型号(Gerda-4M、Gerda-4L 和 Gerda-4C)。
    的头像 发表于 07-24 17:41 1393次阅读

    双擎革新,行业首批!美格智能发布基于高通跃龙™第四代FWA的AI CPE方案

    美格智能与高通技术公司多年深入合作,共同探索5G高速通信与边缘计算的融合发展。作为行业首批采用高通跃龙第四代FWA平台的无线通信模组及解决方案提供商之一,美格智能基于高通X855G调制解调
    的头像 发表于 07-19 08:04 1149次阅读
    双擎革新,行业首批!美格智能<b class='flag-5'>发布</b>基于高通跃龙™<b class='flag-5'>第四代</b>FWA的AI CPE方案

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔
    的头像 发表于 06-27 11:44 1177次阅读
    主控CPU全能选手,<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6助力AI系统高效运转

    英特尔亮相火山引擎春季原动力大会,共同发布第四代通用型计算实例家族

    今日,在火山引擎2025春季原动力大会上,英特尔联合火山引擎共同发布搭载英特尔至强6性能处理器
    的头像 发表于 06-13 14:55 778次阅读
    <b class='flag-5'>英特尔</b>亮相火山引擎春季原动力大会,共同<b class='flag-5'>发布</b><b class='flag-5'>第四代</b>通用型计算实例家族