0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第五代英特尔至强处理器,AI特化的通用服务器CPU

E4Life 来源:电子发烧友网 作者:周凯扬 2024-03-18 08:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)随着AI已经成了数据中心与服务器市场的主流应用,就连通用服务器CPU,也开始着重加强AI计算能力。为此,英特尔于去年年底发布了第五代至强处理器,进一步提升通用计算性能的同时,也新增了AI相关的新指令集,诸如AXM、AVX等。

第五代至强可扩展处理器架构剖析

2023年年底发布的第五代至强,虽然和第四代至强一样都是基于Intel 7制程打造的,并采用了Dual-poly-pitch SuperFin晶体管技术,但英特尔依然在关键的技术指标上做了改进,比如系统的漏电流控制和动态电容等。在这些改进下,整体上第五代至强在同等功耗下的频率可以提升3%,其中有2.5%是由漏电流控制贡献的,动态电容下降贡献了0.5%。

wKgZomX2-7OAaSdfAAMY-mbGl1w468.png

除此之外,第五代至强的多芯片封装方式有所改变,第四代至强就是把芯片分为四个部分,这四个部分是相对对称的。而第五代至强的切分方式则做了调整,把切四份的做法变成了切两份。过去每两片之间相互进行通信时,需要有一些芯片互连之间的接口,不仅占用了额外的芯片面积,也额外增加了功耗。如今随着芯片质量控制得到进一步改进,英特尔可以在相对较大的面积下依旧获得很好的良率,所以通过将四芯片改为两芯片的方式,芯片的面积得到了更好的控制。

此外第五代至强的处理核心升级到了Raptor Cove核心,核心数从最多的60核升级到64核。在I/O速度上,DDR速度从4800MT/s提升到了5600MT/s,UPI速度从16GT/s提升到20GT/s。而最大的升级之一当属LLC大小,单个模块的LLC容量从1.875MB增加到了5MB。这样如果处理规模较小的数据集时,甚至可以将主要数据放在LLC缓存中,从而大量减少内存访问,进而大幅提高性能。这些架构上的改进,也使其在生成式AI和LLM等AI应用上的性能得到了提升。

通用服务器上跑AI

除了传统的CPU计算核心外,英特尔也增加了AMX加速器,专门针对矩阵运算。根据测试,AI推理的性能与上一代相比提升了至多42%。针对非大模型类的AI应用,英特尔始终致力于在CPU上部署AI,并结合其OpenVINO生态进行优化,比如推荐、语音识别、图像识别等。

而面对推荐系统,尤其是面对GPU也无法单独处理的大模型时,CPU反而更快。因为GPU不够用的时候,玩玩需要跨GPU计算,或者需要和CPU频繁交互,如此一来CPU效率更高。

对于通用的AI工作负载,英特尔采用AMX和AVX-512两个指令集,基于OpenVINO进行优化。在推理的过程中,指令集上可以进行切分,通过加速器定向加速某一部分,甚至可以替代传统的基于GPU的AI模型。

除此之外,还有成本上的考量,在模型调优、推理、应用上,使用通用服务器有非常大的性价比提升。尤其是当企业并不需要24小时都要跑大模型,大模型只是对业务的辅助时,比如聊天机器人、或是内容生成、提纲分析等,这些只是帮助企业业务的生产力提高,尤其是在私有云上,就没有必要再重新部署一个新的GPU的平台。因为一个新的平台意味着需要考虑开发、运维等因素,成本有可能增加,而这对于企业来说也可能会成为负担。

以合作伙伴举例,比如百度云也有基于第五代至强的服务器,提供了可以在CPU上运行的大型计算模型的服务;在京东基于第五代至强的应用中可以看到,和前一代的处理器相比,在Llama2 13B的模型上,看到有50%的性能提升。所以第五代至强在AI上应用的性能提升是比较明显的。

再者就是编解码上的应用,目前主流客户为了达到更好的图像质量,反而会采用CPU做编解码。GPU在拥有硬件加速的情况下,其特点是快,但视频编解码质量往往略差于CPU。通过第五代至强处理器AMX-INT8的加持,已经把吞吐从原来的1.5FPS增强到了33FPS,基本可以满足实时编码的需求。


下一代至强路线图

从路线图上来看,2024年英特尔还会发布新一代英特尔至强可扩展处理器,而且有一个非常丰富的产品组合,同时满足对性能和能耗的要求。基于现在的第五代至强,英特尔也会发布下一代的性能核,就是高主频、高性能的CPU核架构,为主流和复杂的数据中心的应用进行性能优化,尤其是目前有很多程序是跑在虚拟机上,之前写的非常大的程序要跑在性能核上的,才能看到一个非常好的性能提升。


同时对新兴的,尤其是基于云原生的设计,英特尔还提供基于能效核打造的至强处理器,每瓦性能可以做到相对极致,而且因为它的核心设计比较精简,可以放更多高密度的核数到每一款的CPU和服务器,从而支持面向云的高密度超高能效的运算进行能效的优化。在近期对于产品淘汰换新的要求中,有一个重要考量因素就是能效比,这同样也是符合国家对设备淘汰换新的要求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20149

    浏览量

    247174
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179311
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11218

    浏览量

    222953
  • AI
    AI
    +关注

    关注

    89

    文章

    38114

    浏览量

    296659
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    奇瑞汽车第五代瑞虎8即将上市

    11月10日,奇瑞新燃油战略下的重点车型——第五代瑞虎8将正式上市。作为瑞虎8冠军家族的全新产品,第五代瑞虎8集全新设计、电感体验、“赛级民用”的驾控及安全于一身,引领全球燃油车进入下一个时代。
    的头像 发表于 11-10 15:27 409次阅读

    从云到端:英特尔展示全栈AI能力,覆盖云、边、PC多场景

    2025年9月25日,杭州——今日,在2025云栖大会上,英特尔与阿里云带来了多项云基础设施创新成果,包括兼容多代际服务器(支持第五代英特尔® 至强
    的头像 发表于 09-26 17:27 1276次阅读
    从云到端:<b class='flag-5'>英特尔</b>展示全栈<b class='flag-5'>AI</b>能力,覆盖云、边、PC多场景

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套系统的性能。选择
    的头像 发表于 06-27 11:44 605次阅读
    主控<b class='flag-5'>CPU</b>全能选手,<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6助力<b class='flag-5'>AI</b>系统高效运转

    术业有专攻——AI系统主控CPU英特尔至强6新品处理器浅析

    一、至强6与NVIDIA GPU 协同的硬件基础 在 AI 异构计算架构中,英特尔至强6处理器作为主控C
    的头像 发表于 06-19 16:37 569次阅读
    术业有专攻——<b class='flag-5'>AI</b>系统主控<b class='flag-5'>CPU</b><b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6新品<b class='flag-5'>处理器</b>浅析

    1.9倍性能提升!英特尔至强6在MLPerf基准测试中表现卓越

    第五代至强处理器相比,英特尔至强6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基准测试结
    的头像 发表于 04-07 10:58 516次阅读

    英特尔至强6处理器助力数据中心整合升级

    继去年9月重磅推出英特尔 至强 6900性能核处理器后,英特尔进一步扩充至强6产品家族,于近期发布了包括
    的头像 发表于 03-13 17:36 1262次阅读

    英特尔至强6:如何炼就数据中心“全能型选手”

    计算密集型工作负载而设计,新发布的至强6700P和至强6500P不仅在AI推理、单核性能等关键领域展现出家族“优等生”风范,还面向多路服务器应用场景,提供了高度灵活的适配方案。   作
    的头像 发表于 03-13 14:57 544次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6:如何炼就数据中心“全能型选手”

    英特尔至强6再推新品!打造最强AI“机头引擎”

    的产品矩阵,很好地满足市场的多样化需求;另一方面,凭借卓越的 AI 性能提升,英特尔为数据中心提供了性能强劲的机头节点 CPU,助力企业在数字时代的浪潮中稳步前行。 事实上,去年9月,英特尔
    的头像 发表于 03-13 14:57 590次阅读

    英特尔展示基于至强6处理器的基础网络设施

    ; 与5G核心网解决方案合作伙伴的深度合作,加快了英特尔至强6能效核处理器在整个生态系统中的应用; 基于5G核心网工作负载的独立验证确认了英特尔至强
    的头像 发表于 03-08 09:24 846次阅读

    MWC 2025:英特尔展示基于至强6处理器的基础网络设施

    3.2倍3; 与5G核心网解决方案合作伙伴的深度合作,加快了英特尔®至强®6能效核处理器在整个生态系统中的应用; 基于5G核心网工作负载的独立验证确认了英特尔®
    发表于 03-03 15:52 968次阅读
    MWC 2025:<b class='flag-5'>英特尔</b>展示基于<b class='flag-5'>至强</b>6<b class='flag-5'>处理器</b>的基础网络设施

    全新英特尔至强6处理器来袭,现代数据中心的性能与能效平衡“大师”

    英特尔进一步丰富至强6处理器产品组合,为行业提供多款满足广泛工作负载的CPU选择。 新闻亮点 · 英特尔推出全新
    的头像 发表于 02-25 17:39 641次阅读

    HPE携手英特尔至强6,打造新一服务器性能巅峰

    近日,慧与科技(HPE)推出了八款全新HPE ProLiant Compute Gen12服务器,标志着新一企业级服务器领域的新标杆正式诞生。这一系列服务器全面搭载了
    的头像 发表于 02-18 10:38 703次阅读

    英特尔至强6助力HPE,打造性能与能效新“巅峰”

    系搭载英特尔至强6处理器,能够轻松应对日益增长的数据密集型工作负载挑战,特别满足数据中心和边缘环境设计的需求。此外,该系列服务器还引入了创新的控制功能,将为企业在混合云时代的蓬勃发展提
    发表于 02-14 10:40 278次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6助力HPE,打造性能与能效新“巅峰”

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四
    的头像 发表于 12-23 14:05 1234次阅读

    联想发布基于第五代AMD EPYC处理器服务器产品

    近日,联想携手AMD共同举办“异构智算,稳定高效——联想算力基础设施新品发布会”。本次发布会上,联想重磅发布8款基于第五代AMD EPYC处理器服务器产品——联想问天、ThinkSystem V3
    的头像 发表于 12-16 16:23 1201次阅读