0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

第五代英特尔至强处理器,AI特化的通用服务器CPU

E4Life 来源:电子发烧友网 作者:周凯扬 2024-03-18 08:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)随着AI已经成了数据中心与服务器市场的主流应用,就连通用服务器CPU,也开始着重加强AI计算能力。为此,英特尔于去年年底发布了第五代至强处理器,进一步提升通用计算性能的同时,也新增了AI相关的新指令集,诸如AXM、AVX等。

第五代至强可扩展处理器架构剖析

2023年年底发布的第五代至强,虽然和第四代至强一样都是基于Intel 7制程打造的,并采用了Dual-poly-pitch SuperFin晶体管技术,但英特尔依然在关键的技术指标上做了改进,比如系统的漏电流控制和动态电容等。在这些改进下,整体上第五代至强在同等功耗下的频率可以提升3%,其中有2.5%是由漏电流控制贡献的,动态电容下降贡献了0.5%。

wKgZomX2-7OAaSdfAAMY-mbGl1w468.png

除此之外,第五代至强的多芯片封装方式有所改变,第四代至强就是把芯片分为四个部分,这四个部分是相对对称的。而第五代至强的切分方式则做了调整,把切四份的做法变成了切两份。过去每两片之间相互进行通信时,需要有一些芯片互连之间的接口,不仅占用了额外的芯片面积,也额外增加了功耗。如今随着芯片质量控制得到进一步改进,英特尔可以在相对较大的面积下依旧获得很好的良率,所以通过将四芯片改为两芯片的方式,芯片的面积得到了更好的控制。

此外第五代至强的处理核心升级到了Raptor Cove核心,核心数从最多的60核升级到64核。在I/O速度上,DDR速度从4800MT/s提升到了5600MT/s,UPI速度从16GT/s提升到20GT/s。而最大的升级之一当属LLC大小,单个模块的LLC容量从1.875MB增加到了5MB。这样如果处理规模较小的数据集时,甚至可以将主要数据放在LLC缓存中,从而大量减少内存访问,进而大幅提高性能。这些架构上的改进,也使其在生成式AI和LLM等AI应用上的性能得到了提升。

通用服务器上跑AI

除了传统的CPU计算核心外,英特尔也增加了AMX加速器,专门针对矩阵运算。根据测试,AI推理的性能与上一代相比提升了至多42%。针对非大模型类的AI应用,英特尔始终致力于在CPU上部署AI,并结合其OpenVINO生态进行优化,比如推荐、语音识别、图像识别等。

而面对推荐系统,尤其是面对GPU也无法单独处理的大模型时,CPU反而更快。因为GPU不够用的时候,玩玩需要跨GPU计算,或者需要和CPU频繁交互,如此一来CPU效率更高。

对于通用的AI工作负载,英特尔采用AMX和AVX-512两个指令集,基于OpenVINO进行优化。在推理的过程中,指令集上可以进行切分,通过加速器定向加速某一部分,甚至可以替代传统的基于GPU的AI模型。

除此之外,还有成本上的考量,在模型调优、推理、应用上,使用通用服务器有非常大的性价比提升。尤其是当企业并不需要24小时都要跑大模型,大模型只是对业务的辅助时,比如聊天机器人、或是内容生成、提纲分析等,这些只是帮助企业业务的生产力提高,尤其是在私有云上,就没有必要再重新部署一个新的GPU的平台。因为一个新的平台意味着需要考虑开发、运维等因素,成本有可能增加,而这对于企业来说也可能会成为负担。

以合作伙伴举例,比如百度云也有基于第五代至强的服务器,提供了可以在CPU上运行的大型计算模型的服务;在京东基于第五代至强的应用中可以看到,和前一代的处理器相比,在Llama2 13B的模型上,看到有50%的性能提升。所以第五代至强在AI上应用的性能提升是比较明显的。

再者就是编解码上的应用,目前主流客户为了达到更好的图像质量,反而会采用CPU做编解码。GPU在拥有硬件加速的情况下,其特点是快,但视频编解码质量往往略差于CPU。通过第五代至强处理器AMX-INT8的加持,已经把吞吐从原来的1.5FPS增强到了33FPS,基本可以满足实时编码的需求。


下一代至强路线图

从路线图上来看,2024年英特尔还会发布新一代英特尔至强可扩展处理器,而且有一个非常丰富的产品组合,同时满足对性能和能耗的要求。基于现在的第五代至强,英特尔也会发布下一代的性能核,就是高主频、高性能的CPU核架构,为主流和复杂的数据中心的应用进行性能优化,尤其是目前有很多程序是跑在虚拟机上,之前写的非常大的程序要跑在性能核上的,才能看到一个非常好的性能提升。


同时对新兴的,尤其是基于云原生的设计,英特尔还提供基于能效核打造的至强处理器,每瓦性能可以做到相对极致,而且因为它的核心设计比较精简,可以放更多高密度的核数到每一款的CPU和服务器,从而支持面向云的高密度超高能效的运算进行能效的优化。在近期对于产品淘汰换新的要求中,有一个重要考量因素就是能效比,这同样也是符合国家对设备淘汰换新的要求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20333

    浏览量

    255044
  • 英特尔
    +关注

    关注

    61

    文章

    10324

    浏览量

    181095
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11331

    浏览量

    225904
  • AI
    AI
    +关注

    关注

    91

    文章

    41156

    浏览量

    302617
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,
    的头像 发表于 04-26 16:27 6968次阅读
    <b class='flag-5'>AI</b>工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    英特尔发布至强600系列工作站处理器与锐炫Pro B70 GPU,双芯联动重塑AI工作站格局

    4月23日,英特尔公司在北京举办新一AI工作站平台发布会,推出英特尔® 至强® 600工作站处理器
    的头像 发表于 04-24 09:28 4129次阅读
    <b class='flag-5'>英特尔</b>发布<b class='flag-5'>至强</b>600系列工作站<b class='flag-5'>处理器</b>与锐炫Pro B70 GPU,双芯联动重塑<b class='flag-5'>AI</b>工作站格局

    基于第五代骁龙8至尊版的AI影像特性和价值体验

    NPU与ISP性能的提升和软件层面的优化,不断拓宽移动摄影的边界,让专业级影像能力走向日常。基于第五代骁龙 8至尊版移动平台的AI影像特性,这些心动瞬间都能够被清晰记录并保留。本期我们将为大家详细介绍第五代骁龙8至尊版的
    的头像 发表于 04-16 14:20 360次阅读

    英特尔至强6“芯”动GTC 2026,为英伟达DCG Rubin解锁系统级性能

    在英伟达GTC 2026大会上,英特尔正式宣布,英特尔至强 6处理器将作为主控处理器,应用于NVIDIA DGX Rubin NVL8 系统
    的头像 发表于 03-19 16:43 398次阅读

    全球首款落地!英特尔携手新华三等合作伙伴,重磅推出全域液冷服务器

    11月19日,英特尔携手本地生态伙伴——新华三、英维克、忆联及国内领先内存厂商,发布了基于英特尔至强6900系列性能核处理器的双路冷板式全域液冷服务
    的头像 发表于 11-25 09:17 1.1w次阅读
    全球首款落地!<b class='flag-5'>英特尔</b>携手新华三等合作伙伴,重磅推出全域液冷<b class='flag-5'>服务器</b>

    奇瑞汽车第五代瑞虎8全球上市

    11月10日,自研旗舰 全球冠军——第五代瑞虎8全球上市发布会于北京雁栖湖隆重举行。作为中国新燃油战略下的全新力作,新车集“硬核全能”的驾控实力与“电感体验”的智慧舒适于一身,为用户带来全面越级的驾
    的头像 发表于 11-12 17:55 1924次阅读

    奇瑞汽车第五代瑞虎8即将上市

    11月10日,奇瑞新燃油战略下的重点车型——第五代瑞虎8将正式上市。作为瑞虎8冠军家族的全新产品,第五代瑞虎8集全新设计、电感体验、“赛级民用”的驾控及安全于一身,引领全球燃油车进入下一个时代。
    的头像 发表于 11-10 15:27 830次阅读

    奇瑞汽车第五代瑞虎8开启预售

    世界高城,驭鉴冠军。2025年11月3日,第五代瑞虎8在拉萨正式开启预售,预售价10.59万元至13.59万元,同时提供虎款、豹款两种造型供选择。为助力更多用户畅享豪华大座家庭SUV出行体验,第五代瑞虎8同步带来
    的头像 发表于 11-04 12:53 1098次阅读

    英特尔助力阿里云推出多款云实例和存储方案

    的云实例解决方案。 u2i云实例作为普惠算力的理想入门之选,其出色的成本效益,让中小企业客户得以用更低的投入,充分激发业务增长潜力。相较阿里云上一通用算力型实例U1,u2i云实例兼容多代际服务器(支持
    的头像 发表于 10-16 10:22 757次阅读

    从云到端:英特尔展示全栈AI能力,覆盖云、边、PC多场景

    2025年9月25日,杭州——今日,在2025云栖大会上,英特尔与阿里云带来了多项云基础设施创新成果,包括兼容多代际服务器(支持第五代英特尔® 至强
    的头像 发表于 09-26 17:27 1759次阅读
    从云到端:<b class='flag-5'>英特尔</b>展示全栈<b class='flag-5'>AI</b>能力,覆盖云、边、PC多场景

    英特尔288核新至强处理器揭秘:Intel 18A制程,3D堆叠与键合,EMIB封装……

      近日,在Hot Chips 2025大会举行期间,英特尔新一至强处理器 Clearwater Forest首次亮相,这是英特尔基于In
    的头像 发表于 08-29 15:59 2004次阅读

    看点:AMD服务器CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    给大家带来一些业界资讯: AMD服务器CPU市场份额追上英特尔 根据市场研究机构PassMark的统计分析数据显示,AMD 公司在服务器CPU
    的头像 发表于 07-25 14:41 1349次阅读
    看点:AMD<b class='flag-5'>服务器</b><b class='flag-5'>CPU</b>市场份额追上<b class='flag-5'>英特尔</b> 华为Mate80主动散热专利曝光

    英特尔服务器CPU市场失守:从99.9%到50%以下

    服务器将同比增长 63.7%,达到 820 亿美元。   随后,有分析师汇总 IDC 和 Mercury Research 的调研数据指出,2024 年英特尔服务器处理器市场的份额
    的头像 发表于 07-01 01:19 4596次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>服务器</b><b class='flag-5'>CPU</b>市场失守:从99.9%到50%以下

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套系统的性能。选择
    的头像 发表于 06-27 11:44 1033次阅读
    主控<b class='flag-5'>CPU</b>全能选手,<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6助力<b class='flag-5'>AI</b>系统高效运转

    术业有专攻——AI系统主控CPU英特尔至强6新品处理器浅析

    一、至强6与NVIDIA GPU 协同的硬件基础 在 AI 异构计算架构中,英特尔至强6处理器作为主控C
    的头像 发表于 06-19 16:37 940次阅读
    术业有专攻——<b class='flag-5'>AI</b>系统主控<b class='flag-5'>CPU</b><b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6新品<b class='flag-5'>处理器</b>浅析