0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

CPU也可以完美运行大模型 英特尔第五代至强重磅发布

科技讯息 来源:科技讯息 作者:科技讯息 2023-12-22 11:52 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大语言模型(LLM)已经在多个领域展示出了卓越的性能和巨大的潜力,然而,要想真正发挥出这些模型的强大能力,需要强大的算力基础设施,而芯片是关键。

千呼万唤始出来,第五代英特尔®️ 至强®️ 可扩展处理器,它来了!

若是用一句话来概括它的特点,那就是——AI味道越发得浓厚。

以训练、推理大模型为例:

• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;

• 与第三代相比,AI训练和推理性能提升高达14倍。

什么概念?

现在若是将不超过200亿参数的模型“投喂”给第五代至强®️ 可扩展处理器,那么时延将低到不超过100毫秒!

也就是说,现在在CPU上跑大模型,着实是更香了。

而这也仅是英特尔在此次发布中的一隅,还包括打破自家“祖制”、被称为四十年来最重大架构转变的酷睿™️ Ultra。

此举亦是将AI的power注入到消费级PC中,用于加速本地的AI推理。

除此之外,具体到英特尔长期在各行各业扎根的AI实战应用,包括数据库、科学计算、生成式AI、机器学习、云服务等等,也随着第五代至强®️ 可扩展处理器的到来,在其内置的如英特尔®️ AMX、英特尔®️ SGX/TDX等其他内置加速器的帮助下,得到了更大的降本增效。

总而言之,纵观英特尔此次整场的发布,AI可谓贯穿始终。

##最新英特尔处理器,AI更Power了

我们先来继续深入了解一下第五代至强®️ 可扩展处理器披露的更多细节。

例如在性能优化方面,英特尔将各种参数做了以下提升:

• CPU核心数量增加到64个,单核性能更高,每个内核都具备AI加速功能

• 采用全新I/O技术(CXL、PCIe5),UPI速度提升

• 内存带宽从4800 MT/s提高至5600 MT/s

我们再来纵向,与英特尔前两代产品做个比较,那么性能提升的结果是这样的:

• 与上一代产品相比,相同热设计功耗下平均性能提升21%;与第三代产品比,平均性能提升87%。

• 与上一代产品相比,内存带宽提升高达16%,三级缓存容量提升至近3倍之多。

不难看出,第五代至强®️ 可扩展处理器与“前任们”相比,在规格与性能上着实是有了不小的提升。

但英特尔可不仅仅是披露,而是已经将第五代至强®️ 可扩展处理器用起来,并把实打实的使用效果展示了出来。

例如在大模型的推理方面,京东云便在现场展示了搭载第五代至强®️ 可扩展处理器的新一代自研服务器所呈现的能力——

全部以超过20%的性能提升“姿势”亮相!

wKgZomWFB-OAT-ZkAADZysZJhkA01.jpeg

具体而言,京东云与上一代自研服务器有了如下的性能提升:

• 整机性能提升达123%;

• AI计算机视觉推理性能提升至138%;

• Llama 2推理性能提升至151%。

这也再一次证明了在五代至强®️ 上搞大模型,是越发得吃香了。

而除了大模型之外,像涉及AI的各种细分领域,如整机算力、内存宽带、视频处理等等,也有同样的实测结果。

这份结果则是来自采用了第五代英特尔® 至强® 可扩展处理器的火山引擎——

其全新升级的第三代弹性计算实例,整机算力提升39%;应用性能最高提升43%。

wKgaomWFB-OAAymgAAE_94O5CLA66.jpeg

而且在性能提升的基础上,据火山引擎透露,通过其独有的潮汐资源并池能力,构建了百万核弹性资源池,能够用近似包月的成本提供按量使用体验,上云成本更低了!

这是由于使用内置于第五代至强®️ 可扩展处理器中的加速器时,可将每瓦性能平均提升10倍;在能耗低至105W的同时,也有已针对工作负载优化的高能效SKU。

可以说是实打实的降本增效了。

云计算和安全性方面,亮出实测体验的同样是来自国内的大厂——阿里云。

在搭载第五代英特尔® 至强® 可扩展处理器及其内置的英特尔® AMX、英特尔® TDX加速引擎后,阿里云打造了“生成式AI模型及数据保护“的创新实践,使第8代ECS实例在安全性和AI性能上都获得了显著提升,且保持实例价格不变,普惠客户。

包括推理性能提高25%、QAT加解密性能提升20%、数据库性能提升25%,以及音视频性能提升15%。

wKgZomWFB-SAI0PgAAEAIX7L96c34.jpeg

值得一提的是,内置的英特尔®️ SGX/TDX还可以为企业分别提供更强也更易用的应用隔离能力和虚拟机 (VM) 层面的隔离和保密性,为现有应用提供了一条更简便的向可信执行环境迁移的路径。

以及第五代英特尔® 至强® 可扩展处理器在软件和引脚上是与上一代兼容的,还可以大大减少测试和验证工作。

总的来说,第五代至强® 可扩展处理器可谓“诚意满满”、表现非常亮眼,而它背后所透露出来的,正是英特尔在AI领域一直都非常重视落地的态度。

##背后是一部AI落地史

事实上,作为服务器/工作端芯片,英特尔® 至强® 可扩展处理器从2017年第一代产品开始就利用英特尔®️ AVX-512技术的矢量运算能力对AI进行加速上的尝试;而2018年在第二代至强®️ 可扩展处理器中导入深度学习加速技术(DL Boost)更是让至强成为“CPU跑AI”的代名词;在之后第三代到第五代至强®️ 可扩展处理器的演进中,从BF16的增添再到英特尔®️ AMX的入驻,可以说英特尔一直在充分利用CPU资源的道路上深耕,以求每一代处理器CPU都能支持各行各业推进AI实战。

起先是在传统行业。

例如第二代至强®️ 就发力智能制造,帮助企业解决海量实时数据处理挑战,提升生产线系统效率,完成“肉眼可见”的产能扩展。

随后,至强® 可扩展处理器开始在大模型界大展身手。

在AlphaFold2掀起的蛋白质折叠预测热潮之中,第三代和第四代至强® 可扩展处理器连续接力,不断优化端到端通量能力。实现比GPU更具性价比的加速方案,直接拉低AI for Science的入场门槛。

wKgaomWFB-SAFjrkAACXT0fAyMw375.png

这其中就有从第四代开始内置于CPU中,面向深度学习应用推出的创新AI加速引擎——英特尔® AMX的功劳。作为矩阵相关的加速器,它能显著加速基于CPU平台的深度学习推理和训练,提升AI整体性能,对INT8、BF16等低精度数据类型都有着良好的支持。

与此同时,在大模型时代的OCR技术应用,也被第四代至强® 可扩展处理器赋予了新的“灵魂”,准确率飙升、响应延迟更低。

wKgZomWFB-WAZpQ9AAC1ttdutD459.jpeg

同样,就在不久之前,借助第四代至强®️ 可扩展处理器在NLP上的优化,专攻医疗行业的大语言模型也成功以较低成本在医疗机构部署落地。

AI技术越来越深入各行各业的大趋势之下,至强® 可扩展处理器让我们看到,它所代表的CPU解法完全能够有所作为、能够让不少AI应用在部署更为广泛、获取更加容易、应用门槛也更低的CPU平台上获得实实在在的落地开花。

第五代至强® 可扩展处理器的发布,则让这个进程更进一步。

当然——

这一成绩的背后,确实是因为大家对“在CPU上跑AI”这件事上有需求,以及它本身也有极其深厚的价值和优势。

先说需求,无论是传统企业推进智能化改造,还是AI for Science、生成式AI等新兴技术的蓬勃发展,都需要强大的算力来驱动。

但大家面临的局势却是:专门的加速芯片供不应求,采购难不说,成本也十分高昂,因此还远远不够普及。

于是一部分人自然将目光投向CPU:

这个现实中最为“触手可及”的硬件,如果直接加以利用,岂不是事半功倍?

这就引出CPU的价值和优势。

就拿当下热门话题生成式AI来说,如果想在生产环境中普及这一能力,就得尽可能地控制成本。

相比训练来说,AI的推理对算力资源需求没有那么夸张,交给CPU完全能够胜任——不仅延迟更低,能效也更高。

像一些行业和业务,推理任务没有那么繁重,选择CPU无疑更具性价比。

此外,利用CPU直接进行部署还能让企业充分利用既有IT基础设施,避免异构平台的部署难题。

以上,我们也就能够理解:在传统架构中引入AI加速,就是CPU在这个时代的新宿命。

而英特尔做的,就是竭尽全力帮大家挖掘、释放其中的价值。

##驾驭整个AI管线,且不止CPU

最后,我们再回到今天的主角:第五代英特尔® 至强® 可扩展处理器。

wKgaomWFB-WAfhLBAAJQE6o7jUY284.png

实话说,如果和专门的GPU或AI加速芯片相比,它可能确实还不够炫,但主打亲民、易用(开箱即用,配套的软件和生态越发完善)。

更值得我们注意的是,就算在有专用加速器的场合,CPU无论是从数据预处理,还是模型开发和优化,再到部署和使用,也可以成为AI pipeline的一部分。

其中尤其在数据预处理阶段,它已可以称得上是主角的存在。

无论是以GB还是TB计,甚至更大的数据集,基于至强® 可扩展处理器所打造的服务器,都能通过支持更大内存、减少I/O操作等优势,提供高效的处理和分析,节省AI开发中这一最琐碎耗时任务的时间。

基于以上,我们也不得不感叹,如今英特尔在谈AI时,话题更多样化了。

再加上它在GPU和专门的AI加速芯片上也有布局,“武器库”里的选择也更多了,火力覆盖的能力也更全面了。

毫无疑问,这一切,都指向英特尔全面加速AI的决心。

即用一系列具有性价比的产品组合来快速满足不同行业的AI落地需求。

AI 落地时代开始了,英特尔的机会也来了?

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10275

    浏览量

    179344
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11221

    浏览量

    222982
  • 大模型
    +关注

    关注

    2

    文章

    3448

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CPU暴涨36%,AI性能飙升46%!高通第五代骁龙8发布,一加首发

    11月26日,高通在北京发布骁龙8系全新成员——第五代骁龙8移动平台。第五代骁龙8定位于旗舰芯片,这是高通首次采用骁龙8系双旗舰布局。高通产品市场总监马晓民强调,两款芯片并非“Pro版”与“青春版”的区别:“无论是从性能、功耗,
    的头像 发表于 11-27 12:50 7879次阅读
    <b class='flag-5'>CPU</b>暴涨36%,AI性能飙升46%!高通<b class='flag-5'>第五代</b>骁龙8<b class='flag-5'>发布</b>,一加首发

    奇瑞汽车第五代瑞虎8全球上市

    11月10日,自研旗舰 全球冠军——第五代瑞虎8全球上市发布会于北京雁栖湖隆重举行。作为中国新燃油战略下的全新力作,新车集“硬核全能”的驾控实力与“电感体验”的智慧舒适于一身,为用户带来全面越级的驾
    的头像 发表于 11-12 17:55 1024次阅读

    奇瑞汽车第五代瑞虎8即将上市

    11月10日,奇瑞新燃油战略下的重点车型——第五代瑞虎8将正式上市。作为瑞虎8冠军家族的全新产品,第五代瑞虎8集全新设计、电感体验、“赛级民用”的驾控及安全于一身,引领全球燃油车进入下一个时代。
    的头像 发表于 11-10 15:27 416次阅读

    奇瑞汽车第五代瑞虎8开启预售

    世界高城,驭鉴冠军。2025年11月3日,第五代瑞虎8在拉萨正式开启预售,预售价10.59万元至13.59万元,同时提供虎款、豹款两种造型供选择。为助力更多用户畅享豪华大座家庭SUV出行体验,第五代瑞虎8同步带来
    的头像 发表于 11-04 12:53 566次阅读

    新品 | 第五代CoolGaN™ 650-700V氮化镓功率晶体管G5

    新品第五代CoolGaN650-700V氮化镓功率晶体管G5第五代650-700VGaN氮化镓功率晶体管可实现高频工况下的效率提升,并满足最高质量标准,能够打造具有超高效率的高可靠性设计。该系
    的头像 发表于 11-03 18:18 2495次阅读
    新品 | <b class='flag-5'>第五代</b>CoolGaN™ 650-700V氮化镓功率晶体管G5

    高通骁龙旗舰移动平台新成员第五代骁龙8至尊版即将于2025骁龙峰会发布

    平台将采用相同的“第五代”代际命名。 2025骁龙峰会已进入倒计时!下一旗舰移动平台——#第五代骁龙8至尊版 将如期而至。在揭开其移动
    的头像 发表于 09-15 10:58 4014次阅读

    主控CPU全能选手,英特尔至强6助力AI系统高效运转

    有什么特殊之处呢? AI加速系统为何看重CPU主控能力? 作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套系统的性能。选择英特尔
    的头像 发表于 06-27 11:44 609次阅读
    主控<b class='flag-5'>CPU</b>全能选手,<b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6助力AI系统高效运转

    TOLL和DFN封装CoolGaN™ 650V G5第五代氮化镓功率晶体管

    新品TOLL和DFN封装CoolGaN650VG5第五代氮化镓功率晶体管第五代CoolGaN650VG5氮化镓功率晶体管可在高频工况下显著提升能效,符合业界最高质量标准,助力打造兼具超高效率与卓越
    的头像 发表于 06-26 17:07 1945次阅读
    TOLL和DFN封装CoolGaN™ 650V G5<b class='flag-5'>第五代</b>氮化镓功率晶体管

    1.9倍性能提升!英特尔至强6在MLPerf基准测试中表现卓越

    第五代至强处理器相比,英特尔至强6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基准测试结果,其中,
    的头像 发表于 04-07 10:58 518次阅读

    英特尔至强6处理器助力数据中心整合升级

    继去年9月重磅推出英特尔 至强 6900性能核处理器后,英特尔进一步扩充至强6产品家族,于近期发布
    的头像 发表于 03-13 17:36 1266次阅读

    英特尔至强6:如何炼就数据中心“全能型选手”

    计算密集型工作负载而设计,新发布至强6700P和至强6500P不仅在AI推理、单核性能等关键领域展现出家族“优等生”风范,还面向多路服务器应用场景,提供了高度灵活的适配方案。   作为数据中心的“全能型选手”,
    的头像 发表于 03-13 14:57 545次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>至强</b>6:如何炼就数据中心“全能型选手”

    英特尔至强6再推新品!打造最强AI“机头引擎”

    的产品矩阵,很好地满足市场的多样化需求;另一方面,凭借卓越的 AI 性能提升,英特尔为数据中心提供了性能强劲的机头节点 CPU,助力企业在数字时代的浪潮中稳步前行。 事实上,去年9月,英特尔就推出了配备128核的6900性能核处
    的头像 发表于 03-13 14:57 594次阅读

    上汽大众途昂Pro首发搭载第五代EA888发动机

    蛇年伊始,上汽大众带来重磅消息——第五代EA888发动机率先在中国实现量产并由途昂 Pro全球首发搭载。
    的头像 发表于 02-08 09:28 987次阅读

    英特尔带您解锁云上智算新引擎

    在近日举办的2024火山引擎FORCE原动力大会上,英特尔与火山引擎联合发布基于英特尔 至强 6 性能核处理器的第四服务器实例,以打造弹性
    的头像 发表于 12-23 14:05 1235次阅读

    联想发布基于第五代AMD EPYC处理器的服务器产品

    近日,联想携手AMD共同举办“异构智算,稳定高效——联想算力基础设施新品发布会”。本次发布会上,联想重磅发布8款基于第五代AMD EPYC处
    的头像 发表于 12-16 16:23 1206次阅读