0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔是否也能在明年发布之际一鸣惊人

lPCU_elecfans 来源:电子发烧友网 作者:周凯扬 2021-11-11 09:37 次阅读

Arm虎视眈眈,RISC-V新秀崛起的处境下,x86处理器内部的竞争也进入了白热化阶段。AMD继推出Zen CPU架构以来,总市场份额上正在一步步迎头赶上,虽说桌面和移动CPU上英特尔与AMD打得有来有回,但服务器处理器市场份额上,AMD保持着稳步增长的态势,越来越多的云服务商和数据中心转投了“AMD Yes”的阵营,更是在今年第三季度打破了市占率记录,达到了16%。尽管英特尔依然占据着70%以上的市场,面临多方压力下,这种优势似乎难以继续维持了。

在今年上半年推出了第三代至强可扩展处理器之后,英特尔于近期透露了下一代服务器处理器“Sapphire Rapids”的更多情报。鉴于我们已经在消费级桌面处理器12代酷睿上看到了Intel 7制程带来的惊艳改进,那么同用这一制程的下一代Xeon处理器,是否也能在明年发布之际一鸣惊人呢?

新的I/O与内存

考虑到Sapphire Rapids定于明年发售,AMD的新一代EPYC处理器又发售在即,英特尔并没有公布太多通用计算性能上的情报。但从英特尔在Innovation 2021和Linley Fall Processor两场大会上公布的模组化芯片设计,也能看出Sapphire Rapids并非什么泛泛之辈。

与刚发布的12代酷睿一样,Sapphire Rapids 同样引入了对PCIe 5.0的支持,也在此之上进一步提升了处理器的DDIO和QoS能力。除此之外,CXL 1.1和全新的UPI 2.0也在支持之列。

在服务器和数据中心应用上,内存也是最容易出现瓶颈的一大组成要素。我们可以从芯片原理图中可以看出Sapphire Rapids集成了4个内存控制器,以此最高支持8通道DDR5内存。针对计算或额外开销特别大的场景,英特尔也提供了旗下傲腾持久内存Optane 300系列的支持,作为内存支持的同时也可以作为存储使用。英特尔还将推出支持HBM的版本,提供远高于8通道DDR5的内存带宽。该版本将提供两种HBM模式,一种是HBM Flat模式,支持HBM+DDR5混用或是仅用HBM的模式。另一种是HBM缓存模式,将HBM作为DRAM的备用缓存,类似于一个L4缓存。

通用计算中的AI加速

随着AI逐渐在服务器工作流中提高占比,AI计算能力成了每个服务器处理器都躲不开的参数,这也成了英特尔在宣传Sapphire Rapids时不离口的话题。第三代至强可扩展处理器中,英特尔在其中内置了深度学习加速器和AVX-512向量扩展,为int8和bfloat16数据的推理和训练提供了支持。而在Sapphire Rapids中,英特尔又加入了两大全新加速引擎AMX(先进矩阵扩展)和DSA(数据流加速器)。

AMX乃是一种全新的切片式指令集扩展,支持以切片运作的加速器,也是英特尔专为张量运算准备的指令集扩展。该扩展由两部分组成,切片和加速器。切片由8个2D寄存器堆组成,支持加载、清除和设为常量等基础数据运算符。每个寄存器堆大小可达1KB,但设计者也可以根据自己的算法来减小其规模。除此之外,英特尔也已经确认Linux 5.16版本将正式加入对于AMX的支持。

英特尔目前仅发布了TMUL加速器(切片矩阵乘法单元),但AMX是一个可以继续扩展下去的架构,未来还可以加入新的加速器,也可以改进现有的TMUL加速器实现更高的性能,从而在单个指令和单个微操作下表达更多的工作,节省fetch、decode以及OOO的功耗。在测试中,同一个Sapphire Rapids处理器分别使用AMX指令和AVX-512 VNNI,AMX的运算速度是后者的7.8倍。

过去AVX-512的使用中,经常会出现功率上去后频率也随之降低的情况,不少人也担心全新的AMX是否会有类似的情况。英特尔确认在快速自动的得当电源控制下,AMX不会出现AVX的频率抖动现象。

在高性能存储、连接和密集处理的应用中,人们总是想找到解放处理器核心来提升整体性能的方式。英特尔在这个需求上推出了DSA数据流加速器,DSA可以转移CPU缓存、DDR内存以及其他I/O附加设备的数据,它的目标是为数据转移和转换运算提供更高的总体系统性能,让CPU周期解放出来完成其他更高级的功能。根据英特尔给出的数据,在OpenvSwitch的虚拟交换机应用中,加入DSA分担工作流后,CPU占用率降低了39%,数据转移性能提高了2.5倍。

至强可以替代GPU吗?

我们都知道如今的服务器市场已经不是CPU一家独大的天下了,无论是语音识别还是图像处理,GPU带来的AI计算能力渗透进了每一个场景,任意深度学习“炼丹师”最先考虑的硬件设备也是GPU。在英特尔对Sapphire Rapids的描述中,称其AI性能相较于上一代Ice Lake芯片有了30倍的提升,如此大幅度的提升能够替代GPU吗?

英特尔为Sapphire Rapids给出的对比对象为英伟达的A30 GPU,在ResNet-50 v1.5的图像分类推理中,单个A30的输出速度为15411张每秒,而两个Sapphire Rapids的成绩达到了24000张每秒以上。这一数字对比看起来似乎优势巨大,甚至接近于29855张每秒的A100 GPU,但测试中用到的乃是高端Sapphire Rapids型号(40核以上),无论是功耗和价格都要远超A30。

因而现阶段下,仍在使用大量AI负载的服务器并不会从现有的GPU或ASIC架构迁移。不过Sapphire Rapids本身也并非仅针对AI的特化产品,之所以x86 CPU要费心费力地去提高AI性能,也是面向通用计算与AI结合这样越来越普遍的轻度AI场景。

小结

要想把AMD夺去的市场份额夺回来并不容易,英特尔面临的已经不是本世纪初的双雄争霸局面了。Sapphire Rapids可以说是换帅、换制程和换架构后的首个服务器产品,如果不能一鸣惊人的话,不少客户可能都会被AMD未来更注重成本效能的Zen 4D与Zen 5夺走。而面对Arm、RISC-V、GPU、ASIC等多方入局AI的挑战,如果英特尔仍想保持x86的霸主地位,也必须加速开发自身的Xe服务器GPU,同时继续扩展x86下的AI加速器生态。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • amd
    amd
    +关注

    关注

    25

    文章

    5190

    浏览量

    132631
  • 加速器
    +关注

    关注

    2

    文章

    741

    浏览量

    36590
  • 服务器
    +关注

    关注

    12

    文章

    8105

    浏览量

    82485
收藏 人收藏

    评论

    相关推荐

    英特尔发布零售门店数字化赋能专项报告

    英特尔亮相第二十四届中国零售业博览会(China Shop 2024)。会上,英特尔发布了《零售门店数字化赋能专项报告(2024年)》。
    的头像 发表于 03-17 17:09 722次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>发布</b>零售门店数字化赋能专项报告

    英特尔:2025年全球AIPC将超1亿台占比20%

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月29日 09:15:26

    英特尔1nm投产时间曝光!领先于台积电

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月28日 16:28:32

    英特尔再创辉煌!1.4nm芯片工艺领航微电子时代,工业界的新里程碑?

    英特尔行业资讯
    北京中科同志科技股份有限公司
    发布于 :2024年02月26日 08:58:21

    英特尔登顶2023年全球半导体榜单之首

    英特尔行业芯事
    深圳市浮思特科技有限公司
    发布于 :2024年02月01日 11:55:16

    英特尔酷睿14代处理器系列发布,Arrowlake/LunarLake24年问世

    处理器英特尔
    looger123
    发布于 :2024年01月10日 17:44:38

    AI 无处不在,英特尔酷睿Ultra 和第五代英特尔至强可扩展处理器正式发布

    今天,英特尔在北京举办以“AI无处不在,创芯无所不及”为主题的2023英特尔新品发布会暨AI 技术创新派对,携手ISV、OEM、CSP产业伙伴在内的AI生态,共同见证了英特尔AI战略的
    的头像 发表于 12-16 16:05 388次阅读
    AI 无处不在,<b class='flag-5'>英特尔</b>酷睿Ultra 和第五代<b class='flag-5'>英特尔</b>至强可扩展处理器正式<b class='flag-5'>发布</b>

    英特尔发布气候转型行动方案

    近日,英特尔正式发布气候转型行动方案,详细介绍了英特尔减少碳足迹的路径。与本次方案同时发布的,还有来自英特尔CEO帕特·基辛格的一封信,信中
    的头像 发表于 11-24 20:00 257次阅读
    <b class='flag-5'>英特尔</b><b class='flag-5'>发布</b>气候转型行动方案

    英特尔明年推出的Lunar Lake CPU将由台积电代工

    业界预测,从存储半导体的情况看,明年将生产英特尔luna lake的cpu、gpu、高速io芯片等,并通过n3b工程批量生产,明年上半年开始批量生产。
    的头像 发表于 11-22 09:54 413次阅读

    #高通 #英特尔 #Elite 高通X Elite芯片或终结苹果、英特尔的芯片王朝

    高通英特尔苹果
    深圳市浮思特科技有限公司
    发布于 :2023年10月27日 16:46:07

    OpenVINO工具套件是否可以商业化使用?

    参阅 英特尔® OpenVINO™分销许可第 2.1 节(2021 年 5 月版本)。 无法了解英特尔® 发行版 OpenVINO™ 工具套件是否可以商业化使用。
    发表于 08-15 08:19

    安装OpenVINO工具套件英特尔Distribution时出现错误的原因?

    安装OpenVINO™工具套件英特尔 Distribution时,出现错误: Python 3.10.0.ECHO is off. Unsupported Python version.
    发表于 08-15 08:14

    英特尔媒体加速器参考软件Linux版用户指南

    英特尔媒体加速器参考软件是用于数字标志、交互式白板(IWBs)和亭位使用模型的参考媒体播放器应用软件,它利用固定功能硬件加速来提高媒体流速、改进工作量平衡和资源利用,以及定制的图形处理股(GPU)管道解决方案。该用户指南将介绍和解释如何为Linux* 使用英特尔媒体加速器
    发表于 08-04 06:34

    英特尔锐炫Pro图形显卡上新!

    英特尔推出两款全新英特尔锐炫Pro图形显卡;搭载英特尔锐炫Pro A40图形显卡的系统现已出货。 全新发布英特尔今日宣布
    的头像 发表于 06-21 13:10 446次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro图形显卡上新!

    英特尔锐炫Pro图形显卡上新!

    英特尔推出两款全新英特尔锐炫Pro图形显卡;搭载英特尔锐炫Pro A40图形显卡的系统现已出货。 全新发布英特尔今日宣布
    的头像 发表于 06-09 20:30 467次阅读