0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

服务器市场被AMD蚕食 下一代至强能否逆转颓势

lPCU_elecfans 来源:电子发烧友网 作者:周凯扬 2021-11-11 09:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)在Arm虎视眈眈,RISC-V新秀崛起的处境下,x86处理器内部的竞争也进入了白热化阶段。AMD继推出Zen CPU架构以来,总市场份额上正在一步步迎头赶上,虽说桌面和移动CPU上英特尔与AMD打得有来有回,但服务器处理器市场份额上,AMD保持着稳步增长的态势,越来越多的云服务商和数据中心转投了“AMD Yes”的阵营,更是在今年第三季度打破了市占率记录,达到了16%。尽管英特尔依然占据着70%以上的市场,面临多方压力下,这种优势似乎难以继续维持了。

在今年上半年推出了第三代至强可扩展处理器之后,英特尔于近期透露了下一代服务器处理器“Sapphire Rapids”的更多情报。鉴于我们已经在消费级桌面处理器12代酷睿上看到了Intel 7制程带来的惊艳改进,那么同用这一制程的下一代Xeon处理器,是否也能在明年发布之际一鸣惊人呢?

新的I/O与内存

考虑到Sapphire Rapids定于明年发售,AMD的新一代EPYC处理器又发售在即,英特尔并没有公布太多通用计算性能上的情报。但从英特尔在Innovation 2021和Linley Fall Processor两场大会上公布的模组化芯片设计,也能看出Sapphire Rapids并非什么泛泛之辈。

与刚发布的12代酷睿一样,Sapphire Rapids 同样引入了对PCIe 5.0的支持,也在此之上进一步提升了处理器的DDIO和QoS能力。除此之外,CXL 1.1和全新的UPI 2.0也在支持之列。

在服务器和数据中心应用上,内存也是最容易出现瓶颈的一大组成要素。我们可以从芯片原理图中可以看出Sapphire Rapids集成了4个内存控制器,以此最高支持8通道DDR5内存。针对计算或额外开销特别大的场景,英特尔也提供了旗下傲腾持久内存Optane 300系列的支持,作为内存支持的同时也可以作为存储使用。英特尔还将推出支持HBM的版本,提供远高于8通道DDR5的内存带宽。该版本将提供两种HBM模式,一种是HBM Flat模式,支持HBM+DDR5混用或是仅用HBM的模式。另一种是HBM缓存模式,将HBM作为DRAM的备用缓存,类似于一个L4缓存。

通用计算中的AI加速

随着AI逐渐在服务器工作流中提高占比,AI计算能力成了每个服务器处理器都躲不开的参数,这也成了英特尔在宣传Sapphire Rapids时不离口的话题。第三代至强可扩展处理器中,英特尔在其中内置了深度学习加速器和AVX-512向量扩展,为int8和bfloat16数据的推理和训练提供了支持。而在Sapphire Rapids中,英特尔又加入了两大全新加速引擎AMX(先进矩阵扩展)和DSA(数据流加速器)。

AMX乃是一种全新的切片式指令集扩展,支持以切片运作的加速器,也是英特尔专为张量运算准备的指令集扩展。该扩展由两部分组成,切片和加速器。切片由8个2D寄存器堆组成,支持加载、清除和设为常量等基础数据运算符。每个寄存器堆大小可达1KB,但设计者也可以根据自己的算法来减小其规模。除此之外,英特尔也已经确认Linux 5.16版本将正式加入对于AMX的支持。

英特尔目前仅发布了TMUL加速器(切片矩阵乘法单元),但AMX是一个可以继续扩展下去的架构,未来还可以加入新的加速器,也可以改进现有的TMUL加速器实现更高的性能,从而在单个指令和单个微操作下表达更多的工作,节省fetch、decode以及OOO的功耗。在测试中,同一个Sapphire Rapids处理器分别使用AMX指令和AVX-512 VNNI,AMX的运算速度是后者的7.8倍。

过去AVX-512的使用中,经常会出现功率上去后频率也随之降低的情况,不少人也担心全新的AMX是否会有类似的情况。英特尔确认在快速自动的得当电源控制下,AMX不会出现AVX的频率抖动现象。

在高性能存储、连接和密集处理的应用中,人们总是想找到解放处理器核心来提升整体性能的方式。英特尔在这个需求上推出了DSA数据流加速器,DSA可以转移CPU缓存、DDR内存以及其他I/O附加设备的数据,它的目标是为数据转移和转换运算提供更高的总体系统性能,让CPU周期解放出来完成其他更高级的功能。根据英特尔给出的数据,在OpenvSwitch的虚拟交换机应用中,加入DSA分担工作流后,CPU占用率降低了39%,数据转移性能提高了2.5倍。

至强可以替代GPU吗?

我们都知道如今的服务器市场已经不是CPU一家独大的天下了,无论是语音识别还是图像处理,GPU带来的AI计算能力渗透进了每一个场景,任意深度学习“炼丹师”最先考虑的硬件设备也是GPU。在英特尔对Sapphire Rapids的描述中,称其AI性能相较于上一代Ice Lake芯片有了30倍的提升,如此大幅度的提升能够替代GPU吗?

英特尔为Sapphire Rapids给出的对比对象为英伟达的A30 GPU,在ResNet-50 v1.5的图像分类推理中,单个A30的输出速度为15411张每秒,而两个Sapphire Rapids的成绩达到了24000张每秒以上。这一数字对比看起来似乎优势巨大,甚至接近于29855张每秒的A100 GPU,但测试中用到的乃是高端Sapphire Rapids型号(40核以上),无论是功耗和价格都要远超A30。

因而现阶段下,仍在使用大量AI负载的服务器并不会从现有的GPU或ASIC架构迁移。不过Sapphire Rapids本身也并非仅针对AI的特化产品,之所以x86 CPU要费心费力地去提高AI性能,也是面向通用计算与AI结合这样越来越普遍的轻度AI场景。

小结

要想把AMD夺去的市场份额夺回来并不容易,英特尔面临的已经不是本世纪初的双雄争霸局面了。Sapphire Rapids可以说是换帅、换制程和换架构后的首个服务器产品,如果不能一鸣惊人的话,不少客户可能都会被AMD未来更注重成本效能的Zen 4D与Zen 5夺走。而面对Arm、RISC-V、GPU、ASIC等多方入局AI的挑战,如果英特尔仍想保持x86的霸主地位,也必须加速开发自身的Xe服务器GPU,同时继续扩展x86下的AI加速器生态。

声明:本文由电子发烧友原创,转载请注明以上来源。如需入群交流,请添加微信elecfans999,投稿爆料采访需求,请发邮箱huangjingjing@elecfans.com。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 加速器
    +关注

    关注

    2

    文章

    836

    浏览量

    39712
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5099

    浏览量

    134451
  • PCIe
    +关注

    关注

    16

    文章

    1420

    浏览量

    87541
  • RISC-V
    +关注

    关注

    48

    文章

    2792

    浏览量

    51889

原文标题:服务器市场被AMD蚕食,下一代至强能否逆转颓势

文章出处:【微信号:elecfans,微信公众号:电子发烧友网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    历史首次!AMD服务器CPU市占率达50%

    英特尔持平。根据AMD的数据显示,自EPYC CPU推出以来,其在服务器领域的市场份额由2018年的2%提升到2024年上半年的34%。在持平之后未来竞争将变得更加激烈。       回看每
    的头像 发表于 08-11 03:20 9960次阅读
    历史首次!<b class='flag-5'>AMD</b><b class='flag-5'>服务器</b>CPU市占率达50%

    AMD CPU与FPGA助力新一代服务器设计

    如今,数据中心服务器市场的竞争日益激烈。服务器制造商可采用的底层计算技术逐渐趋同,这意味着性能已成为行业标配。为打造差异化优势并在市场竞争中脱颖而出,原始设计制造商( ODM )和原始
    的头像 发表于 10-27 15:25 534次阅读
    <b class='flag-5'>AMD</b> CPU与FPGA助力新<b class='flag-5'>一代</b><b class='flag-5'>服务器</b>设计

    构建下一代电力架构:倾佳电子面向AI服务器的全数字双输入碳化硅电源深度解析

    构建下一代电力架构:倾佳电子面向AI服务器的全数字双输入碳化硅电源深度解析 倾佳电子(Changer Tech)是家专注于功率半导体和新能源汽车连接的分销商。主要
    的头像 发表于 10-20 19:58 287次阅读
    构建<b class='flag-5'>下一代</b>电力架构:倾佳电子面向AI<b class='flag-5'>服务器</b>的全数字双输入碳化硅电源深度解析

    Telechips与Arm合作开发下一代IVI芯片Dolphin7

    Telechips宣布,将在与 Arm的战略合作框架下,正式开发下一代车载信息娱乐系统(IVI)系统级芯片(SoC)“Dolphin7”。
    的头像 发表于 10-13 16:11 762次阅读

    适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    电子发烧友网为你提供()适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM相关产品参数、数据手册,更有适用于下一代 GGE 和 HSPA 手机的多模/多频段 PAM的引脚图、接线图、封装
    发表于 09-05 18:34
    适用于<b class='flag-5'>下一代</b> GGE 和 HSPA 手机的多模/多频段 PAM skyworksinc

    看点:AMD服务器CPU市场份额追上英特尔 华为Mate80主动散热专利曝光

    给大家带来些业界资讯: AMD服务器CPU市场份额追上英特尔 根据市场研究机构PassMark的统计分析数据显示,
    的头像 发表于 07-25 14:41 807次阅读
    看点:<b class='flag-5'>AMD</b><b class='flag-5'>服务器</b>CPU<b class='flag-5'>市场</b>份额追上英特尔 华为Mate80主动散热专利曝光

    英特尔服务器CPU市场失守:从99.9%到50%以下

    ,具体为 62.7%;同期 AMD 拥有 32.8% 的服务器 CPU 市场份额,且该数据仍处于持续增长态势。预计到 2025 年底,AMD市场
    的头像 发表于 07-01 01:19 4020次阅读
    英特尔<b class='flag-5'>服务器</b>CPU<b class='flag-5'>市场</b>失守:从99.9%到50%以下

    下一代高速芯片晶体管解制造问题解决了!

    ,10埃)开始直使用到A7。 从这些外壁叉片晶体管的量产中获得的知识可能有助于下一代互补场效应晶体管(CFET)的生产。 目前,领先的芯片制造商——英特尔、台积电和三星——正在利用其 18A、N2
    发表于 06-20 10:40

    下一代PX5 RTOS具有哪些优势

    许多古老的RTOS设计至今仍在使用,包括Zephyr(1980年)、Nucleus(1990年)和FreeRTOS(2003年)。所有这些旧设计都有专有的API,通常更大、更慢,并且缺乏下一代RTOS的必要安全认证和功能。
    的头像 发表于 06-19 15:06 874次阅读

    龙芯服务器GDC-2000:国产自主可控的高性能计算平台

    随着龙芯新一代处理3C6000的流片成功(性能接近英特尔至强Silver 4314),国产服务器在高端市场的竞争力将持续增强。GDC-20
    的头像 发表于 02-28 14:11 851次阅读

    HPE携手英特尔至强6,打造新一代服务器性能巅峰

    近日,慧与科技(HPE)推出了八款全新HPE ProLiant Compute Gen12服务器,标志着新一代企业级服务器领域的新标杆正式诞生。这系列
    的头像 发表于 02-18 10:38 701次阅读

    百度李彦宏谈训练下一代大模型

    “我们仍需对芯片、数据中心和云基础设施持续投入,以打造更好、更智能的下一代模型。”
    的头像 发表于 02-12 10:38 766次阅读

    部署音乐流媒体服务器 mStream

    传统服务器,云服务器能够提供更好的成本效益、更高的可用性和更强的数据安全性,适合各种规模的企业使用。 华为云下一代服务器 Flexus X 实例焕新上线,新产品基于客户业务负载进行动
    的头像 发表于 01-17 09:20 1083次阅读
    部署音乐流媒体<b class='flag-5'>服务器</b> mStream

    今日看点丨龙芯中科:下一代桌面芯片3B6600预计明年上半年交付流片;消息称英伟达 Thor 芯片量产大幅推迟

    方面,龙芯中科下一代服务器芯片3C6000目前处于样片阶段,预计2025年Q2完成产品化并正式发布。根据内部自测的结果,公司16核32线程的3C6000/S性能可对标至强4314,双硅片封装的32核
    发表于 12-17 11:17 1629次阅读

    联想发布基于第五AMD EPYC处理服务器产品

    近日,联想携手AMD共同举办“异构智算,稳定高效——联想算力基础设施新品发布会”。本次发布会上,联想重磅发布8款基于第五AMD EPYC处理
    的头像 发表于 12-16 16:23 1200次阅读