0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU市场新十字路口,第三方不如自研?

E4Life 来源:电子发烧友网 作者:周凯扬 2024-04-14 06:00 次阅读
电子发烧友网报道(文/周凯扬)在1G/10G的网络发展阶段,就已经有了标准网卡NIC投入应用,满足基本的数据包传输和接收工作。但随着云计算、虚拟化、机密计算等追求更高性能和更多功能的场景出现,传统的网卡已经无法满足大家的需求,CPU需要进一步减轻在网络、存储和安全负载,所以整个行业迈入了智能网卡阶段。
在SmartNIC智能网卡阶段,绝大多数产品都是基于FPGA打造的,但数据中心对IO性能要求越来越高,就连如今的这些网卡都需要参与更多的数据处理工作,也就慢慢转向人们口中常说的DPU,在高速的NIC数据路径上加入更多的处理器核心,靠软件定义网络。从2020年开始,DPU市场广受资本市场追捧,不少厂商都在这个阶段开启了收购,然后纷纷将产品更名为xPU。
从技术路线上,DPU也被分成了三种,一种是NIC与FPGA或CPU核心依靠PCIe等技术相连的混合解决方案,另一种是NIC和处理器核心高度集成在一个SoC内的方案,最后则是纯粹的高度并行化FPGA方案。
然而到了2024年,DPU市场明显达到了一个新的十字路口。首先DPU在超大规模云服务商的受欢迎程度越来越高,DPU也成了他们实现差异化最佳的方式之一。几大DPU厂商仍在推陈出新,但由于产量、封闭等原因,我们还是没能看到DPU以更大的规模在服务器上铺开,即便是在应用最多的超大规模云服务商的服务器上,其部署率也不过刚突破50%。
英伟达,DPU+SuperNIC
2019年3月,英伟达斥资69亿美元收购了Mellanox,也因此收获了其BlueField IP,并开始推行DPU的概念。GTC2020年上,英伟达很快就宣布了由他们打造的首个BlueField DPU卡BlueField-2,随后又公开了将Ampere架构的GPU集成在同一张卡上的BlueField-2X,利用GPU来提升其算力。
2021年,英伟达宣布了其最新的BlueField-3,集成了至多16个Arm A78核心,支持PCIe 5.0。但也就是从这一代开始,英伟达对于BlueField的定位出现了分支,也就是全新的SuperNIC。在英伟达的描述中SuperNIC又是一个用于提升网络性能的设备,与SmartNIC、DPU和IPU听起来好像也没有什么不同。但SuperNIC专门针对AI加速网络做了优化。
BlueField DPU路线图 / 英伟达
其中BlueField-3 DPU和过去的DPU产品定位保持一致,用于卸载和加速网络、存储、安全和管理功能。而BlueField-3 SuperNIC则主要用于网络活动更密集、需要大量并行运算的场景,也就是AI服务器/GPU服务器。
在拓展效率上,SuperNIC也要更强一些。比如在单个系统中,往往只能容纳1到2个BlueField-3 DPU,却可以容纳至多8个BlueField SuperNIC。而且单个系统中,GPU与SuperNIC 1:1的比例能够进一步提升AI服务器的效率。
今年即将推出的BlueField 4将进一步增加晶体管规模的同时,网络性能将用于支持800Gbps的数据中心网络。不仅如此,英伟达决心在其算力上实现巨大提升,从BlueField-3的1.5TOPS,直接暴涨到1000TOPS。
AMD,SmartNIC+Pensando
为了在服务器市场抢占更多的市场份额,我们可以看到AMD这几年不断地在CPU和GPU的设计上推陈出新,一点点地蚕食英特尔的市场份额,除此之外在SmartNIC和DPU领域,AMD也有所布局。
首先是SmartNIC,作为FPGA大厂,Xilinx在被AMD收购前已经有了优秀的Alveo系列SmartNIC产品阵容,尤其是在对延迟极为敏感的金融电子交易领域,AMD Alveo系列加速卡可谓一骑绝尘。以最新的Alveo UL3524为例,其收发延迟可以降低至3ns以下。
在DPU上,AMD也欲与英伟达、英特尔同台竞争。2022年4月,AMD宣布斥资19亿美元购买DPU厂商Pensando。Pensando作为市面为数不多的DPU厂商,主要优势在于极高的性能。从其路线图上来看,目前AMD已经实现了第一代DPU Capri(200G)和第二代Elba(400G)两大DPU的量产。AMD去年也发布了基于其P4 DPU管线结合16个Arm A72核心的Giglio,在第二代的Elba DPU的基础上对功耗和性能进行了进一步优化。
Pensando DPU路线图 / AMD
AMD预计在今年会发布第三代Pensando DPU,Salina。Salina将采用5nm工艺打造,实现两倍于上一代的性能,与英伟达的BlueField 4一样支持800G网络。而且AMD在Pensando DPU上做好了前向兼容,节省了应用程序开发所需的时间。
也正是在收购后不久,AMD就宣布其Pensando卡成为首批支持由戴尔、HPE和联想等头部服务器供应商提供的VMware vSphere 8的DPU解决方案之一,在vSphere 的支持下,服务器的CPU网络服务负载将进一步降低。除了服务器厂商之外,AMD Pensando也已经收获了Azure、IBM Cloud和Oracle Cloud等云服务客户。
在AMD去年Q1的财报会议上,AMD提到他们的Pensando DPU正在为微软的Azure提供加速连接服务。在支持的实例中,每个设备都部署了六个高性能的AMD Pensando DPU,所有用户程序的虚拟机都能访问这些DPU。微软的加速连接作为一项vNIC租赁业务,用户可以通过开启该服务来改善网络连接效率,相比传统的SmartNIC而言,每秒连接数提升超过10倍。
大量普及却“封闭”的DPU生态
要说市面上最为普及的DPU,那必定是亚马逊的AWS Nitro系列产品,尽管亚马逊并没有用到DPU这个名字。2016年,亚马逊收购了以色列公司Annapurna Labs,随后就在内部开启了最早的自研服务器芯片计划,Nitro。
截至今日,亚马逊自研的AWS Nitro芯片已经迭代了5个版本,AWS云服务上500多种实例都集成了AWS Nitro芯片。考虑到AWS全球第一大云服务商的规模,AWS Nitro可谓是名副其实的第一大DPU。
然而,AWS Nitro是并不对外出售的,属于AWS独占的自研产品。很明显,自研的DPU更能节省成本,并针对自己的服务器架构量体裁衣,这样一个大幅提高竞争力的产品,亚马逊自然不会选择对外出售。
采取同样策略的基本是云服务厂商,包括阿里巴巴和微软。阿里云的MoC卡/神龙芯片CIPU也是类似的产品,从2016年起,阿里巴巴就开始自研相关的虚拟化芯片了,直到2018年MoC卡的正式落地。2021年云栖大会,阿里云发布了第四代神龙架构,实现了网络和存储操作的完全硬件卸载,进一步增强存储IO和网络IO性能,并率先支持大规模的弹性RDMA加速。
去年年初,微软正式宣布收购DPU开发商Fungible。这家DPU厂商一度陷入市场竞争较大,但产品难产的局面,此前被传出售给Meta失败后,已经在采取裁员和缩减产品组合。随着微软收购后,其团队都将加入微软的数据中心基础设施建设开发团队。尽管收购至今,微软还没有拿出对应的产品,但可以想象其DPU方案必定会广泛用于Azure云服务器,从而抛弃第三方的方案,或是为后者统一接口
写在最后
据市场研究公司Dell'Oro Group的预测,从DPU概念兴起的2020年到2028年,市场总值将维持25%的年复合增长率,其中绝大多数市场份额来自排名前四的美国云服务厂商,其次才是来自中国的前四大云服务厂商。
排除掉自研的云服务厂商们,DPU市场并不算大,在20亿美元左右,但持续增长的势头并没有减弱。即便是第三方DPU方案商,比如英伟达、AMD、英特尔、Marvell、Achronix和云豹智能等,也有机会凭借着更高的性能和AI服务器的热潮,打进头部云服务商的服务器中。但对于更小规模的组织来说,他们依然面临着选择受限、部署困难的问题。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    294

    浏览量

    23968
  • AI服务器
    +关注

    关注

    1

    文章

    70

    浏览量

    4682
收藏 人收藏

    评论

    相关推荐

    Labview如何内嵌操作第三方EXE程序!

    自己在网上搜了下相关资料,能把第三方EXE内嵌进入容器里,但是有个问题,这个第三方软件必须手动拖到容器正中间,手动最大化。请问有什么方法可以自动实现吗? 下图是我内嵌的POLL 软件。如图!
    发表于 04-18 14:26

    stm32H743IIT6串口2跟第三方设备通讯,不插USB就通讯不了怎么解决?

    stm32H743IIT6串口2跟第三方设备通讯。插上USB就可以通讯,不插USB就通讯不了,有没有大神帮忙解决下
    发表于 03-22 06:42

    Meta Quest头显将支持多款安卓第三方应用并行

    Meta已悄然启动了与此相关的功能,意味着Quest头显可同时操作多个第三方Android应用。在此之前,Quest对第三方Android应用有严格限制,用户每次仅能打开一个,无法实现同屏幕并行多个第三方应用进程。
    的头像 发表于 03-11 10:58 224次阅读

    使用cubemx 生成usb驱动和配置第三方fatfs,fread读取大于100k的文件,会超时的原因?

    使用cubemx 生成usb驱动和配置第三方fatfs,打开文件没有报错,使用fread读取文件的时候大于100k的文件,会读超时,小于100k正常读完,为什么
    发表于 03-07 06:35

    python第三方库有哪些

    Python 作为一门功能强大的编程语言,拥有丰富的第三方库,几乎覆盖了各个领域的应用。下面是一些常见且广泛应用的 Python 第三方库的总结,希望能为您提供帮助。 NumPy(Numerical
    的头像 发表于 11-29 14:31 825次阅读

    最受欢迎的第三方平台——呼叫中心系统

    中小企业一定要选择正规的呼叫中心供应商,只有应有强大的第三方合作平台,才能拥有更专业的系统团队以及系统维护平台,只有可信的团队才能为企业带来良好的业绩。 本公司呼叫中心系统凭借多年的呼叫中心
    发表于 09-20 17:54

    基于单片机的十字路口交通灯控制器设计

    单片机的十字路口交通灯控制器的设计
    发表于 09-20 08:25

    磁元件企业如何应对新能源“未有之大变局”?

      向左还是向右?站在新能源产业的十字路口,磁元件企业未来的发展方向究竟在哪?
    的头像 发表于 09-13 11:11 492次阅读

    如何在蜂鸟处理器核的基础上扩展第三方指令?

    想咨询一下如何在蜂鸟处理器核的基础上扩展第三方指令,使用户自定义指令,并如何构建机器码等内容? 我看了胡老师的RISC-V处理器设计的书里面讲的使用custom1-4来进行扩展,并以EAI为实例进行
    发表于 08-16 07:36

    如何确定OpenVINO中第三方组件的相关许可?

    无法确定 OpenVINO™中第三方组件的相关许可。
    发表于 08-15 06:45

    学会安装第三方开源库

    你好,我是爱吃鱼香ROS的小鱼。秉承着拒绝重复造轮子的ROS精神,本节我们学习如何在我们的工程里安装第三方开源库。
    的头像 发表于 07-13 14:35 633次阅读
    学会安装<b class='flag-5'>第三方</b>开源库

    智能十字路口开源分享

    电子发烧友网站提供《智能十字路口开源分享.zip》资料免费下载
    发表于 06-20 11:17 0次下载
    智能<b class='flag-5'>十字路口</b>开源分享

    第三方供应商风险评估|不要单独管理第三方风险|虹科分享

    使用ProcessUnity和虹科网络安全评级的整体方法保护您的供应商生态系统赛义亚研究所的一项新研究发现,98%的组织与遭受入侵的第三方有业务往来。报告还发现,公司平均有11个第三方关系,以及数百
    的头像 发表于 05-31 09:34 567次阅读
    <b class='flag-5'>第三方</b>供应商风险评估|不要单独管理<b class='flag-5'>第三方</b>风险|虹科分享

    调用第三方 API 接口会遇到哪些问题

    了 11、接口时好时坏 12、文档和接口逻辑不一致 13、欠费了   前言 在实际工作中,我们经常需要在项目中调用第三方API接口,获取数据,或者上报数据,进行数据交换和通信。 那么,调用第三方 API 接口会遇到哪些问题?如何解决这些问题呢? 这篇文章就跟大家一起聊聊
    的头像 发表于 05-29 14:31 936次阅读

    在SpringBoot中重试调用第三方API教程

    作为后端程序员,我们的日常工作就是调用一些第三方服务,将数据存入数据库,返回信息给前端。但你不能保证所有的事情一直都很顺利。像有些第三方API,偶尔会出现超时。此时,我们要重试几次,这取决于你的重试策略。
    的头像 发表于 05-11 10:43 486次阅读