0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

推动DPU发展的关键技术是什么

智能计算芯世界 来源:DPU发展分析报告(2022年) 2023-01-31 17:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2023年1月7日,在“2023中国信通院ICT+深度观察报告会”算网融合发展分论坛上,中国信息通信研究院联合开放数据中心委员会发布了《DPU发展分析报告(2022年)》。

DPU 将成为下一代芯片技术竞争的高地。作为数据中心继 CPUGPU之后的"第三颗主力芯片",DPU的演进也经历了从众核CPUNP、FPGA+CPU到ASIC+CPU的多个发展阶段或者技术演进。

基于CPU/NP、FPGA+CPU的硬件架构分别具备软件可编程和硬件可编程的灵活优势,在DPU发展的初期尤其受到互联网云厂商大厂自研方案的青睐,在快速迭代和灵活定制方面有比较明显的收益。

然而,随着网络带宽的快速增长,网络接入带宽迅速从10G、25G演进到了100G、200G之后,基于CPU/NP和FPGA+CPU这类硬件架构的DPU除了在性能上难以为继以外,在成本和功耗上则有更大的挑战。基于ASIC+CPU的硬件架构则是结合了ASIC和CPU二者的优势,即将通用处理器的可编程灵活性与专用的加速引擎相结合,正在成为最新的产品趋势。

业界的头部厂商NVIDIA、IntelAMD(收购Pensando)的DPU架构都采用了这种架构路线。

从DPU 芯片的实现角度看,以 ASIC+CPU 的硬件架构为例,CPU的研发更多的是以系统级芯片的方式集成第三方成熟的CPU多核IP,不同DPU厂商的核心竞争壁垒在于专用加速引擎的硬件实现上。由于DPU是数据中心中所有服务器的流量入口,并以处理报文的方式处理数据,在网络芯片领域积累更多的厂商将更有优势。

(一)RDMA高速网络技术1、RDMA的技术背景

传统TCP/IP协议栈在处理报文转发的过程当中,从用户态到内核协议栈再经过网卡转发出去这个过程中,要触发多次CPU的上下文切换,发生多次的内存拷贝,由于多次数据拷贝,转发延时一直较高,随着网络带宽的提升,传统内核处理报文的方式已经无法满足更高带宽,更低延时的业务需求。

646b4018-9751-11ed-bfe3-dac502259ad0.png

RDMA 是一种远程直接内存访问技术,它将数据直接从一台计算机的内存传输到另一台计算机的内存,数据从一端主机的内存通过DMA方式从网卡转发出去,到另一端通过网卡DMA直接写入另一端主机的内存,整个数据传输过程无须操作系统以及CPU参与,这种CPU/内核协议栈的bypass技术通过硬件网卡实现,可以满足未来网络对高带宽、低延时的需求,并进一步释放CPU的计算资源。RDMA技术具有以下特点:

CPU卸载:用户态应用程序通过调用IB verbs接口直接访问远程主机的内存,可以对远程内存执行读取、写入、原子操作等多种操作,而且无须两端主机CPU参与。

内核旁路:RDMA采用基于verbs的编程方式,不同于socket编程方式,需要用户态与内核态的切换,应用程序可以直接在用户态调用RDMA的verbs接口,消除上下文切换带来的额外开销,并实现了额内核系统旁路。

零拷贝:本端应用程序内存数据通过网卡DMA直接发送到远端网卡,远端网卡通过DMA方式直接写入对端内存,整个过程中消除了传统TCP/IP传输方式的多次内存拷贝的过程,实现内存零拷贝,进一步降低整个网络延时。

64825e92-9751-11ed-bfe3-dac502259ad0.png

为了达到RDMA在高性能和低延时上的技术优势,RDMA有高的技术门槛,需要端到端的拥塞控制来避免拥塞和降低网络延时。实现端到端的高性能RDMA网络需要考虑:

1)网络收敛比。进行数据中心网络架构设计时,从成本和收益两方面来考虑,多数会采取非对称带宽设计,即上下行链路带宽不一致,交换机的收敛比简单说就是总的输入带宽除以总的输出带宽;

2)ECMP等价哈希均衡。当前数据中心网络多采用Fabric架构,并采用ECMP来构建多条等价负载均衡的链路,通过设置扰动因子,采用 HASH 选择一条链路来转发是简单的,但这个过程中却没有考虑到所选链路本身是否有拥塞。ECMP并没有拥塞感知的机制,只是将流分散到不同的链路上转发,对于已经产生拥塞的链路来说,很可能加剧链路的拥塞;

3)Incast流量模型,Incast是多打一的通信模式,在数据中心云化的大趋势下这种通信模式常常发生,尤其是那些以Scale-Out方式实现的分布式存储和计算应用,包括EBS云存储、AI集群、高性能数据库、Hadoop、MapReduce、HDFS等;

4)无损网络交换机的流量控制、QoS和拥塞控制机制以及相应的水线设置,能够让RDMA得到规模部署且广泛应用的就需要RDMA的拥塞控制算法支撑。在Fabric网络复杂、多路径的场景下,伴随着多打一、突发等情况的出现,是拥塞控制算法让RDMA的高性能得以充分展现,为RDMA的高性能保驾护航。

端到端拥塞控制算法的基本原理是依托拥塞节点交换机对出向报文的 ECN标记,目的端通过ECN标记处理反馈 CNP使得源端进行速率调节,从而达到解决拥塞的目的。

648f36a8-9751-11ed-bfe3-dac502259ad0.png

随着RDMA技术的普及,不同的云厂商用户结合不同的业务场景和网络环境提出了多种拥塞控制算法,比较有代表的算法有被业界大规模验证过的DCOCN算法,阿里提出的HPCC算法,以及谷歌提出的TIMELY和Swift算法等。不同的用户或者业务场景有不同拥塞控制算法的需求。因此,DPU芯片需要支持多种拥塞控制算法,或者能够一步到位支持拥塞控制算法的可编程能力。

2、RDMA的应用价值

RDMA对比传统TCP传输方式在提升吞吐,降低CPU占用、降低延时方面均有明显的优势。后摩尔时期尤其是在网络进入100G甚至200G以上的带宽情况下,传统TCP协议栈内核转发完全无法满足性能要求,随着网络技术的演进,高吞吐、低延时的RDMA技术将承担基础的网络传输功能,进一步提升数据中心整体算力。

RDMA 凭借其高吞吐、低延时、CPU旁路、适应性广、技术成熟等特点,已经成为数据中心基础服务的一个重要组成部分,承载着多种不同的业务类型,并且随着网络技术以及应用的发展,RDMA的应用将进一步扩大。

(二)数据面转发技术

随着网络流量的指数增长,基于硬件数据面转发技术越来越受到关注,在传统交换机和路由器上已经成熟应用的数据面转发技术也被应用到了DPU领域。在数据面硬件转发技术中,基本的硬件处理架构有两种:基于NP的run-to-completion(RTC)架构和pipeline架构。

1、基于NP的RTC转发架构

通用RTC(Real-Time Clock)处理器转发模型,报文进入后,经过调度分发器后,被分配到一个报文处理引擎上处理。RTC是一种非抢占机制,当报文进入该处理引擎后,根据转发需求进行处理,直到处理结束退出。

在RTC架构中,每个处理器上都是标准的冯诺依曼架构,包括:程序计数器(PC)、指令存储器、译码器、寄存器堆、逻辑运算单元(ALU),其中指令存储器多个核之间共享。通常报文处理流程通过C语言或微码编程后,会被编译成一系列的指令执行。由于转发需求和报文长度不同,每个报文在处理器内部的处理时间差异很大。

2、Pipeline转发架构

Pipeline架构中,整个处理流程被拆分成多个不同的处理阶段,对应到不同的步骤,每一级转发处理可以做成专用的硬件处理单元。当第一个报文执行完第一个步骤,进入第二个步骤时,第二个报文可以进入流水线中的第一个步骤进行处理。

6496600e-9751-11ed-bfe3-dac502259ad0.png

根据业务需求,将转发流程拆分成多个处理步骤,每个步骤中只执行特定的逻辑处理,主要应用在数据中心交换机上,比如:Broadcom TD系列。

Match-Action Pipeline架构也是一种业界常用的pipeline架构为,与固化Pipeline架构相比,每个步骤中可根据业务生成灵活的查表信息,根据查表结果,对报文进行相应的逻辑处理,如下图所示。

64a69898-9751-11ed-bfe3-dac502259ad0.png

在性能上,固化Pipeline架构近乎定制化ASIC,相比于可编程Pipeline架构,吞吐更高,时延更低,逻辑处理单元复杂度更低与可编程Pipeline相比,固化Pipeline,不支持可编程和新的业务添加。而可编程MA架构可以保留一部分灵活可拓展性,在资源允许的情况下,支持新业务拓展。

3、Pipeline vs RTC

Pipeline 和 RTC 作为两个主流转发架构,RTC架构在转发业务中表项出丰富的灵活性,但随着网络流量的不断增加,Pipeline架构表现出相对优势:

在性能方面,1)在相同处理性能下,RTC架构中通常采用多核多线程,来提高转发性能,由于多线程面积占比较高(每个线程独立维护相应的寄存器信息),报文进入处理器的调度和多核报文调度转发逻辑资源面积较大,导致芯片面积和功耗通常为Pipeline架构的数倍。2)由于多核处理器访问内存,导致带宽压力较大。为提高转发性能,内存会被复制多份,降低内存访问冲突,导致内存占用率很高。

时延方面,在Pipeline架构下,不同步骤中的memory资源静态分配,报文在转发过程中执行的指令信息提前预知。和 RTC 架构相比,能够大大降低由于读写/查表冲突带来的时延,通常 pipeline架构对报文的处理时延是 RTC 架构的数十分之一。

从功耗、性能、面积的角度考虑,DPU跟随网络流量需求变化(业务需求不断丰富、网络时延敏感、功耗要求更低),基于可编程Pipeline的硬件架构更符合DPU加速硬件报文转发的发展方向。

(三)网络可编程技术

在以算力为中心的时代,网络边缘设备已经从柜顶交换机延展到DPU,DPU已经成为数据中心内部网络连接计算、存储的新的接入节点,面对不断变化的网络业务需求和自定义网络扩展能力的需要,支持网络可编程技术成为DPU应用于新一代数字基础设施的关键技术因素。

64b353e4-9751-11ed-bfe3-dac502259ad0.png

DPU上网络可编程技术主要包括控制平面网络可编程技术和数据平面网络可编程技术,其中控制平面网络可编程技术主要应用于DPU 内部的通用系统级芯片上,而数据平面网络可编程技术则主要应用在硬件加速器部分。

目前DPU数据平面网络可编程技术主要包括基于快速流表和基于P4流水线两种常见技术。

(四)开放网络及DPU软件生态

由于DPU芯片的发展还处于早期阶段,DPU的软件生态也处于萌芽状态。目前,市场上主流的开放网络及 DPU 软件生态主要有Linux 基金会宣布的开放可编程基础设施——OPI项目、由 Intel 驱动主导的 IPDK 框架、Nvidia DPU的开源软件开发框架 DOCA、开放数据中心委员会开展的无损网络项目等。

DPU 作为数据中心基础设施的一颗重要芯片,拥有一个社区驱动的、基于标准的开放生态系统,以开放的形式定义DPU标准可编程基础设施生态,对DPU的长期发展至关重要。

一个富有生命力的DPU的软件生态需要具备条件为提供一个基于开放社区的DPU软件堆栈以及用户驱动,且与供应商无关的软件框架和架构。支持既有的DPU开源应用程序生态系统,包括DPDK,OVS,SPDK 等已经在用户侧有广泛应用的开源应用软件。

64bb7754-9751-11ed-bfe3-dac502259ad0.png

基于以上标准我们对现有的DPU软件生态做比较,SONiC是由用户驱动的开放网络平台项目。SONiC是由微软于2016年发起,其所有软件功能模块都来自开源生态。如下图所示,SONiC通过将SAI 接口作为统一的硬件管理接口,由各厂商在SAI接口之下实现对应硬件驱动,通过这样的方式屏蔽不同厂商硬件之间的驱动差异,使 SONiC软件可以运行在各种硬件设备中,形成白盒交换机统一的软件生态。

64c26974-9751-11ed-bfe3-dac502259ad0.png

在P4 可编程和DPU的支持方面,SONiC先是通过PINS(P4Integrated Network Stack)版本1²在 SDN 市场白盒交换机中落地了最佳实践,得到了产业界的广泛支持;之后又推出了 SONiC DASH (Disaggregated API for SONiC Hosts)版本,将SONiC在 SDN 交换机市场的最佳实践引入到主机侧,实现了主机端与网络白盒交换机统一的开放网络生态,为DPU顺利加入数字基础设施的SDN网络域打下了基础。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222877
  • DPU
    DPU
    +关注

    关注

    0

    文章

    407

    浏览量

    26180
  • RDMA
    +关注

    关注

    0

    文章

    85

    浏览量

    9556

原文标题:推动DPU发展的关键技术

文章出处:【微信号:AI_Architect,微信公众号:智能计算芯世界】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    解码LCD液晶屏的关键技术指标

    在智能设备蓬勃发展的今天,液晶屏作为人机交互的核心界面,其性能直接决定了用户体验的优劣。无论是消费电子还是工业控制,对显示效果的要求都日益严苛。作为专业的液晶显示器制造商,我们深知,深入理解LCD的技术内涵,是做出正确选择与设计的基石。本文将系统性地解析决定液晶模块品质的
    的头像 发表于 11-18 10:46 614次阅读
    解码LCD液晶屏的<b class='flag-5'>关键技术</b>指标

    噪声测量的关键技术方法与精度控制策略

    本文阐述了高速电路与低功耗系统中噪声测量的关键技术,包括设备选型、环境优化及参数设置,强调精度控制与干扰抑制。
    的头像 发表于 10-30 14:10 112次阅读

    设备互联的关键技术有哪些

    物联网中设备互联的关键技术涵盖感知、传输、处理、安全及协同管理等多个层级,这些技术共同支撑设备从数据采集到智能协作的全流程,具体可分为以下核心模块: 一、感知层:设备互联的数据源头 传感器技术 功能
    的头像 发表于 08-22 14:41 476次阅读

    TGV技术推动半导体封装创新的关键技术

    随着半导体行业的快速发展,芯片制造技术不断向着更高的集成度、更小的尺寸和更高的性能迈进。在这一过程中,封装技术的创新成为了推动芯片性能提升的关键
    的头像 发表于 08-13 17:20 1448次阅读
    TGV<b class='flag-5'>技术</b>:<b class='flag-5'>推动</b>半导体封装创新的<b class='flag-5'>关键技术</b>

    Linux网络管理的关键技术和最佳实践

    在大型互联网企业中,Linux网络管理是运维工程师的核心技能之一。面对海量服务器、复杂网络拓扑、高并发流量,运维人员需要掌握从基础网络配置到高级网络优化的全套技术栈。本文将结合大厂实际场景,深入解析Linux网络管理的关键技术和最佳实践。
    的头像 发表于 07-09 09:53 671次阅读

    电机系统节能关键技术及展望

    节约能源既是我国经济和社会发展的一项长远战略和基本国策,也是当前的紧迫任务。论文在深入分析国内外电机系统节能现状和介绍先进的节能关键技术的基础上,指出了现阶段我国在电机系统节能方面存在的问题,并结合
    发表于 04-30 00:43

    解决锡膏焊接空洞率的关键技术

    抑制锡膏焊接空洞是确保焊接质量的关键技术,需从材料、工艺、设备等多方面进行优化,傲牛科技定制化开发的焊膏,可以显著降低焊接空洞率。
    的头像 发表于 04-29 08:41 1206次阅读
    解决锡膏焊接空洞率的<b class='flag-5'>关键技术</b>

    浅谈华为通信大模型的关键技术

    推理、幻觉纠正及多维联合决策等方面创新成果的肯定。为此,我们将分三期深入解读华为通信大模型无线的关键技术和价值应用,本期聚焦于通信大模型的部署、训练和推理的关键技术
    的头像 发表于 03-26 14:35 1007次阅读

    焊接熔池监控相机:推动焊接行业数字化转型的关键技术

    如今的工业制造领域,焊接质量的稳定性和效率直接影响产品的成本,工业智造的不断升级下,焊接熔池监控相机是一项关键技术,正逐步推动焊接行业迈向数字化、智能化的新阶段。今天跟随创想智控一起了解焊接熔池监控
    的头像 发表于 03-22 15:09 636次阅读
    焊接熔池监控相机:<b class='flag-5'>推动</b>焊接行业数字化转型的<b class='flag-5'>关键技术</b>

    智能交通的关键技术支撑

    智能交通系统的发展离不开一系列关键技术的支撑。这些技术不仅推动了交通系统的智能化升级,更重要的是为未来交通模式的创新提供了可能。从数据采集到智能决策,从车路协同到自动驾驶,每一项
    的头像 发表于 03-17 15:38 559次阅读

    直流充电测试负载关键技术解析

    100MS/s采样率,配合AI诊断算法实现故障特征秒级定位,使测试效率提升40%以上。 在\"双碳\"战略推动下,新一代测试负载正向智能化、标准化方向演进。数字孪生技术的深度应用将推动
    发表于 03-05 16:18

    国产高性能晶振兼容SiTime助力智能网联汽车关键技术

    国产高性能晶振兼容SiTime助力智能网联汽车关键技术
    的头像 发表于 02-20 10:26 887次阅读
    国产高性能晶振兼容SiTime助力智能网联汽车<b class='flag-5'>关键技术</b>

    云计算HPC软件关键技术

    云计算HPC软件关键技术涉及系统架构、处理器技术、操作系统、计算加速、网络技术以及软件优化等多个方面。下面,AI部落小编带您探讨云计算HPC软件的关键技术
    的头像 发表于 12-18 11:23 787次阅读

    雷可达《安防监视雷达关键技术的研究与应用》通过科技成果评价

    近日,《安防监视雷达关键技术的研究与应用》科技成果评价会在子公司武汉雷可达举行。
    的头像 发表于 12-13 10:31 736次阅读

    5G-A家庭随身网络场景及关键技术专题报告发布

    在2024年中国5G发展大会期间,5G-A技术与应用发展论坛在上海成功举办。华为云核心网产品线分组领域副总裁曹明荣代表IMT-2020(5G)推进组发布了《家庭随身网络场景及关键技术
    的头像 发表于 12-12 17:11 1134次阅读