0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU软件栈五层模型(二)典型软件框架案例

中科驭数(北京)科技有限公司 2022-06-13 15:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一、NVIDIA DOCA软件框架

1)设计目的

NVIDIA BlueField DPU的核心目的是解决数据中心中基于CPU计算的基础设施的算力问题,主要涉及网络、存储、安全及基础设施管理这个几个方面。而DOCA是为了将BlueField DPU提供的硬件能力做软件抽象和封装,以SDK Library的形式提供友好的可编程接口,提高应用开发的效率。

2)技术细节

DOCA架构如下图所示,DOCA有三个模块,分别是:

(1)DOCA drivers:是对DPU硬件资源的低层次封装,其提供的low-level API是对硬件卸载能力的访问,主要包含网络卸载、安全卸载、存储卸载等算力的访问,同时支持DPDK, RDMA,Virtio-net(网络虚拟化),Virtio-blk(存储虚拟化),PCIe等通用能力。

(2)DOCA libs:是基于DOCA drivers为上层应用封装的high-level API,这些API是面向应用层所需的功能,例如面向网络应用的Flow,Data Integrity, UPF(User Plane Function), VNF(Network Functions Virtualization);面向存储应用的SPDK;面向安全应用的DPI(Deep Packet Inspection), Host introspection等。

(3)DOCA services:封装了基础设施的控制和管理功能,如DPU设备的管理,SDN(Software-Defined Network)的控制接口,存储管理,Network Telemetry等。

pYYBAGKm0iyAML9dAAGXkY67n5Q280.png

图DOCA软件栈

3)功能分析

从纵向的功能角度来看,DOCA SDK提供了网络加速、安全加速、存储加速和基础设施管理加速的功能,相关的技术细节如下:

(1)网络加速SDK:支持ASAP2 (Accelerated Switching and Packet Processing) SDN、VirtIO、OVS (open virtual switching)、P4编程、RDMA。

(2)安全加速SDK:支持Inline encryption、DPI(Deep Packet Inspection)、TLS、IPSec。

(3)存储加速SDK:支持SPDK、VirtIO、NVMe-oF、数据加解密和数据压缩等。

(4)基础设施管理加速SDK:支持DPU management、Traffic telemetry、Packet filtering。

二、Intel OneAPI软件框架

1)设计目的

OneAPI设计的目的是通过实现一个跨平台,开放的,标准的通用编程模型及接口来提高在异构加速器架构下的开发效率。OneAPI本身并不提供DPU设备,而是构建一个软件框架来整合业界现有的异构计算设备11。

2)技术细节

OneAPI抽象出两层APIs,分为L0 (Low-level) API和L1 (High-Level) API。其结构如下图所示。

pYYBAGKm0iyAFItpAAJosKmEWfo080.png

图OneAPI软件栈

L0 API: OneAPI的L0 API整合并封装了业界流行的异构计算设备(如GPUAIFPGA等)及其软件框架(如CUDA,OpenCL),并提供统一的针对硬件资源访问的low-level API。这样,不同的硬件平台对上层应用开发来说是透明的,从而起到了跨平台的作用。

L1 API:OneAPI的L1 API提供了一系列针对特定应用场景的High-level API,这些API主要服务于机器学习、数据分析、并行计算、视频处理等特定领域,有Deep Learning API, Data Science API, Data Analysis API,Multiple Thread API, Video Processing API等。

基于上述两层的抽象和封装,上层应用程序可以利用L1 API进行特定领域的数据处理加速,也可以直接访问L0 API进行编程来服务更加广泛的场景。

三、中科驭数HADOS™软件框架

驭数DPU的软件框架是基于上述五层模型构建的,整体架构如下图所示:

poYBAGKm0tKAAzORACM-uOwKVNw516.png

图 驭数异构计算系统架构

DSA设备层集成了驭数自研DPU芯片加速卡设备,分别是针对数据计算、软件定义网络、软件定义存储以及安全相关的的硬件设备。这些硬件设备在物理上是由驭数DPU芯片、内存、存储、I/O通道和KPU指令集等共同构成;DSA操作层是一个为支撑基于DPU设备开发的软件操作平台,即DPU操作平台,该平台提供了DPU资源访问、调度、监控和管理的功能,同时也提供了完备友好的开发工具库;计算引擎层为针对数据计算应用软件封装的一个通用的数据计算加速引擎,它基于DPU操作平台提供的计算能力,实现了硬件卸载的算子及相应算子的软件优化器,这些算子分为计算类算子、网络类算子和存储类算子;应用服务层为使用驭数DPU进行加速的数据处理平台、网络服务平台和存储服务平台,如大数据领域的Spark,数据库领域的PostgreSQL,机器学习领域的XGBoost,微服务架构中负责远程通信的gRPC框架,Web服务平台Nginx以及分布式存储平台Ceph等;业务开发层为驭数数据计算加速产品所服务的业务系统,主要来自对计算、网络、存储性能敏感的领域,如金融计算、交易、数据分析、云服务等。在上述五层架构中,DPU操作平台与数据计算加速引擎共同构建了驭数为支撑DPU异构计算而打造的专用软件框架,即敏捷异构软件开发平台,Heterogenous Agile Developing & Operating System,简称“HADOS™”。

四、DOCA,OneAPI与HADOS比较分析

整体来看,这三款软件框架的出发点是相似的,都是在异构计算的架构下提供一套通用且编程友好的软件开发框架。它们在设计这套软件框架时都采用了分层抽象的思路,目的是使各层职责清晰,对上层提供足够简单且功能完备的接口。

具体到功能实现上,它们都是在网络、计算、存储、安全这些范畴内做了相应的支持,不过由于它们待解决的问题及根本目的存在差异,所以在架构设计和功能实现上的侧重点有所不同。简单来说,DOCA侧重点是支持基于Blue Field DPU的数据中心基础设施服务加速的场景;OneAPI侧重点是构建设备无关的资源访问库和编程接口;HADOS侧重点是支持基于YusurDPU的网络、计算、存储服务加速的场景。

下表针对这三款软件框架在设计目的、五层架构模型及各自特点上做了详细比较。

pYYBAGKm0uOAYVAHACvIG-wzwQE067.png

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    419

    浏览量

    27188
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    企业大模型时代的网络架构演进:从连接到智能的范式重构

    防火墙(FW)到Web应用防火墙(WAF),再到AI网关(AI流量的枢纽)、大模型内容安全护栏与Skillhub技能中枢,安全技术的迭代升级,不仅是产品功能的
    的头像 发表于 05-20 09:22 261次阅读
    企业大<b class='flag-5'>模型</b>时代的网络架构<b class='flag-5'>五</b><b class='flag-5'>层</b>演进:从连接到智能的范式重构

    新思科技Silver产品现已支持POSIX类型软件

    新思科技宣布其 Silver 产品现已支持 POSIX 类型软件,这是 Silver(新思科技的 Software‑in‑the‑Loop,SIL,仿真环境)中的一项重要全新能力。该功能使团队能够
    的头像 发表于 04-28 11:36 555次阅读
    新思科技Silver产品现已支持POSIX类型<b class='flag-5'>软件</b><b class='flag-5'>栈</b>

    RT-Thread任务+消息订阅管理框架软件包:thread_manager+event_loop

    读者留言,是否可以支持RT-Thread,索性放假也无聊,所以就整了两个软件包:eventloop+thread_manager.eventloop软件包一个是
    的头像 发表于 04-19 15:39 5075次阅读
    RT-Thread任务+消息订阅管理<b class='flag-5'>框架</b><b class='flag-5'>软件</b>包:thread_manager+event_loop

    WiMi-net协议深度拆解:有中心自组网的落地实践

    从OSI七到WiMi-net,经典理论如何落地?本文深度拆解WiMi-net有中心自组网协议
    的头像 发表于 04-02 17:40 1873次阅读
    WiMi-net<b class='flag-5'>五</b><b class='flag-5'>层</b>协议<b class='flag-5'>栈</b>深度拆解:有中心自组网的落地实践

    无线通信的“隐形骨架”:一文读懂OSI七模型

    我们每天都在用手机聊天、刷视频、远程操控设备,但海量数据究竟是如何在空中穿梭的?背后离不开一套被称为“OSI七模型”的隐形框架。本文作为WiMi-net协议系列的开篇,用最通俗的快
    的头像 发表于 03-16 09:41 498次阅读
    无线通信的“隐形骨架”:一文读懂OSI七<b class='flag-5'>层</b><b class='flag-5'>模型</b>

    国内大星地数据大模型ai融合分析与应用分系统软件介绍

        虽未明确划分“星地数据大模型AI融合分析与应用”的大分系统,但北京华盛恒辉、北京木恒润、Anthropic、MetaAI和SpaceX等机构已通过关键技术突破与场景深耕,构建了具有代表性
    的头像 发表于 12-29 10:49 204次阅读

    沐曦股份MXMACA软件3.3.0.X版本技术解析

    ,作为沐曦“自主GPGPU硬件+全软件体系”的关键协同载体,如图1所示,MACA承担着连接硬件算力单元与上层应用生态的核心纽带作用,覆盖底层驱动、用户态接口、编译器、算子适配、训练框架、推理
    的头像 发表于 12-24 09:08 1315次阅读
    沐曦股份MXMACA<b class='flag-5'>软件</b><b class='flag-5'>栈</b>3.3.0.X版本技术解析

    国内典型大大模型驱动的星间链路动态组网分系统软件介绍

        大模型驱动星间链路动态组网分系统典型技术方案解析    结合国际低轨星座、星间链路及智能化组网领域的前沿实践,北京华盛恒辉、北京木恒润两款大模型驱动的星间链路动态组网分系统,
    的头像 发表于 12-23 15:22 420次阅读

    润和软件入选大模型一体机产业图谱

    格局与创新力量。在本次图谱中,江苏润和软件股份有限公司(以下简称“润和软件”)以AI全技术能力与丰富的行业落地实践入选图谱,成为国产智能计算领域的重要力量。 润和软件入选《大
    的头像 发表于 12-10 17:56 1802次阅读
    润和<b class='flag-5'>软件</b>入选大<b class='flag-5'>模型</b>一体机产业图谱

    ETAS INCA软件个实用进阶功能

    在上一篇文章中我们介绍了INCA软件如何赋能高效的ECU开发及新能源挑战,本篇内容将继续深入探讨INCA的个实用进阶功能。
    的头像 发表于 12-08 16:42 2876次阅读
    ETAS INCA<b class='flag-5'>软件</b>的<b class='flag-5'>五</b>个实用进阶功能

    中软国际正式启动鸿蒙软件工场

    自2024年HarmonyOS NEXT版本起,HarmonyOS应用框架更新为鸿蒙“单框架”,正式告别了对Android应用框架、内核的依赖。2025年,鸿蒙生态进入规模化发展期,
    的头像 发表于 06-17 15:44 1208次阅读

    润和软件StackRUNS异构分布式推理框架的应用案例

    江苏润和软件股份有限公司(以下简称“润和软件”)自主研发的StackRUNS异构分布式推理框架已在实际场景中取得显著成效,成功应用于大型园区多模态模型演练及高校满血版DeepSeek-
    的头像 发表于 06-13 09:11 1511次阅读
    润和<b class='flag-5'>软件</b>StackRUNS异构分布式推理<b class='flag-5'>框架</b>的应用案例

    润和软件发布StackRUNS异构分布式推理框架

    当下,AI模型规模持续膨胀、多模态应用场景日益复杂,企业正面临异构算力资源碎片化带来的严峻挑战。为应对行业痛点,江苏润和软件股份有限公司(以下简称“润和软件”)正式发布自主研发的StackRUNS异构分布式推理
    的头像 发表于 06-13 09:10 1688次阅读
    润和<b class='flag-5'>软件</b>发布StackRUNS异构分布式推理<b class='flag-5'>框架</b>

    RISC-V架构下AI融合算力及其软件实践

    。目前,进迭时空已经取得了显著的进展,成功推出了第一个版本的智算核(带AI融合算力的智算CPU)以及配套的AI软件软件简介AI算法部署旨在将抽象描述的多
    的头像 发表于 06-06 17:04 1696次阅读
    RISC-V架构下AI融合算力及其<b class='flag-5'>软件</b><b class='flag-5'>栈</b>实践

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者将通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueField DPU 在 AI、网络、存储和安全等领域的强大潜能。
    的头像 发表于 05-27 10:16 1089次阅读