0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用 NVIDIA DOCA 2.2 加速数据中心工作负载和 AI 应用程序

NVIDIA英伟达 来源:未知 2023-09-05 19:40 次阅读

NVIDIA DOCA SDK 和加速框架为开发者提供了丰富的库、驱动程序和 API,以便为 NVIDIA BlueField DPU 和 ConnectX 智能网卡创建高性能应用程序和服务。它推动了数据中心的创新,实现了应用程序的快速部署。

凭借全面的功能,NVIDIA DOCA 可为基于 BlueField DPU 进行开发的开发人员提供大规模加速数据中心工作负载和人工智能应用程序的一站式服务。

NVIDIA DOCA 现已普遍可用,已使超过 10,000 名开发者从中受益,并使更广泛的开发者社区利用 BlueField DPU 平台实现创新的人工智能和云服务。

NVIDIA DOCA 2.2 的新增和增强功能

NVIDIA DOCA 2.2 引入了新增功能和增强功能,用于卸载、加速和隔离数据中心内的网络、存储、安全和基础设施管理。

视频 1:观看 NVIDIA DOCA 软件框架简介

编程

NVIDIA BlueField-3 DPU 与其板载专用数据路径加速器(DPA)和 DOCA SDK 框架相结合,提供了一个无与伦比的平台。现在,开发者可以创建需要高吞吐量和低延迟的高性能且可扩展的网络应用程序。

数据路径加速器

为利用 BlueField-3 DPA 编程子系统,NVIDIA DOCA 2.2 提供了几项增强功能。DOCA DPA 是 DOCA SDK 开发包的一个新计算子系统部分,它提供了一个编程模型,用于卸载在 DPA 处理器上运行的以通信为中心的用户代码。DOCA DPA 有助于卸载 CPU 流量,并通过 DPU 加速提高性能。

wKgaomT3FMmAF382AADXPghwo8w893.jpg

图 1:NVIDIA BlueField-3 DPU 流入和流出流量

DOCA DPA 还提供了显著的开发优势,包括在创建自定义模拟和拥塞控制时具有更高的灵活性。定制的拥塞控制对于人工智能工作流至关重要,可以实现性能隔离、提高公平性,并防止在有损网络上的丢包。

DOCA 2.2 版本引入了以下 SDK:

  • DOCA-FlexIO:这是一个用于 DPA 编程的低级别 SDK。具体来说,DOCA FlexIO 驱动程序提供了用于通过 DPA 管理和运行代码的 API。

  • DOCA-PCC:这是一个用于拥塞控制开发的 SDK,它使 CSP 和企业客户能够创建自己的拥塞控制算法,从而通过更高的带宽和更低的延迟来提高网络运营的稳定性和效率。

NVIDIA 还提供必要的工具链、示例和辅助资料,以加快和支持开发工作。请注意,NVIDIA DOCA DPA 可在 DPU 模式和 NIC 模式下使用。

wKgaomT3FMmAQydyAAGP1lgfmaA045.png

图 2:DOCA-PCC 提供更高的带宽和更低的延迟

网络

NVIDIA DOCA 和 BlueField-3 DPU 通过一个全面、开放的开发平台,共同开发出具有突破性网络性能的应用程序。NVIDIA DOCA 包括一系列驱动程序、库、工具和示例应用程序,并在不断发展。此版本提供了以下其他功能,以支持网络应用程序的开发。

NVIDIA DOCA Flow

借助 NVIDIA DOCA Flow,用户可以定义和控制网络流量,实现网络策略,并以编程方式管理网络资源。它提供网络虚拟化、遥测、负载平衡、安全强制和流量监控等功能。这些功能有助于以低延迟处理高数据包工作负载,节省 CPU 资源并降低功耗。

此版本包括以下新功能,可为云部署带来即时优势:

  • 支持隧道卸载 - GENEVE 和 GRE:提供增强的安全性、可见性、可扩展性、灵活性和可扩展性,是站点通信、网络隔离和多租户的构建块。具体而言,GRE 隧道用于连接单独的网络并建立安全的 VPN 通信,支持 Overlay 网络,提供协议灵活性,并实现流量工程。

  • 支持具有 bps / pps 选项的每个流计量:在云环境中,监控 / 分析流量(即测量带宽或数据包速率)、管理 QoS(即执行限制)或增强安全性(即阻止拒绝服务攻击)都至关重要。

  • 增强的镜像功能(FDB / 交换机域):这项新增功能不仅用于监控、故障排除、安全分析和性能优化,还能为镜像工作负载提供更高的 CPU 利用率。

OVS-DOCA (Beta 版)

OVS-DOCA 是适用于 NVIDIA 网络服务的高度优化虚拟交换机。其极其高效的设计通过 NVIDIA 网卡或 DPU 提升了下一代性能和规模。现在,OVS-DOCA 可以在 DOCA 中用于 DPU,也可以在 DOCA 中用于主机(二进制文件和源代码)。

wKgaomT3FMqAcILHAACNw5-YgMM335.png

图 3:OVS- DOCA 针对 NVIDIA 网络服务进行了优化

基于 Open vSwitch,OVS-DOCA 提供了相同的北向 API、OpenFlow、CLI 和数据接口,为 OVS 提供了一种替代方案。使用 OVS-DOCA 可以更快地实现未来 NVIDIA 创新的网络功能。

BlueField-3(增强的)NIC 模式(Beta 版)

此版本受益于增强的 BlueField-3 NIC 模式,目前处于 Beta 版。与卸载、加速和隔离都可用的 BlueField-3 DPU 模式不同,BlueField-3 NIC 模式仅提供加速功能。

wKgaomT3FMuAPItjAAIbmHs5-Uo009.png

图 4:BlueField-3(增强的)NIC 模式

在继续利用 BlueField 低功耗和低计算密集型 SKU 的同时,增强的 BlueField-3 NIC 模式比当前的 ConnectX BlueField-2 NIC 模式具有许多优势,包括:

  • 使用本地 DPU 内存大规模实现更高的性能和更低的延迟

  • 采用可编程拥塞控制(PCC)的高性能 RDMA

  • 利用 DPA 和其他 BlueField 加速器实现可编程性

  • 通过设备认证和卡载 BMC 实现强大平台安全性

请注意,BlueField-3 NIC 模式将作为一种软件模式进行产品化,而非单独的 SKU,以实现未来使用 DPU 模式。因此,BlueField-3 NIC 模式是所有 BlueField-3 SKU 上都可以使用的且完全支持的软件功能。对于在 NIC 模式下运行的任何 BlueField-3 DPU,DPA 可编程性要求在主机上安装 DOCA 和活跃的基于主机服务。

服务

NVIDIA DOCA 服务是一种基于容器化 DOCA 程序,为特定用例提供端到端解决方案。这些服务可以通过 NVIDIA NGC 获得,从而可以轻松地将它们直接部署到 DPU。DOCA 2.2 提供了更好的控制能力,现在可以离线安装 DOCA 服务。

NGC 离线服务安装

从 NGC 安装 DOCA 服务需要互联网连接。然而,许多客户在没有互联网接入的安全生产环境中运营。因此,我们提供了“非连接”部署选项,可以在完全安全的生产环境中安装服务,从而简化流程,并避免了每台服务器都需要连接才能完成安装过程的情况。

例如,考虑在生产环境中安装 DOCA 遥测服务(DTS)以支持计量收集。整个安装过程只需两个步骤即可完成:

  • 步骤 1:在已连接的服务器上下载 NGC

  • 步骤 2:使用内部安全交付进行离线安装

总结

NVIDIA DOCA 2.2 在推动数据中心创新以及为人工智能应用而改造云和企业数据中心网络方面发挥着关键和不可或缺的作用。通过为 BlueField DPU 提供全面的 SDK 和加速框架,DOCA 为开发者提供了强大的库、驱动程序和 API,从而能够创建高性能的应用程序和服务。

DOCA 2.2 有了一些新增功能和增强功能,可以立即获得许多优势。除了通过 DPU 加速实现的性能提升外,DOCA-FlexIO 和 DOCA-PCC SDK 的加入为开发者提供了以人工智能为中心的加速计算优势。这些 SDK 能够创建自定义模拟和算法,缩短上市时间,并显著改善整体开发体验。

此外,NVIDIA DOCA FLOW 和 OVS-DOCA 的网络特定更新为软件定义的网络和安全解决方案提供了简化的交付途径。这些功能提高了效率,增强了可见性、可扩展性和灵活性,对于构建复杂而安全的基础架构至关重要。

DOCA 为数据中心创新、人工智能应用加速和强大的网络基础设施做出了广泛贡献,是 NVIDIA 人工智能云服务的重要组成部分。随着行业朝着更复杂、更苛刻的计算需求发展,DOCA 的不断发展以及与尖端技术的集成将进一步巩固其作为开创性平台的地位,为数据中心和人工智能驱动的解决方案的未来赋能。

扫描下方二维码立即访问 DOCA。

wKgaomT3FMuAcjGYAAADAXCvQCE658.png


wKgaomT3FMuAA6QWAABAFFJlyZc514.gif  

更多精彩内容 利用 NVIDIA DOCA Flow 实现 DPU 加速数据包转向逻辑
使用 NVIDIA DOCA GPUNetIO 实现实时网络处理功能
利用 NVIDIA DOCA 2.0 改变 IPsec 的部署


原文标题:使用 NVIDIA DOCA 2.2 加速数据中心工作负载和 AI 应用程序

文章出处:【微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3327

    浏览量

    87770

原文标题:使用 NVIDIA DOCA 2.2 加速数据中心工作负载和 AI 应用程序

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    基于NVIDIA DOCA 2.6实现高性能和安全的AI云设计

    作为专为 NVIDIA® BlueField® 网络平台而设计的数据中心基础设施软件框架,NVIDIA® DOCA™ 使广大开发者能够利用其行业标准 API 在
    的头像 发表于 02-23 10:02 181次阅读

    NVIDIA DOCA 2.5 长期支持版本发布

    基础设施开发者的全面软件框架,NVIDIA DOCA 已被领先的云服务提供商、企业和 ISV 创新者所采用,为开发、优化和部署基于 NVIDIA BlueField 系列产品的加速
    的头像 发表于 12-26 18:25 198次阅读
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 2.5 长期支持版本发布

    适用于数据中心AI 时代的网络

    数据中心的未来和推动 AI 时代方面发挥的关键作用。 专用数据中心AI 工厂和 AI 云 目前正在涌现两类不同的
    的头像 发表于 10-27 20:05 250次阅读
    适用于<b class='flag-5'>数据中心</b>和 <b class='flag-5'>AI</b> 时代的网络

    【书籍评测活动NO.23】数据处理器:DPU编程入门

    ® BlueField® 系列 DPU以及搭建 NVIDIA DOCA™ 软件开发环境,并通过深入了解 NVIDIA DOCA应用程序
    发表于 10-24 15:21

    第6代光纤通道:加速全闪存数据中心数据访问和应用程序性能

    电子发烧友网站提供《第6代光纤通道:加速全闪存数据中心数据访问和应用程序性能.pdf》资料免费下载
    发表于 08-29 11:52 0次下载
    第6代光纤通道:<b class='flag-5'>加速</b>全闪存<b class='flag-5'>数据中心</b>的<b class='flag-5'>数据</b>访问和<b class='flag-5'>应用程序</b>性能

    SIGGRAPH 2023 | NVIDIA 与全球数据中心系统制造商大力推动 AI 与工业数字化的发展

    年 8 月 8 日 —   NVIDIA 宣布推出搭载全新 NVIDIA L40S GPU 的 NVIDIA OVX 服务器。这款功能强大的通用数据中心处理器将通过
    的头像 发表于 08-09 19:10 284次阅读

    《揭秘 NVIDIA DPU &amp; DOCA》 第八讲上线!

    开发人员利用 DOCA 快速创建 NVIDIA BlueField DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点: 基于
    的头像 发表于 08-03 19:20 368次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 第八讲上线!

    《揭秘 NVIDIA DPU &amp; DOCA》 第七讲上线!

    开发人员利用 DOCA 快速创建 NVIDIA BlueField DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点:
    的头像 发表于 07-27 18:10 275次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 第七讲上线!

    《揭秘 NVIDIA DPU &amp; DOCA》 第六讲上线!

    开发人员利用 DOCA 快速创建 NVIDIA BlueField DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点:
    的头像 发表于 07-20 18:15 311次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 第六讲上线!

    《揭秘 NVIDIA DPU &amp; DOCA》 第五讲上线!

    开发人员利用 DOCA 快速创建 NVIDIA BlueField DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点:
    的头像 发表于 07-12 19:10 310次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 第五讲上线!

    《揭秘 NVIDIA DPU &amp; DOCA》 第四讲上线!

    开发人员利用 DOCA 快速创建 NVIDIA BlueField DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点:
    的头像 发表于 07-06 20:10 209次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 第四讲上线!

    《揭秘 NVIDIA DPU &amp; DOCA》 第三讲上线!

    开发人员利用 DOCA 快速创建 NVIDIA BlueField DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点:
    的头像 发表于 06-29 21:35 229次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 第三讲上线!

    《揭秘 NVIDIA DPU &amp; DOCA》 第二讲上线!

    DOCA 快速创建 NVIDIA DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点:N
    的头像 发表于 06-16 11:45 346次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 第二讲上线!

    《揭秘 NVIDIA DPU &amp; DOCA》 开讲啦!

    DOCA 快速创建 NVIDIA DPU 加速的、高性能数据中心基础设施应用程序和服务。 本期看点:DPU 的技术发展背景 本期节目,
    的头像 发表于 06-08 20:55 362次阅读
    《揭秘 <b class='flag-5'>NVIDIA</b> DPU &amp; <b class='flag-5'>DOCA</b>》 开讲啦!

    利用 NVIDIA DOCA 2.0 改变 IPsec 的部署

    共同加速应用程序的开发,通过一个全面、开放的开发平台实现突破性的网络、安全和存储性能。 NVIDIA DOCA 2.0 新增了对 BlueField-3
    的头像 发表于 05-15 23:35 307次阅读
    利用 <b class='flag-5'>NVIDIA</b> <b class='flag-5'>DOCA</b> 2.0 改变 IPsec 的部署