0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

DPU编译应用程序的不同方法

科技绿洲 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-04-22 14:25 次阅读

您在说明书中常常看到“去喝杯咖啡”吗?作为一名开发人员,我很早就发现这种令人生厌的俏皮话是我生活中的祸根。无论持续时间长短,进程切换(Context Switches)在应用程序开发周期中都是一项高昂的成本。在所有需要您离开的步骤中,等待应用程序编译是最难摆脱的。

当我们进入 NVIDIA BlueField DPU 应用程序开发的新世界,有效地设置构建步骤非常重要,以便您能够无缝地编码→编译→单元测试。在本文中,我介绍了 DPU 编译应用程序的不同方法。

DOCA 数据平面插件的 FRR

(Free Range Routing)

在 DPU 应用程序开发系列文章中,我谈到了在 FRR 中创建 DOCA 数据平面插件以用于卸载策略。FRR 的代码行数接近 100 万行( 789678 SLOC ),这使得它成为衡量构建时间的绝佳候选。

直接在 BlueField DPU 上开发

DPU 具有 Arm64 架构,一种快速启动 DPU 应用程序的方法就是直接在 DPU 上开发。本测试使用具有 8G RAM 和 8 个 A72 CPU 内核的 NVIDIA BlueField2 DPU 。

我安装了 BlueField 引导文件( BFB ),它为 DPU 提供 Ubuntu 20.04.3 操作系统映像。它还包括 DOCA 1.2 和 DPDK 20.11.3 库。为了使用 DOCA 库构建应用程序,我将 DPDK pkgconfig 位置添加到 PKG_CONFIG 路径。

poYBAGJiSM-ADKhSAAA0-HM25uM779.png

接下来,我通过克隆 FRR 在 DPU 上设置了我的代码工作区,并切换到 DOCA 数据平面插件。

pYYBAGJiSNyAKI4PAABRnN3Rlik071.png

FRR 需要一个不断发展的先决条件列表,这些先决条件列举在 FRR 社区文档中。安装了这些依赖项后,我将 FRR 配置为包括 DPDK 和 DOCA 数据平面插件。

pYYBAGJiSOWAebWsAAGaEi-TMOg630.png

当我使用 DPU 作为我的开发环境时,我构建并安装了 FRR 二进制文件:

pYYBAGJiSPWAfhXBAAAaCAxtvCc412.png

以下是构建时间的表现。我用多种方法来衡量:

使用 make -j12 all 和 make install 构建和安装二进制文件的时候

使用 dpkg-buildpackage –j12 –uc –us 将它们组装成 Debian 软件包来构建相同二进制文件的时候

第一种方法用于编码和单元测试。第二种生成 deb 的方法需要与其他外部开发环境上的构建时间进行比较。

poYBAGJiSQaAQcx_AABqX3AaQm0746.png

表 1 。 DPU Arm 构建时间

时间上的差异是意料之中的。生成一个包需要几个额外的步骤。

使用 DPU 作为开发环境有一些明显的优势:

您可以在不离开工作区的情况下进行编码、构建和安装,然后进行单元测试。

您可以针对增量代码更改来优化构建。

与完整构建(Complete make)相比,最后一个选择通常可以大幅缩短构建时间。例如,我在 FRR 中修改了 DOCA 数据平面代码,并重建的结果如下:

pYYBAGJiSRWAPa8zAAA_d4TNlhE084.png

虽然这可能会让事情变得更简单,但它需要为每个开发人员无限期的保留 DPU ,仅用于应用程序开发或维护。您的开发环境可能还需要更多的内存和性能,因此长期来看,这是一个不太可行的选择。

在 x86 服务器上开发

我的 BlueField-2 DPU 由一台 x86-64 Ubuntu 20.04 服务器托管,我将这台服务器用于我的开发环境。

poYBAGJiSUSAOLNhAABe0_ZMDeY239.png

o4YBAGC24DOAHECBAAAARmu_22A208.png

在本例中,构建机器是 x86 ,应用程序将运行的主机是 DPU-Arm64 。有几种方法可以做到这一点:

在 x86 构建机器上使用 Arm 仿真。 提供的 DOCA 开发容器 作为 DOCA 软件包的一部分。

使用交叉编译工具链。

在这个测试中,我使用了第一个选项,因为它是最简单的。第二个选项可以提供不同的性能,但创建该工具链有其挑战。

我在x86 服务器上下载并加载了 bfb_builder_doca_ubuntu_20.04 容器,并启动了它。

pYYBAGJiSVmAdlsmAABc4El4kyM985.png

o4YBAGC24DOAHECBAAAARmu_22A208.png

DOCA 和 DPDK 库预先安装在这个容器中,我只需要将它们添加到 PKG_CONFIG 路径。

pYYBAGJiSaeAA6DxAAA7e9xntoI930.png

o4YBAGC24DOAHECBAAAARmu_22A208.png

我在容器中设置了工作区和 FRR 先决条件,与前面的选项相同。

poYBAGJiSbGAAlY8AABHA2eupwo769.png

o4YBAGC24DOAHECBAAAARmu_22A208.png

我可以在这个 DOCA 容器中构建我的应用程序,但我无法对其进行测试。因此,必须将 FRR 二进制文件构建并打包到 deb 中,然后将其复制到 BlueField DPU 进行测试。我设置了 FRR Debian 规则,以匹配前面选项中使用的 FRR 构建配置,并生成了软件包:

poYBAGJiSf2AB5KdAAAhp-tOlxQ827.png

o4YBAGC24DOAHECBAAAARmu_22A208.png

表 2 显示了构建时间与以前方法的比较:

pYYBAGJiSd6AJN9yAACcpOnJQKU984.png

表 2 。 DPU Arm 和 X86 构建时间

构建时间的大幅增加让我感到惊讶,因为我有一台充足 x86 资源的服务器,而且没有 Docker 限制。因此,将 CPU 和 RAM 用于解决问题似乎并不总是有帮助的!这种性能下降是因为跨体系结构造成的,正如您在下一个选项中看到的那样。

在 AWS Graviton 实例中开发

接下来,我尝试在 Arm 上构建我的应用程序,但这次是在性能更大的外部服务器上。为此,我使用了 Amazon EC2 Graviton 实例,其规格与我的 x86 服务器相当。

Arm 64 arch , Ubuntu 20.04 操作系统

128G 内存

32 vCPU

pYYBAGJiSg6AC2ysAABSdOs16j4440.png

为了在这个实例中设置 DOCA 和 DPDK 库,我安装了 DOCA SDK repo meta 包 。

poYBAGJiShuAdgXdAABdONwKHxw043.png

克隆和构建 FRR Debian 软件包的其余步骤与前面的选项相同。

表 3 显示了构建在 AWS Arm 实例上的运行情况:

poYBAGJiSjCAUQBxAADWypr3srY185.png

表 3 。 DPU Arm 、X86 和 AWS Arm 的构建时间

这是一个明显的赢家,不需要咖啡。

图 1 显示了这些环境中的编译时间。

poYBAGJiSj6AK_ctAABeyzwo--w253.png

图 1 。 具有不同选项的 FRR 构建时间

总结

在本文中,我讨论了 DPU 应用程序的几个开发环境:

BlueField DPU

x86 服务器上的 DOCA 开发容器

AWS Graviton 计算实例

你可以直接在 DPU 上对您的应用程序进行原型设计,在 x86 DOCA 开发容器中进行开发实践,然后用 DOCA 获取一个 AWS Graviton 实例,使其高速运行!

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • DPU
    DPU
    +关注

    关注

    0

    文章

    293

    浏览量

    23965
  • 应用程序
    +关注

    关注

    37

    文章

    3133

    浏览量

    56369
  • 编译
    +关注

    关注

    0

    文章

    614

    浏览量

    32374
收藏 人收藏

    评论

    相关推荐

    嵌入式应用程序开发Windows环境一键编译下载

    【知识分享】嵌入式应用程序开发,Windows环境一键编译下载
    的头像 发表于 08-27 12:55 1511次阅读
    嵌入式<b class='flag-5'>应用程序</b>开发Windows环境一键<b class='flag-5'>编译</b>下载

    如何构建linux开发环境和编译软件工程、应用程序

    前文介绍了如何使用官方提供的镜像文件启动开发板,本文将说明如何构建linux开发环境和编译软件工程、应用程序
    的头像 发表于 01-03 12:31 464次阅读
    如何构建linux开发环境和<b class='flag-5'>编译</b>软件工程、<b class='flag-5'>应用程序</b>

    如何使用英特尔Fortran编译器生成更快的应用程序

    Steve Lionel谈到英特尔Fortran编译器如何生成更快的应用程序。他使用Polyhedron的基准来独立突出卓越的性能。
    的头像 发表于 11-06 06:39 1988次阅读

    如何使用Xilinx SDK创建Linux应用程序,并进行开发和调试

    了解如何使用Xilinx SDK创建Linux应用程序。 我们还将重点介绍和演示支持Linux应用程序开发和调试的不同方面的SDK功能。 整个过程快速而简单。
    的头像 发表于 11-20 07:03 9934次阅读

    keil C51应用程序和安装方法

    keil C51应用程序和安装方法
    发表于 11-27 08:00 11次下载

    AVR程序编译器avrubd应用程序免费下载

    本文档的主要内容详细介绍的是AVR程序编译器avrubd应用程序免费下载,简单的AVR程序编译器,简单实用,只需配置串口和时钟频率。
    发表于 05-15 17:22 49次下载
    AVR<b class='flag-5'>程序</b><b class='flag-5'>编译</b>器avrubd<b class='flag-5'>应用程序</b>免费下载

    STM32的编译器CubeIDE安装包应用程序免费下载

    本文档的主要内容详细介绍的使用STM32的编译器CubeIDE安装包应用程序免费下载。
    发表于 11-28 11:44 24次下载
    STM32的<b class='flag-5'>编译</b>器CubeIDE安装包<b class='flag-5'>应用程序</b>免费下载

    C语言编译器PICC9.60应用程序免费下载

    本文档的主要内容详细介绍的是C语言编译器PICC9.60破解版应用程序免费下载。
    发表于 05-21 08:00 16次下载
    C语言<b class='flag-5'>编译</b>器PICC9.60<b class='flag-5'>应用程序</b>免费下载

    HI-TECH PICC编译器8.05版应用程序

    本文档的主要内容详细介绍的是HI-TECH PICC编译器8.05版应用程序免费下载。
    发表于 06-08 08:00 0次下载
    HI-TECH PICC<b class='flag-5'>编译</b>器8.05版<b class='flag-5'>应用程序</b>

    在BlueField DPU上通过DOCA加速方案开发

    NVIDIA 希望您能轻松使用 DPU 的各种功能,并简化以下流程:在 DPU 上创建新应用程序,或者将现有应用程序与 BlueField DPU
    的头像 发表于 04-14 15:51 1587次阅读
    在BlueField <b class='flag-5'>DPU</b>上通过DOCA加速方案开发

    NVIDIA BlueField DPU应用程序的不同编译方法

      随着我们进入 NVIDIA BlueField DPU 应用程序开发的新世界,高效地设置构建步骤非常重要,以便您能够无缝地{code =》 compile =》 unit-test}。在本文中,我介绍了为 DPU
    的头像 发表于 04-20 14:12 1300次阅读
    NVIDIA BlueField <b class='flag-5'>DPU</b><b class='flag-5'>应用程序</b>的不同<b class='flag-5'>编译</b><b class='flag-5'>方法</b>

    NVIDIA BlueField DPU编译应用程序的不同方法

      您在说明书中常常看到“去喝杯咖啡”吗?作为一名开发人员,我很早就发现这种令人生厌的俏皮话是我生活中的祸根。无论持续时间长短,进程切换(Context Switches)在应用程序开发周期中都是一项高昂的成本。在所有需要您离开的步骤中,等待应用程序
    的头像 发表于 04-25 11:51 941次阅读

    使用 Microsoft Azure Stack HCI 和 NVIDIA BlueField DPU 加速企业应用程序

    DPU(数据处理器)是一个加速的数据中心基础设施平台,可释放应用程序性能和系统效率。NVIDIA BlueField DPU 帮助有
    的头像 发表于 11-22 19:45 499次阅读

    基于AMD SOC的QT应用程序开发

    基于AMD SOC的QT应用程序开发方法主要有两种方式:一种方式是基于petalinux工程新建一个application将源码导入在使用petalinux-build进行编译部署
    的头像 发表于 08-04 15:52 639次阅读
    基于AMD SOC的QT<b class='flag-5'>应用程序</b>开发

    如何实现DPU加速数据包转向逻辑呢?

    NVIDIA DOCA 框架旨在简化 NVIDIA BlueField DPU 和 ConnectX 智能网卡的编程和应用程序开发。
    的头像 发表于 09-19 10:00 457次阅读
    如何实现<b class='flag-5'>DPU</b>加速数据包转向逻辑呢?