0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

在NVIDIA BlueField-3 DPU上运行WEKA客户端的实际优势

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-01-07 09:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

WEKA是可扩展软件定义数据平台的先驱,NVIDIA 正在与其合作,将 WEKA 先进的数据平台解决方案与功能强大的NVIDIA BlueField DPU相结合。

WEKA 数据平台的高级存储软件可充分发挥 AI 和性能密集型工作负载的潜力,而 NVIDIA BlueField DPU 则彻底改变了数据的访问、移动和安全性。这些前沿技术的集成将开创前所未有的数据管理效率和速度的新时代,并有望重塑高性能数据访问的格局。

解决高效的 AI 工作流程

AI 的迅速崛起推动了计算能力和网络速度的指数级增长,对存储资源提出了非常高的需求。虽然 NVIDIA GPU 提供了令人惊叹的可扩展、高效的计算能力,但是它们还需要高速的数据访问。

WEKA 与 NVIDIA 的合作解决了这一挑战。它们共同满足了模型训练和推理任务(包括检索增强生成,RAG)对 PB 级数据进行高带宽网络访问的关键需求。

关于 RAG 的用例,可阅读以下文章:

借助加速以太网网络和网络存储扩展企业 RAG

该联合解决方案专为处理丰富的图像和视频数据、向量数据库以及大量元数据保存的复杂性而设计。这确保了无缝且高效的 AI 工作流程,使集成变得及时,并成为未来数据驱动创新的关键。

提高吞吐量和安全性 降低延迟

此次合作的核心是集成 WEKA 客户端,并通过使用Virtio-FS 代码来完成。它直接在 BlueField DPU 上运行,而不是在主机服务器的 CPU 上运行。这种创新方法具有以下关键优势:

提高吞吐量:BlueField 硬件加速功能可实现更快的数据传输速率。

降低延迟:通过在 BlueField DPU 上运行 WEKA 客户端,数据访问操作可以绕过主机 CPU,从而显著降低延迟。

CPU 卸载:通过将 WEKA 客户端迁移到 DPU,可以释放宝贵的主机 CPU 资源用于应用程序处理,从而有可能提高整体系统性能和效率。

增强安全性:将存储操作卸载到 DPU 可创建额外的隔离层,从而增强整体系统安全性。

Virtio-FS 代码的实现有助于主机系统与网络数据之间的无缝通信,在不牺牲性能的情况下实现高效的文件系统操作。通过在 BlueField DPU 上运行 WEKA 客户端,可以从 CPU 卸载文件系统任务,从而减少开销,并释放高达 20% 的 CPU 资源以用于应用程序。

这种方法还可确保虚拟化环境中的本地文件系统效率和跨平台兼容性。此外,Virtio-FS 旨在适应不断发展的 DPU 技术,采用NVIDIA DOCA 软件框架来简化未来的开发流程,并兼容新一代 NVIDIA BlueField DPU。

将 Virtio-FS 与 NVIDIA BlueField DPU 结合使用,可将高效、直接的文件共享与强大的卸载和加速功能的优势结合起来。这种协同作用可提高性能、降低系统复杂性,并支持适合 AI 工作负载的现代可扩展架构。

45e61ea4-cc17-11ef-9310-92fbcf53809c.png

图 1:在 NVIDIA BlueField-3 DPU 上运行 WEKA 客户端可提高吞吐量、延迟和安全

硬件加速数据处理

AI 训练和推理对存储提出了独特的挑战,每个挑战都有不同的要求。训练需要高吞吐量来处理大型数据集和写入密集型操作,而推理需要出色的读取性能和低延迟来实现实时响应。这两种情况通常都依赖于共享文件系统。NVIDIA BlueField DPU 通过提供硬件加速数据处理来优化训练和推理工作负载。

优化 AI 模型训练

AI 模型训练对存储提出了很高的要求,需要快速访问庞大的数据池来支持 GPU 的生产力。训练过程包括定期读取大型数据池,以及频繁的持续写入操作,例如记录日志、保存检查点和记录指标。BlueField DPU 提供强大的写入性能和优化的读/写平衡,并有效提供高 IOPS。

适用于推理的低延迟和高读取性能

AI 推理具有不同的存储需求,需要快速访问来自多个来源的少量数据,以保持较低的用户响应时间。低延迟对于实时或近乎实时的处理至关重要,因为延迟会影响应用程序的响应能力和有效性。推理通常需要使用多个经过训练的模型和其他数据源来快速做出预测或决策。BlueField DPU 提供快速读取性能,这对于保持数据流畅运行至关重要,从而为时间敏感型 AI 应用程序提供准确的输出。

平衡训练和推理以提高 AI 性能和效率

训练和推理之间的特定压力略有不同。平衡这些需求对于构建高效且富有弹性的 AI 存储架构至关重要,对于创建有效且强大的 AI 存储解决方案也至关重要。将 WEKA 数据平台客户端与 NVIDIA BlueField DPU 集成,可提高训练和推理工作负载的存储性能,并提高解决方案的效率和安全性。

总结

在 NVIDIA BlueField DPU 上运行 WEKA 客户端有助于从 WEKA 文件系统访问文件,从而充分发挥性能密集型工作负载的潜力,并有利于数据访问、移动和安全性。

在 SC 2024 大会上,WEKA 和 NVIDIA 通过现场演示展示了集成解决方案的实际优势。与会者见证了通过提高数据访问速度和高效工作负载处理来加速 AI 数据处理。我们的专家团队随时可为您解答问题,并就此解决方案如何改变您的数据中心运营提供见解。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 以太网
    +关注

    关注

    41

    文章

    6203

    浏览量

    181597
  • NVIDIA
    +关注

    关注

    14

    文章

    5696

    浏览量

    110136
  • AI
    AI
    +关注

    关注

    91

    文章

    41295

    浏览量

    302680
  • DPU
    DPU
    +关注

    关注

    0

    文章

    417

    浏览量

    27149

原文标题:NVIDIA BlueField DPU 与 WEKA 客户端的集成提高了 AI 工作负载的效率

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Supermicro率先发布NVIDIA BlueField-4 STX存储服务器,提升AI推理性能

    Vera CPU和NVIDIA ConnectX-9 SuperNIC。 Supermicro的这款存储服务器基于去年推出的、采用NVIDIA BlueField-3的Petascale JBOF全
    的头像 发表于 03-19 15:46 186次阅读
    Supermicro率先发布<b class='flag-5'>NVIDIA</b> <b class='flag-5'>BlueField</b>-4 STX存储服务器,提升AI推理性能

    NVIDIA推出BlueField-4 STX存储架构

    NVIDIA 今日宣布推出 NVIDIA BlueField-4® STX 模块化参考架构,该架构可助力企业、云计算及 AI 服务商轻松部署加速存储基础设施,以满足代理式 AI 所需的长上下文推理能力。
    的头像 发表于 03-18 14:40 296次阅读

    EtherCAT FOE工作原理揭秘:客户端-服务器模型如何运转?

    上期我们聊了EtherCATFOE的五大应用场景,本期深入解析其底层工作机制。FOE究竟是如何实现文件传输的?答案藏在客户端-服务器模型中。核心架构:一客户端多服务器EtherCAT网络中,FOE
    的头像 发表于 03-02 11:50 231次阅读
    EtherCAT FOE工作原理揭秘:<b class='flag-5'>客户端</b>-服务器模型如何运转?

    NVIDIA BlueField-4数据处理器重塑新型AI原生存储基础设施

    NVIDIA 宣布,NVIDIA BlueField®-4 数据处理器作为全栈 NVIDIA BlueField 平台的一部分,为
    的头像 发表于 01-09 10:33 651次阅读

    NVIDIAISC 2025分享最新超级计算进展

    NVIDIA DGX Spark 到 NVIDIA BlueField-4 DPU,新一代网络和量子技术实现了飞跃。 SC25
    的头像 发表于 11-25 10:59 1116次阅读
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>在</b>ISC 2025分享最新超级计算进展

    agile_ftp传输文件时客户端报错误怎么解决?

    ]客户端使用的filezilla [size=21.3333px] [size=21.3333px]现象: [size=21.3333px]filezilla客户端可以正常上传文件,但传输完毕时客户端会报
    发表于 11-05 10:49

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和
    的头像 发表于 11-03 14:48 1230次阅读

    libmodbus库问题:TCP模式下客户端超时断开后无法再次重连怎么解决?

    情况1 :用libmodbus的TCP demo,发现用客户端软件连接收发如果超时后启动连接就无法连接上libmodbus服务器了,声明:客户端此时不会主动断开连接。 情况2:客户端
    发表于 10-14 08:17

    OrangePi Zero 3,轻量级客户端的完美选择

    千兆以太网端口用于充电的USB-C接口我很喜欢较小的单板计算机(SBC)看到以太网端口,因为这使它们作为瘦客户端更有用,而且对于这种尺寸的单板计算机来说,充裕的
    的头像 发表于 09-12 13:44 1576次阅读
    OrangePi Zero <b class='flag-5'>3</b>,轻量级<b class='flag-5'>客户端</b>的完美选择

    基于NVIDIA BlueField DPU的5G UPF数据面加速方案

    第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。 23 支参赛队伍中,有 5 支队伍脱
    的头像 发表于 09-04 11:26 1424次阅读

    Python modbus-tk如何获得客户端信息?

    Python modbus-tk如何获得客户端信息
    发表于 08-07 06:01

    CYBT-413061的RFCOMM_Serial_Port SPP演示,AIROC客户端控制应用程序不起作用,什么原因引起的?

    正常,但当启动客户端控制应用程序并打开串行端口时,却什么也没发生--所有控件都是灰色的。 然后,我还按照说明中的建议从 Windows 10 PC 运行 BTSpy 并进行连接 - 客户端
    发表于 07-02 06:05

    极简教程:快速树莓派上运行OpenVPN客户端

    这两样东西后,你需要:1.准备服务器2.配置客户端3.测试连接准备服务器:假设你已经有了OpenVPN服务器,你需要:提供客户端配置为树莓派设置静态IP地址1.提
    的头像 发表于 06-25 18:00 1667次阅读
    极简教程:快速<b class='flag-5'>在</b>树莓派上<b class='flag-5'>运行</b>OpenVPN<b class='flag-5'>客户端</b>!

    Modbus TCP连接多个客户端解决方法-深圳市振鑫通信科技

    ZP-MBS008多主站模块是实现Modbus-TCP连接多个客户端或者服务器通讯设备
    的头像 发表于 06-25 11:07 2059次阅读
    Modbus TCP连接多个<b class='flag-5'>客户端</b>解决方法-深圳市振鑫通信科技

    第三届NVIDIA DPU黑客松开启报名

    碰撞的绝佳机会。本次竞赛采用开放式主题,参与者将通过 NVIDIA DOCA 软件框架构建创新的加速应用程序,充分挖掘 NVIDIA BlueField DPU
    的头像 发表于 05-27 10:16 1019次阅读