0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA ConnectX智能网卡驱动RDMA通讯技术在分布式存储的应用

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-11-03 09:48 次阅读

NVIDIA ConnectX 智能网卡及开源 UCX 框架帮助网易高性能 RDMA 网络通讯功能实现更优表现,助力网易通过 Curve 开源项目为 Apache BRPC 自主实现高性能的 RDMA 网络通讯。

网易亟需打造一款高吞吐和低延迟的分布式存储系统

如何为用户提供性能优异、易于部署的分布式存储系统,特别是如何在远程访问存储时提高吞吐和降低延迟是网易面临的主要挑战。虽然在自研的 Curve 开源项目下已经支持了 Apache BRPC ,并具备了一定的远程方位存储的网络通讯能力,但是并未实现对 RDMA 网络通讯的支持,并借助 RDMA 网络通讯能力来实现高吞吐和低延迟,从而提升整体开源云原生分布式存储系统的性能。

NVIDIA ConnectX 智能网卡

为网易 Curve 开源项目提供解决方案

网易的 Curve 开源项目下支持 Apache BRPC ,并自研实现了 RDMA 网络通讯功能,而其采用的 NVIDIA ConnectX 智能网卡及开源 UCX 框架的底层软硬件基础设施,帮助其更好地为用户提供兼顾高性能、易运维、低成本的弹性分布式存储解决方案。 Curve 是云原生计算基金会(CNCF)沙箱(Sandbox)项目,它是网易主导自研和开源的高性能、易运维、云原生的分布式存储系统,由块存储 CurveBS 和文件系统 CurveFS 两部分组成,可应用于主流的云原生基础设施平台:

对接 OpenStack 平台为云主机提供高性能块存储服务;

对接 Kubernetes 为其提供 RWO 、RWX 等类型的持久化存储卷;

对接 PolarFS 作为云原生数据库的高性能存储底座,完美支持云原生数据库的存算分离架构。

Curve 亦可作为云存储中间件,使用与 S3 兼容的对象存储作为数据存储引擎,为公有云用户提供高性价比的共享文件存储系统。 网易致力于通过 Curve 开源项目自主研发云原生的分布式存储系统,为不同应用场景下的存储需求,提供大容量、高性能、易运维、低成本的开源弹性存储解决方案。而其最新为 BRPC 自研的 RDMA 网络通讯功能,将会极大的简化 RDMA 网络通讯的实现和提升远程存储访问的性能,为 Curve 开源项目提供高性能、低延迟的本地和远程存储访问体验,同时提供良好的上层 API 兼容性和透明性,使 Curve 成为更为完善的云原生分布式存储系统,从而驱动其在开源的分布式存储领域得到广泛的应用。

NVIDIA ConnectX 智能网卡

助力 RDMA 网络通讯功能发挥优异性能

该 RDMA 网络通讯功能完美的运行在采用 NVIDIA ConnectX 智能网卡及开源 UCX 框架(NVIDIA 是开源项目 UCX 的核心成员和主要贡献者)的底层软硬件基础设施上,将会发挥出更优异的性能表现,满足用户对分布式存储系统高性能、低延迟的需求,并大幅降低主机 CPU 开销,为用户提供兼顾高性能、易运维、低成本的弹性分布式存储解决方案。 具体来说,网易在 NVIDIA Connect X 智能网卡的驱动下实现 UCX 框架中的 UCP(Unified Communication for Protocols):

极大简化了 RDMA 网络通讯在分布式存储应用场景下的实现,且支持的 RDMA 接口具有良好的 API 兼容性

基于高性能的 NVIDIA ConnectX 智能网卡,将实现更为出色的 RDMA 网络通讯性能,IO 时延得到极大改善

即时将 RDMA 网络通讯能力体现在 Curve 后续的开源软件版本中,驱动云原生分布式存储系统的广泛应用

如今,Curve 开源项目的 RDMA 网络通讯功能已经实现,将会在后续的 Curve 版本中发布。想要深入了解网易是如何为 BRPC 实现 RDMA 网络通讯功能,请点击“阅读全文”

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4592

    浏览量

    101719
  • 分布式存储
    +关注

    关注

    4

    文章

    153

    浏览量

    19394
  • 智能网卡
    +关注

    关注

    1

    文章

    50

    浏览量

    12163

原文标题:NVIDIA ConnectX 智能网卡驱动 RDMA 通讯技术在分布式存储的应用

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    分布式IO工业自动化数据采集与分析的核心

    随着工业自动化技术的不断发展,分布式IO工业自动化领域的应用越来越广泛。作为一种先进的控制技术分布式IO能够实现设备的
    发表于 12-28 14:47

    扩展模块驱动分布式I/O新能源锂电池自动化生产中的发展

    材料进行切边、折边、点胶等操作,使其对接部分更加严密,不会造成锂电池内部液体的泄露。 分布式I/O模块可以采集磁性开关及光电信号并通过输出模块控制电磁阀从而控制气缸动作,来完成电池的双折边成型工艺
    发表于 12-28 11:20

    深入了解RDMA技术

    Explorer,专注于高性能网络、虚拟化网络及网卡的测试方案研究。熟悉dpdk,rdma,sdn等技术的应用与解决方案。
    的头像 发表于 12-26 09:23 818次阅读
    深入了解<b class='flag-5'>RDMA</b><b class='flag-5'>技术</b>

    一图读懂《分布式融合存储研究报告(2023)》

    转自:存储产业技术创新战略联盟 2023年11月30日, 存 储产业技术创新战略联盟、中国电子技术标准化研究院联合发布《分布式融合
    的头像 发表于 12-21 18:05 313次阅读
    一图读懂《<b class='flag-5'>分布式</b>融合<b class='flag-5'>存储</b>研究报告(2023)》

    鸿蒙原生应用开发——分布式数据对象

    01、什么是分布式数据对象 可信组网环境下,多个相互组网认证的设备将各自创建的对象加入同一个 sessionId,使得加入的多个数据对象之间可以同步数据,也就是说,当某一数据对象属性发生
    发表于 12-08 10:01

    分布式系统硬件资源池原理和接入实践

    把各个设备的硬件外设抽象为外设信息单元,外设信息各个可信设备之间自动同步,如此,实现了外设信息的全局可见;结合分布式硬件虚拟化技术,实现任意设备之间的硬件外设能力跨设备调用;分布式
    发表于 12-06 10:02

    RDMA和TCP/IP有什么区别

    分布式存储网络中,我们使用的协议有RoCE、Infiniband(IB)和TCP/IP。其中RoCE和IB属于RDMA (RemoteDirect Memory Access)技术
    的头像 发表于 11-30 09:19 713次阅读
    <b class='flag-5'>RDMA</b>和TCP/IP有什么区别

    基于ZigBee的分布式井盖监控系统

    随着我国现代经济发展水平的不断提高,城市井盖数目逐渐增加。由于较多井盖被盗,致使路面形成陷阱,危害到过往车辆和行人安全。本文提出了一种基于 ZigBee无线网络的智能安全监控系统,解决分布式布控困难
    发表于 09-18 08:46

    OpenHarmony 分布式硬件关键技术

    哪些关键的分布式技术呢? 华为分布式硬件技术专家李刚在第一届OpenHarmony技术峰会上给大家带来了几点分享。 01►
    发表于 08-24 17:25

    智能网卡简介及其高性能计算中的作用

    最高性能。SmartNIC 通过提供高级网络功能以及专门的硬件加速, HPC 应用中表现出色。提高人工智能系统的效率当前的机器学习趋势涉及分布式学习,它通常采用并行数据训练,其中每个节点在不同的数据
    发表于 07-28 10:10

    分布式存储的7个特征

    什么是分布式存储呢?如果一个存储系统,不管是对象、块、文件、kv、log、olap、oltp,只要对所管理的数据做了Partitioning&Replication,不管姿势对不对,其实
    发表于 07-18 14:17 697次阅读

    过程语言(1)#分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 23:00:11

    #分布式数据

    分布式数据
    未来加油dz
    发布于 :2023年07月03日 22:58:32

    如何使用分布式存储系统促进AI模型训练

    这凸显了分布式存储在人工智能(AI)领域的重要性。JuiceFS 是一个开源、高性能的分布式文件系统,为这个问题提供了解决方案。
    发表于 06-12 09:28 349次阅读
    如何使用<b class='flag-5'>分布式</b><b class='flag-5'>存储</b>系统促进AI模型训练

    分布式故障定位装置——FH-900F武汉风河智能科技

    分布式故障定位装置——FH-900F武汉风河智能科技 电力输电线路经常面临各种自然因素导致的跳闸事故,而这些事故不仅损害设施,更重要的是给电力系统带来了安全隐患。解决这一问题,快速准确的定位故障点
    发表于 06-06 13:59