0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA RDMA网络方案助力远端计算和存储网络优化

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-01-04 14:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

云原生数据库 TDSQL-C (原 CynosDB,TDSQL for Cloud Native Database) 是腾讯云自研的新一代高性能高可用的企业级分布式云数据库, TDSQL-C 使用 NVIDIA UCX RDMA 优化了关键路径系统性能,实现了超百万级 QPS 的高吞吐,128TB 海量分布式智能存储,保障了数据安全可靠。

云原生数据库 TDSQL-C 实现高性能面临挑战

TDSQL-C 采用计算存储分离的架构,可以快速进行节点的扩容,节点的迁移,但其引入的网络开销对实现高性能提出了更高的挑战。因此需要采用软件优化与新硬件相结合,通过基于 SPDK 和 UCX RDMA 的零拷贝技术,减少了操作系统上下文切换以及数据在用户态和内核态之间拷贝引起的性能损耗,进一步优化关键路径的系统性能,降低请求延迟。

传统的 TCP/IP 网络,存在以下几个缺点:应用的 buffer 发送到对端,需要经过多次拷贝,对端收到数据到接收到应用的接收 buffer,也需要多次拷贝;应用的 buffer 拷贝到 TCP/IP 的 buffer,需要从用户态进入到内核态,会有上下文切换;网络协议栈完全由 CPU 执行,耗费 CPU。

NVIDIA RDMA 网络方案+ConnectX 系列网卡

“软硬” 兼施,赋能数据库业务持续发展

充分利用软硬件资源做系统级别 Scale Out、Scale Up、 RDMA 等 Kernel ByPass 的低延时网络基础。以底层高性能硬件能力作为支柱,给腾讯云数据库业务发展提供持续不断的系统源动力。

根据业务部门需求和服务器新产品导入团队多年来在 RDMA 技术上的沉淀, 推荐使用搭载 NVIDIA ConnectX 系列网卡的服务器,使用 NVIDIA RDMA 网络方案来对数据库场景进行专项优化,充分利用 RDMA 天然的性能优势:

RDMA 技术是用户空间进程绕过内核直接调用 RDMA 网卡,实现和远端进程的高效快速通讯。RDMA 伴生于 InfiniBand 网络技术,由 IBTA 组织对其进行标准化定义和维护。RDMA 技术优势可以解决 TCP 传输方式中的各种缺点:

整个数据传输过程内存零拷贝。

网络传输完全卸载到网卡硬件,不占用 CPU 资源。

使用 RDMA 技术可以 100% 利用网络带宽。

整个数据传输过程由硬件完成,降低了系统延时。

NVIDIA RDMA 网络方案

助力远端计算和存储网络优化

NVIDIA RDMA 网络方案搭在硬件上使远端计算和存储网络的优化效果达到最优。

在 RDMA 与 TCP 性能的关键指标的对比测试中,RDMA 体现了其优势。例如从oplog msg 性能数据上看,RDMA 测延迟比 TCP 降低 71.7%,吞吐提高 43.2%;在 page 性能数据方面(page 大小为16KB),RDMA 测延迟比 TCP 降低 70.3%,吞吐提高 52.3%。

“腾讯云数据库是腾讯服务的基础架构,网络的延迟和带宽对于性能至关重要, RDMA 技术的 Kernel Bypass 和 CPU Offload 可以带来极低的延迟和极高的带宽。在 NVIDIA 网络产品上部署的推荐系统将为腾讯用户提供业界一流的性能,使用户充分享受 RDMA 带来的技术红利。

—— 腾讯云数据库TDSQL-C负责人

李志阳

“NVIDIA 作为 RDMA 技术的推动者和领跑者,很高兴看到这项技术在腾讯得到越来越广泛的应用,并正在从传统的 HPC/AI 业务拓展到高性能存储和数据库领域。UCX 的使用大幅度提高了 RDMA 应用的开发效率和吞吐率,并且使得 RoCE 跟客户应用能迅速整合,从而帮助客户更快走向市场,并提供差异化的云产品和服务。

——NVIDIA 副总裁Vadim Balahovski

了解更多 NVIDIA RDMA 网络助力腾讯云数据库突破性能瓶颈的案例信息,欢迎点击“阅读原文”。

NVIDIA DOCA 现已开放接受申请,扫描下方海报二维码,即可注册加入,抢先体验,走在技术前沿!

原文标题:NVIDIA RDMA 网络助力腾讯云数据库突破性能瓶颈

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5731

    浏览量

    110324
  • 网络
    +关注

    关注

    14

    文章

    8389

    浏览量

    95724
  • 数据库
    +关注

    关注

    7

    文章

    4094

    浏览量

    68695

原文标题:NVIDIA RDMA 网络助力腾讯云数据库突破性能瓶颈

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RDMA设计50: 如何验证网络嗅探功能?

    网络嗅探的主要功能包括 ARP 接收发送及 ICMP 接收发送,RDMA技术允许主机直接访问远程主机的内存,无需CPU介入,因此其流量不经过操作系统内核协议栈。这种设计提升了性能,但也使得嗅探
    发表于 03-31 15:58

    重大突破!中科曙光scaleFabric国产原生RDMA高速网络首发

    3月12日,中科曙光宣布实现国产高端原生RDMA技术重大突破,正式发布首款全栈自研400G无损高速网络——scaleFabric。该产品基于原生RDMA架构,从底层的112G SerDes IP
    的头像 发表于 03-12 20:03 2540次阅读
    重大突破!中科曙光scaleFabric国产原生<b class='flag-5'>RDMA</b>高速<b class='flag-5'>网络</b>首发

    破解RDMA网络“黑盒”:轻量化会话追踪工具

    RDMA网络运维面临“黑盒”挑战的背景下,星融元推出的RST工具通过无侵入捕获CM报文,实现RDMA会话的可视化追踪与全网路径还原。该工具基于RFT与RPT双模块,支持从设备流表到全局拓扑的多维观测,大幅降低运维定位成本,推动
    的头像 发表于 02-13 14:30 657次阅读
    破解<b class='flag-5'>RDMA</b><b class='flag-5'>网络</b>“黑盒”:轻量化会话追踪工具

    英特尔与忆联重磅推出企业级网络存储解决方案

    为应对AI大模型时代多元化的存储挑战与存算分离部署需求,英特尔与忆联基于既有合作成果,再度深化协同创新。依托RDMA与NVMe硬件技术,结合SPDK高性能存储服务,重磅推出企业级网络
    的头像 发表于 02-02 09:14 1374次阅读
    英特尔与忆联重磅推出企业级<b class='flag-5'>网络</b><b class='flag-5'>存储</b>解决<b class='flag-5'>方案</b>

    NVIDIA Spectrum-X以太网硅光技术助力AI工厂网络创新

    NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络,通过 NVIDIA Spectrum-X 以太网硅光技术,为
    的头像 发表于 01-14 09:06 1013次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X以太网硅光技术<b class='flag-5'>助力</b>AI工厂<b class='flag-5'>网络</b>创新

    高性能网络存储设计:NVMe-oF IP的实现探讨

    什么是 NVMe-oF? NVMe-oF全称:NVMe over Fabrics。 它允许主机通过网络访问远端。 NVMe SSD与本地 NVMe差异主要体现在: NVMe:基于 PCIe
    发表于 12-19 18:45

    RDMA设计2:开发必要性之性能简介

    专注高性能存储与传输,这里分享RDMA设计,之前已介绍RDMA相关知识,在本博客已给出相关博文已100多篇,希望对初学者有用。注意这里只是抛砖引玉,切莫认为参考这就可以完成商用IP设计。若有NVME
    发表于 11-20 10:57

    RDMA设计1:开发必要性1之设计考虑

    解决 FPGA 系统存储容量不足已成为亟待解决的问题。 远程直接内存访问技术(RDMA) 是一种专为远距离网络通信设计的技术, 其通常通过光纤进行设备间连接, 提供高通量、 低延迟、 远距离的零拷⻉
    发表于 11-19 14:30

    NVIDIA Spectrum-X 以太网交换机助力 Meta 和 Oracle 加速网络性能

    超大规模企业广泛采用 NVIDIA 网络解决方案,驱动十亿瓦级(Giga-Scale)高性能 AI 数据中心 Meta 推出基于 NVIDIA Spectrum 以太网的交换机,用于
    的头像 发表于 10-14 10:26 2199次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X 以太网交换机<b class='flag-5'>助力</b> Meta 和 Oracle 加速<b class='flag-5'>网络</b>性能

    解析DCQCN:RDMA在数据中心网络的关键拥塞控制协议

    DCQCN ( Data Center Quantized Congestion Notification),数据中心量化拥塞通知。它是一种专门为数据中心网络设计的端到端拥塞控制协议。其核心目的是在使用RDMA(RoCEv2) 的网络
    的头像 发表于 09-15 11:45 2213次阅读
    解析DCQCN:<b class='flag-5'>RDMA</b>在数据中心<b class='flag-5'>网络</b>的关键拥塞控制协议

    NVIDIA如何优化AI工厂的网络可靠性与功耗

    随着 AI 重新定义计算格局,网络已成为构建未来数据中心发展的关键支柱。大语言模型的训练性能不仅取决于计算资源,更受到底层网络敏捷性、容量和智能程度的影响。行业正从传统以 CPU 为中
    的头像 发表于 09-04 11:23 1693次阅读
    <b class='flag-5'>NVIDIA</b>如何<b class='flag-5'>优化</b>AI工厂的<b class='flag-5'>网络</b>可靠性与功耗

    利用NVIDIA DPU重塑网络安全格局

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络
    的头像 发表于 08-20 14:31 1719次阅读

    RDMA简介3之四种子协议对比

    RDMA协议共有四种子协议,分别为InfiniBand、iWARP、RoCE v1和RoCE v2协议。这四种协议使用统一的RDMA API,但在具体的网络层级实现上有所不同,如图1所示,接下来将
    发表于 06-04 16:05

    RDMA简介2之A技术优势分析

    随着数据中心对于网络带宽和延迟的要求日益增长,传统的TCP/IP网络已无法满足性能要求,RDMA网络则凭借其高带宽、低延时的特性脱颖而出。相较于传统TCP/IP协议,
    发表于 06-04 11:35

    RDMA简介1之RDMA开发必要性

    解决FPGA存储容量不足的问题。 直接内存访问技术提供了一种不经过CPU的数据传输方式,其具有高性能、低延迟、CPU旁路等多种优势,在现代数据中心和计算机系统中得到广泛应用 。DMA技术通常被部署在高级微控制器
    发表于 06-03 14:38