0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于NVIDIA Rivermax和NEIO FastSocket提高低延迟网络性能

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 2025-10-21 10:58 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

超低延迟与可靠的数据包传输是金融服务、云游戏以及媒体和娱乐等现代应用的关键需求。在这些领域中,微秒级的延误或单个数据包的丢失都可能带来显著影响,导致经济损失、用户体验下降或媒体流出现画面故障。

低延迟和无丢包数据传输为何如此重要:对于需要低延迟解决方案的金融服务、云游戏、媒体和娱乐而言,实现超高数据包速率、以线速持续提供带宽,并尽可能减少甚至消除丢包至关重要。传统网络栈难以满足这些需求,尤其在网络速率扩展至 10/25/50/100/200 GbE 及更高速度时尤为明显。

NVIDIA Rivermax 高性能流式传输解决方案:NVIDIA Rivermax 是一个基于 IP 的高性能跨平台软件库,专为媒体和数据流应用设计,旨在提供卓越的传输效率。借助先进的 NVIDIA GPU 加速计算技术和高性能网卡(NIC),Rivermax 实现了超高吞吐量、硬件级数据包精确步控、极低延迟以及更低的 CPU 占用率。这些特性使其成为对效率和实时性要求较高的关键任务工作负载的理想选择。

7e4d1ea6-aa78-11f0-8c8f-92fbcf53809c.jpg

图 1. Rivermax 软件堆栈概述

7ea74bba-aa78-11f0-8c8f-92fbcf53809c.jpg

图 2. Rivermax 内核旁路架构

基于 Rivermax 技术的 NEIO FastSocket:随着网络速度的快速提升,传统的 socket 的通信方式已难以满足需求,尤其在 10/25 GbE 及更高速度的场景下。NEIO Systems Ltd. 推出的 FastSockets 是一个灵活的中间件,专为实现高性能的 UDP 和 TCP 通信而设计,有效克服了这些瓶颈。该技术致力于实现无丢包技术,并提供超低延迟和超高带宽。

7f00b6a0-aa78-11f0-8c8f-92fbcf53809c.jpg

图 3. 传统网络与 FastSockets 加速比较

确保用户数据报协议(UDP)无丢包接收,实现高性能网络:在现代网络应用中,速度与效率至关重要,可靠的数据传输也因此成为关键。UDP 因其低延迟特性,被广泛应用于对实时性要求较高的场景,如机器视觉中的视频流传输和金融市场数据分发。

基准测试:FastSockets 支持 Linux 和 Windows 系统,本文主要关注其在 Windows 平台上的表现。由于 RIO 功能存在限制,无法开展全面的网络性能评估,因此 RIO 的基准测试范围较为有限。

7f5804d2-aa78-11f0-8c8f-92fbcf53809c.jpg

图 4. 持续吞吐量比较

7faf9990-aa78-11f0-8c8f-92fbcf53809c.jpg

图 5. 平均数据包速率比较

8014c43c-aa78-11f0-8c8f-92fbcf53809c.jpg

图 6. 延迟比较

80702f3e-aa78-11f0-8c8f-92fbcf53809c.jpg

图 7. 数据包序列化延迟比较

GPUDirect 技术应用的下一步:GPUDirect 技术通过实现网卡与 GPU 之间的直接内存访问,绕过 CPU,有效降低数据传输延迟,从而提升交易系统的性能。该技术能够将从交易所接收的高频市场数据直接流式传输至 GPU 显存,便于快速运行 AI 模型,识别关键市场模式,例如价格的突然波动或订单簿的失衡情况。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5707

    浏览量

    110154
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5296

    浏览量

    136124
  • 网络
    +关注

    关注

    14

    文章

    8341

    浏览量

    95624

原文标题:借助 NVIDIA Rivermax 和 NEIO FastSocket,更大限度地提高金融服务的低延迟网络性能

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    高低温试验怎么做?如何确定高低温试验的温度范围和循环次数?

    高低温试验是一种模拟产品在极端温度环境下工作或储存的测试,通常用于评估产品的稳定性和耐久性。高低温试验目的:高低温试验的主要目的是为了:-验证产品在宽温度范围内的功能和性能。-检测产品
    的头像 发表于 04-30 13:59 152次阅读
    <b class='flag-5'>高低</b>温试验怎么做?如何确定<b class='flag-5'>高低</b>温试验的温度范围和循环次数?

    NVIDIA RTX PRO 4000 Blackwell GPU性能测试

    作为 NVIDIA 专业显卡产品线中单槽性能的巅峰之作,NVIDIA RTX PRO 4000 Blackwell 在各项核心指标上均实现对前代 NVIDIA RTX 4000 Ada
    的头像 发表于 12-29 15:30 1968次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 4000 Blackwell GPU<b class='flag-5'>性能</b>测试

    NVIDIA RTX PRO 2000 Blackwell GPU性能测试

    越来越多的应用正在使用 AI 加速,而无论工作站的大小或形态如何,都有越来越多的用户需要 AI 性能NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的头像 发表于 11-28 09:39 7169次阅读
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell GPU<b class='flag-5'>性能</b>测试

    网络延迟具体是怎样影响实时波形查看的?

    网络延迟对实时波形查看的影响,本质是 在 “现场波形发生” 与 “远程屏幕显示” 之间制造了时间差 ,且这个时间差会通过波形的 “时间滞后、显示连贯性、多测点同步性” 三个维度具体体现,最终破坏实时
    的头像 发表于 10-23 11:45 1079次阅读

    电能质量在线监测装置的远程实时波形查看是否会受到网络延迟的影响?

    电能质量在线监测装置的远程实时波形查看 一定会受到网络延迟的影响 ,且延迟会直接体现在波形显示的 “滞后性、连贯性、同步性” 上 —— 网络延迟
    的头像 发表于 10-23 11:36 1103次阅读

    提高RISC-V在Drystone测试中得分的方法

    性能:内存的读写速度、延迟和带宽等都会影响到 Drystone 的性能。 指令集优化:对RISC-V指令集的优化也会影响性能。例如,对于特定的应用或计算任务,可以通过定制指令集来
    发表于 10-21 13:58

    NVIDIA Spectrum-X 以太网交换机助力 Meta 和 Oracle 加速网络性能

    超大规模企业广泛采用 NVIDIA 网络解决方案,驱动十亿瓦级(Giga-Scale)高性能 AI 数据中心 Meta 推出基于 NVIDIA Spectrum 以太网的交换机,用于
    的头像 发表于 10-14 10:26 2123次阅读
    <b class='flag-5'>NVIDIA</b> Spectrum-X 以太网交换机助力 Meta 和 Oracle 加速<b class='flag-5'>网络</b><b class='flag-5'>性能</b>

    NVIDIA AI网络闪耀2025云栖大会

    2025 云栖大会于 9 月 24 日至 9 月 26 日举办,NVIDIA 作为大会巅峰合作伙伴参与 2025 云栖大会。本文将带您回顾 NVIDIA AI 网络在本届云栖大会上的精彩内容。
    的头像 发表于 10-13 11:19 1436次阅读

    240FPS超低延迟网络相机 带宽可控

    延迟在无人设备的控制中是一个很重要的指标,越是低的延迟越能够体现出“人机协同”。而在影响无人设备控制延迟的因素有相机本身延时、画面显示端性能、视频传输协议、编解码能力等。因此,想要很
    的头像 发表于 09-24 17:59 1015次阅读
    240FPS超低<b class='flag-5'>延迟</b><b class='flag-5'>网络</b>相机   带宽可控

    利用NVIDIA DPU重塑网络安全格局

    在第三届 NVIDIA DPU 黑客松竞赛中,我们见证了开发者与 NVIDIA 网络技术的深度碰撞。在 23 支参赛队伍中,有 5 支队伍脱颖而出,展现了在 AI 网络、存储和安全等领
    的头像 发表于 08-20 14:31 1631次阅读

    NVIDIA桌面GPU系列扩展新产品

    NVIDIA 桌面 GPU 系列扩展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell GPU,可提高工程、内容创作和 3D 可视化等应用的
    的头像 发表于 08-18 11:50 1692次阅读

    NVIDIA Jetson AGX Thor开发者套件概述

    TFLOPS 的 AI 计算性能,从而轻松运行最新的生成式 AI模型,且功耗不超过 130 W。与 NVIDIA Jetson AGX Orin 相比,其 AI 计算性能提高至7.5
    的头像 发表于 08-11 15:03 2111次阅读

    使用外部文件导入NVIDIA Air构建网络拓扑的优势

    NVIDIA Air 具有仿真从小型网络到整个数据中心的任何网络的独特能力。在开始配置、路由或管理之前,请先考虑拓扑。
    的头像 发表于 07-09 16:32 1231次阅读

    无限穿墙技术西安品茶工作室南郊北郊教学简约网络延迟

    不同步,导致学生们学习效果不佳。引入无限穿墙技术工作室的解决方案后,网络延迟问题得到了显著改善。老师能够毫无阻碍地展示教学内容,与学生们实时互动,学生们也能清晰地接收知识,学习积极性明显提高
    发表于 07-05 16:21

    NVIDIA Blackwell GPU优化DeepSeek-R1性能 打破DeepSeek-R1在最小延迟场景中的性能纪录

    本文将探讨 NVIDIA TensorRT-LLM 如何基于 8 个 NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延迟场景中的性能纪录:在 G
    的头像 发表于 07-02 19:31 3659次阅读
    <b class='flag-5'>NVIDIA</b> Blackwell GPU优化DeepSeek-R1<b class='flag-5'>性能</b> 打破DeepSeek-R1在最小<b class='flag-5'>延迟</b>场景中的<b class='flag-5'>性能</b>纪录