0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA NetQ使网络工作流程更易于故障排除和自动化

科技绿洲 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2022-06-15 10:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NVIDIA NetQ 是一种高度可扩展的现代网络操作工具,为 NVIDIA Spectrum Ethernet 平台提供可操作的可见性。它将高级遥测技术与用户界面相结合,使网络工作流程更易于故障排除和自动化,同时减少维护和停机时间。

我们最近发布了 NetQ 4.2.0 ,其中包括:

简化的事件管理

增强的流量遥测分析

新 RoCE 验证

新增 DPU 监控

有关新功能和增强功能的更多信息,请参阅 NetQ 4.2.0 用户指南 。

简化的事件管理

通过 NetQ 4.2 ,我们简化了通过接口传递网络事件的方式。事件的严重性各不相同。一些事件是网络警报,可能需要进一步调查,而其他事件是信息性通知,可能不需要干预。在此版本之前,NetQ 将报警和信息事件显示为两个单独的卡。NetQ 4.2 版本将两个卡合并为一个卡,扩展后,该卡将显示一个仪表板,以帮助您快速可视化所有网络事件。

仪表板显示事件的时间线,以及导致大多数事件的开关。您可以按类型筛选事件,包括接口、网络服务、系统和阈值交叉事件。

确认事件有助于您专注于需要您关注的活动事件。从仪表板中,还可以创建规则以抑制事件。此功能还可帮助您关注活动事件,从而使已知问题或错误警报的显示方式与错误显示方式不同。

增强的流量遥测分析

NetQ 4.1.0 为 Cumulus Linux 5.x 数据中心结构引入了结构范围的网络延迟和缓冲区占用分析。现在,NetQ 4.2 支持混合结构中的部分路径流遥测分析,即那些将 Cumulus Linux 5.x 交换机与其他交换机(包括非 Cumulus Linux 5.x 和第三方交换机)结合使用的结构。Cumulus Linux 5.x 设备在路径中显示流量统计信息,例如延迟和缓冲区占用。不受支持的设备在流量分析中表示为带有红色 X 的黑条,并且设备不显示流量统计信息。

此外,NetQ 4.2 流量遥测分析显示了所分析流量的上下文“刚刚发生的事情”(WJH)事件和下降。带有 WJH 事件的交换机在流分析图中表示为红色条纹条。将鼠标悬停在带有红色条的设备上,会显示 WJH 事件摘要。

利用 WJH 数据进行 NetQ 流量遥测分析

新 RoCE 验证

通过聚合以太网使用 RDMA (RoCE),您可以通过以太网使用远程直接内存访问(RDMA)而不是使用主机 CPU 来写入计算或存储元素。NetQ 4.0.0 引入了 RoCE 配置和计数器,包括设置各种 RoCE 阈值交叉警报(TCA)的能力。

使用 NetQ 4.2.0 ,RoCE 验证检查:

交换机间有损或无损模式配置的一致性

DSCP 、服务池、端口组和流量类设置的一致性

ECN 阈值设置的一致性

无损模式 PFC 配置的一致性

增强型变速箱选择设置的一致性

您可以安排 RoCE 验证定期或按需运行。

新增 DPU 监控

NVIDIA BlueField DPU(数据处理器)通过卸载、加速和隔离广泛的高级网络、存储和安全服务,为任何工作负载提供安全、加速的基础架构。

NetQ 帮助您监控网络上的 DPU 库存。您可以监视 DPU 操作系统ASIC 、CPU 型号、磁盘和内存信息,以帮助管理升级、法规遵从性和其他规划任务。使用 NetQ ,您可以查看和监视键 DPU 属性,包括已安装的软件包以及 CPU 、磁盘和内存利用率。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11327

    浏览量

    225903
  • NVIDIA
    +关注

    关注

    14

    文章

    5687

    浏览量

    110118
  • 操作系统
    +关注

    关注

    37

    文章

    7437

    浏览量

    129621
  • 数据处理器
    +关注

    关注

    0

    文章

    27

    浏览量

    8912
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    扣子AI智能体工作流(完结)

    https://www.bilibili.com/opus/1178756596191199237 扣子工作流:重新定义业务自动化,让技术普惠照进现实 在数字转型的浪潮中,业务自动化
    的头像 发表于 04-25 11:21 287次阅读

    工作流节点说明---工作流节点

    工作流,并在主工作流的不同分支内调用这些子工作流执行对应的操作。工作流嵌套可实现复杂任务的模块拆分和处理,
    发表于 03-24 21:05

    NVIDIA发布面向媒体工作流的AI技术

    在 GTC 2026上,NVIDIA 宣布了多项强大的新技术,旨在变革直播媒体和后期制作工作流
    的头像 发表于 03-23 15:15 451次阅读

    开发工作流创建工作流

    新建工作流 在小艺智能体平台页面,通过【工作空间】-【工作流】-【新建工作流】,进入新建工作流配置页面。设置
    发表于 03-10 10:05

    是德科技与三星携手英伟达展示端到端AI-RAN验证工作流程

    演示展示了是德科技的AI-RAN解决方案如何以物理上行共享信道(PUSCH)信道估计用例,简化AI驱动RAN模块的验证流程,将数据生成、AI/ML训练和性能基准测试整合到单一的自动化工作流程中,以加速创新并降低运营商和设备厂商的部署风险。
    的头像 发表于 03-05 10:04 801次阅读

    新西兰服务器运维必备:自动化监控与故障预警实践

    在现代互联网运维中,服务器的稳定运行至关重要。新西兰的服务器运维同样不例外,高效的监控和预警系统能够显著提高运维效率,降低服务中断的风险。本文将探讨如何通过自动化监控与故障预警,实现高效的服务器运维
    的头像 发表于 02-26 14:26 321次阅读

    电池组PACK自动化生产线的关键流程与核心优势

    质量与规模生产的重要手段。本文将深入探讨电池组PACK自动化生产线的组成部分、工作流程、优势及挑战,为相关行业提供参考。 电池组PACK自动化生产线是指从电芯到完整电池组的全自动组装过
    的头像 发表于 02-04 09:45 591次阅读
    电池组PACK<b class='flag-5'>自动化</b>生产线的关键<b class='flag-5'>流程</b>与核心优势

    锂电池组装生产线——锂电池电芯分选与组装段工作流程

    该段设备实现了从单个电芯到电池组预备组装的全流程自动化作业,其核心工作流程环环相扣,体现了高度的自动化与系统性。 流程始于人工上料,操作员将
    的头像 发表于 11-13 10:11 1086次阅读

    ADI Power Studio工作流程与工具概述

    、直观的工作流程,利用准确的模型来仿真实际性能,并自动生成关键的物料清单和报告等内容,帮助工程团队更早做出更优决策。
    的头像 发表于 10-22 09:38 1322次阅读

    恩智浦i.MX RT1180跨界MCU驱动EtherCAT的工作流程

    上周的分享已经介绍了整个参考设计的概况和相关硬件资源。那么,本次会从软件工程角度进行分享。首先来了解EtherCAT Slave工作流程
    的头像 发表于 09-28 14:20 1354次阅读
    恩智浦i.MX RT1180跨界MCU驱动EtherCAT的<b class='flag-5'>工作流程</b>

    电芯自动面垫分选装盒生产线的工作流程解析

    电芯自动面垫分选装盒生产线的工作流程解析|深圳比斯特自动化
    的头像 发表于 09-28 10:29 585次阅读

    圆柱电池自动分选机:全流程自动化检测的革新之路

    在新能源产业快速发展的背景下,圆柱电池作为动力电池和储能领域的核心组件,其生产效率与质量把控至关重要。圆柱电池自动分选机的出现,通过全流程自动化检测技术,为电池制造与分选环节提供了高效、精准
    的头像 发表于 07-21 17:59 669次阅读

    自动化计算机的功能与用途

    工业自动化是指利用自动化计算机来控制工业环境中的流程、机器人和机械,以制造产品或其部件。工业自动化的目的是提高生产率、增加灵活性,并提升制造过程的质量。工业
    的头像 发表于 07-15 16:32 899次阅读
    <b class='flag-5'>自动化</b>计算机的功能与用途

    Jenkins和Docker自动化CI/CD全流程

    要想做到一个高效的CI/CD流程,需要有能力整合DevOps工具链及多环境适配,并且设计之初以自动化为原则,如一键部署、一键升级。
    的头像 发表于 05-14 11:50 1052次阅读
    Jenkins和Docker<b class='flag-5'>自动化</b>CI/CD全<b class='flag-5'>流程</b>

    PLC常见的故障和因素及5大排除流程

    PLC(可编程逻辑控制器)作为工业自动化控制的核心设备,其稳定运行直接关系到生产线的效率与安全。然而,在实际应用中,PLC系统难免会出现各种故障。本文将系统分析PLC常见故障类型、影响因素,并提
    的头像 发表于 05-11 17:29 6218次阅读
    PLC常见的<b class='flag-5'>故障</b>和因素及5大<b class='flag-5'>排除</b><b class='flag-5'>流程</b>图