0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NetQ 4.1.0结构范围内的延迟和缓冲区占用分析

星星科技指导员 来源:NVIDIA 作者:Ranga Maddipudi 2022-04-11 14:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

NetQ 4.1.0 最近发布,引入了结构范围的网络延迟和缓冲区占用分析,以及许多其他增强功能。

这篇文章包括以下特点:

基于流的结构范围延迟和缓冲区占用分析(新增)

刚刚发生的事情( WJH )仪表板(新)

通用 webhook 通知(新)

验证改进

gNMI 流媒体增强功能

结构范围内的延迟和缓冲区占用分析

NetQ 首次通过使用实时应用程序流量来解决影响应用程序性能的网络问题,提供了网络范围的结构延迟和缓冲区占用分析。 NetQ 使用 Cumulus Linux 对匹配 4 元组和 5 元组应用程序流的数据包进行采样,分析并报告每个交换机的延迟(最大、最小、平均)以及流路径上的缓冲区占用详细信息。

NetQ 图形用户界面会报告所有可能的路径、正在使用的路径以及每个路径的详细信息(图 1 )。在每个交换机上,都可以看到最小延迟、最大延迟和平均延迟。

WJH 是一种始终在线的全数据包检查工具,用于以线路速率检测网络问题,包括数据包丢失、拥塞和延迟问题。通过与 WJH 合作,流量遥测可以按需对匹配特定流量的流量进行深入分析和故障排除。

将这些功能结合使用,网络工程师可以主动发现并解决服务器和应用程序问题的根本原因,并将可能的中断或性能影响通知服务器或应用程序管理员。

pYYBAGJTx4qAKbH6AAIhcC2Biko899.png

图 1 。基于流量的遥测

这与 sFlow 有什么不同?

基于 NetQ 流的遥测技术使您能够使用数据包的 5 元组或 4 元组信息(包括 VXLAN 内部或外部头)选择要分析的流。

sFlow 没有这种级别的灵活性,通常在物理端口级别进行监控。 sFlow 还提供特定的设备属性,而不与网络中的对等设备关联,因此无法提供数据来构建网络拓扑。

这和追踪路线有什么不同?

在 traceroute 的情况下,主机生成一个通过网络运行的数据包,用于收集跟踪数据。 NetQ flow telemetry analysis 使用实际的应用程序数据包来构建跟踪数据。从基于流的遥测中获得的数据包括硬件提供的延迟和缓冲区占用。 Traceroute 返回延迟的 ping 级别精度,这比硬件级别的延迟精度低很多。

这与带内流量分析有何不同?

带内流分析本质上是侵入性的,因为每个跃点都会向数据平面中的数据包添加元数据。这会造成网络开销。基于 NetQ 流的遥测不会改变数据平面数据包结构。

刚才发生了什么

NetQ 4.1 引入的新 What Just Occess ( WJH )仪表板显示了 WJH 事件的时间线视图、生成 WJH 事件的顶级开关、顶级事件类型等等。这使您能够快速从结构中所有交换机收集的 WJH 事件数据中获取见解。 WJH 事件详细信息可用于触发前面描述的流量遥测分析。

pYYBAGJTx5SAVaxHAAIWwszCZzE382.png

图 2 。刚才发生了什么

以下是如何充分利用 WJH :学习、清洁和个性化。

将所有交换机的 WJH 事件集中收集到 NetQ 中。这使您能够查看网络中发生的丢包、拥塞、 ACL 和其他协议。 NetQ 仪表盘按放置类别组织:

L1

L2

路由器

地下通道

缓冲器

国际计算语言学协会

清洁的

WJH 报告通知网络、服务器和存储管理员的问题。按优先顺序解决 WJH 发现的网络问题。

个性化

将 NetQ 上的 WJH 过滤器设置为只接收未来选定的 WJH 事件。例如,在 ACL 的下一次修订更新之前,您可能不希望收到 ACL 删除。这会将事件的数量减少到对你重要的程度。

NetQ 还提供了接收特定事件类型或具有特定严重性的事件的灵活性。 NetQ 还提供在 WJH 事件上设置跨越阈值警报,这些警报可以与 PagerDuty 、 Slack 和其他通知工具集成。

验证增强

在生产网络中, NetQ 验证提供了对网络实时状态的洞察,并有助于主动监控和故障排除。作为 NetQ 4.1.0 的一部分,对验证检查进行了重新设计,从而显著提高了性能。

根据数据中心结构中运行的协议,可以启用或禁用每小时网络验证检查。

全局验证检查过滤器应用于 NetQ 4.1.0 的每小时网络验证检查,使网络管理员能够建立与网络中运行的内容匹配的干净网络验证状态。

当这个基线建立后,使用 NetQ 很容易检测到任何偏差。

在 NetQ 4.1 中,添加了分组概念,以在站点内创建多个验证范围。使用此功能,在单个站点中具有多个结构的客户可以按需运行每个结构,并按计划进行验证。

pYYBAGJTx6uAAN_UAADBo27h_84187.png

图 4 。验证设备组

gNMI 流媒体增强功能

NetQ 4.1.0 支持 gNMI gRPC 网络管理接口 ,除了 Cumulus Linux 之外,还可以从 SONiC 上的 NetQ 代理收集 WJH 数据。对于 Cumulus Linux 交换机,可以使用 gNMI 传输系统资源和接口计数器。 用户指南中提供了 YANG 车型的详细信息。

通用 webhook 通知支持

NetQ 4.1.0 除了电子邮件、 syslog 、 PagerDuty 和 Slack 事件通知分发选项外,还引入了对通用 webhook 通知的支持。通用 webhook 使 NetQ 能够使用 JSON 格式的事件负载信息与定制应用程序集成。

总结

在本文中,您已经看到了 NetQ 4.1.0 提供的新功能的概述。

关于作者

Ranga Maddipudi 是 NVIDIA 网络组的产品管理总监,负责网络遥测和 NetQ 。他在网络控制器、自动化和分析方面有丰富的经验。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    5509

    浏览量

    109122
  • Linux
    +关注

    关注

    88

    文章

    11631

    浏览量

    218048
  • 交换机
    +关注

    关注

    23

    文章

    2874

    浏览量

    103963
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    CW32L052串口的缓冲区机制

    默认缓冲区配置 CW32L052的UART模块支持硬件FIFO(通常为16字节),但HAL库或用户代码需手动管理接收缓冲区。若未显式分配足够大的软件缓冲区,可能导致数据溢出。 HAL库缓冲区
    发表于 11-24 06:40

    飞凌嵌入式ElfBoard-标准IO接口之设置缓冲区

    件的stdio缓冲区,应以动态或静态的方式在堆中为该缓冲区分配一块空间,而不是分配在栈上的函数的自动变量(局部变量)。如果buf等于NULL,那么会自动分配一块空间作为该文件的stdio缓冲
    发表于 11-14 09:02

    移植的lvgl,在运行的时候,缓冲区无法释放怎么解决?

    代码在运行的时候,只有lvgl线程用于刷新,另一个线程只有一个串口打印。 当运行一段时间后,发现,程序会在LVGl中,lv_refr.c这个库下面第625行代码, 在这一直判断,看介绍说是在等待释放缓冲区,求大神给个思路
    发表于 09-09 07:28

    USB缓冲区中的内容满了之后,是否有标志位进行反馈?

    USB缓冲区中的内容满了之后,是否有标志位进行反馈。
    发表于 07-17 07:13

    请问USB缓冲区取数据可以多次取吗?

    在使用USB软件获取数据是,下位机给我发送了13个32位数据到USB IN缓冲区,为什么我调用API函数想要第一次取1个32位数据,取完之后再取12位数据,程序会卡死。
    发表于 07-16 08:12

    解析RZ/N2L CANFD模块的缓冲区机制(2)

    在工业自动化、智能交通、机器人等领域,CANFD(CAN with Flexible Data-Rate)技术正逐步取代传统CAN,以适应更高的数据速率和更复杂的通信需求。本文将深入解析RZ/N2L CANFD模块的缓冲区机制,帮助工程师更高效地管理CAN消息,提高系统性能。
    的头像 发表于 05-19 14:13 1169次阅读
    解析RZ/N2L CANFD模块的<b class='flag-5'>缓冲区</b>机制(2)

    解析RZ/N2L CANFD模块的缓冲区机制(1)

    在工业自动化、智能交通、机器人等领域,CANFD(CAN with Flexible Data-Rate)技术正逐步取代传统CAN,以适应更高的数据速率和更复杂的通信需求。本文将深入解析RZ/N2L CANFD模块的缓冲区机制,帮助工程师更高效地管理CAN消息,提高系统性能。
    的头像 发表于 05-19 14:10 985次阅读
    解析RZ/N2L CANFD模块的<b class='flag-5'>缓冲区</b>机制(1)

    FX3 Socket缓冲区切换的最大时间是多少?

    FX3_Programmers_Manual 文档的第 10 章提到“每个缓冲区缓冲区切换开销为 550 - 900 ns”。 Getting_Started_with_EZ-USB_FX3 文档
    发表于 05-16 07:51

    在传输DMA通道中的所有缓冲区后,DMA标志(就绪和部分)被卡住了是怎么回事?

    是,旗帜最初的表现是正确的。 它们被配置为 ACTIVE HIGH 标志,初始值设为 LOW。 整个 DMA 通道默认使用两个 DMA 缓冲区。 传输开始时,第一个缓冲区被正确填满:部分标志(标志 b
    发表于 05-16 07:18

    求助,关于3014的缓冲区设置疑问求解

    rgb24 1080p@60fps是静态图像,dma缓冲区的配置即大小和数量分别为16kb,6,沿用的是yuy2的配置,但yuy2 1080p@60fps 是动态且不颠倒,是否可以认为是由于缓冲区
    发表于 05-06 13:42

    请问如何在Linux中使用帧缓冲区更新epdc显示?

    我正在使用带有 epdc 显示子卡 (IMXEBOOKDC5) 的 IMX8ULP EVK。使用 Linux 映像引导后,epdc 显示无法使用帧缓冲区进行更新。当检查显示 pmic 的电源使能引脚
    发表于 04-01 06:41

    FreeRTOS进阶使用之流缓冲区:高效处理字节流的秘密武器

    任务优先级反转。 数据完整性流缓冲区不保证数据边界,若需传输离散消息(如结构体),建议改用****消息缓冲区(Message Buffer)​。 五、总结 流缓冲区是FreeRTOS
    发表于 03-24 11:37

    L9663如何使用上行缓冲区发送同步脉冲?

    我根据L9663 Datasheet这个手册,想使用这个配置“通过带有上行数据缓冲区的SPI触发。微控制器发送相应的SPI命令以发送同步脉冲。然后,同步脉冲触发发生器根据上行数据缓冲区中的值在内部
    发表于 03-13 08:15

    缓冲区溢出漏洞的原理、成因、类型及最佳防范实践(借助Perforce 的Klocwork/Hleix QAC等静态代码分析工具)

    本期来认识软件漏洞的“常客”——缓冲区溢出,C/C++开发者尤其要注意!全面了解该漏洞的成因、类型、常见示例,以及如何借助Klocwork、Helix QAC等SAST工具进行防护。
    的头像 发表于 03-04 16:39 1758次阅读
    <b class='flag-5'>缓冲区</b>溢出漏洞的原理、成因、类型及最佳防范实践(借助Perforce 的Klocwork/Hleix QAC等静态代码<b class='flag-5'>分析</b>工具)

    RTOS的流缓冲区机制解析

    SAFERTOS中的流缓冲区(Stream buffer)机制,可以实现任务到任务或中断到任务之间的通信。字节流是由发送方写入缓冲区,接收方读取缓冲区数据。流缓冲区作为队列的轻量级级替
    的头像 发表于 02-14 11:33 993次阅读
    RTOS的流<b class='flag-5'>缓冲区</b>机制解析