侵权投诉

利用数据包分析驱动的故障域隔离方法解决网络性能问题

电子设计 2021-06-29 16:00 次阅读

作者:Emulex公司Endace业务全球培训总监Jeff Brown

当网络问题并不复杂,并且当大家都来自同一个组织的时候,专家团队方法能够有效地对事故作出响应。但近年来,随着基础架构云端化,相关利益主体分布在不同的部门、公司和地理区域,针对网络事故和业务应用性能问题的根本原因分析(RCA)变得越发困难。

为满足服务水平协议(SLA)要求并防止客户流失,快速查明根本原因已成为许多企业的首要任务。但是,据《Emulex可视性调查》表明,79%的企业曾经将事故发生的原因错误地归咎于某个IT部门,这不仅增添了混乱程度,还推迟了解决问题的时间。

针对以上问题,本文将介绍一个由数据包分析驱动的故障域隔离(FDI)方法,帮助企业进行故障检修并解决网络和应用性能问题。

外包成为主流

即使整个基础架构由一家企业所有,要充分了解整个基础架构的实际状态也会非常困难。更何况,当外包业务迅速扩张时,端到端业务应用就会逐渐出现许多盲点。如果整个技术层都被外包出去,就会出现一个巨大的盲点,导致您无法在该技术域内进行RCA。为了顺应技术外包的趋势,企业必须清楚地区别事故响应工作流程中FDI阶段与RCA阶段的目的和要求。

什么是FDI?

FDI的理念很简单,任何看过病的人都不难理解,它跟医疗保健领域的“事故调查”流程在本质上相似。首先,一名全科医生会进行初步评估、安排诊断测试并评估结果。然后,患者将接受专科医生的检查,而且只有在证据充分、可以确定病情时才会进行其他诊断和治疗。诊断过程以事实而不是以猜测作为依据。

部署FDI的企业希望最大限度地减少参与每次事故调查的技术专家的人数和类型,这就是FDI需要在RCA之前进行的原因。这样做的目的是为了在开始深入分析根本原因之前找到一个可疑的技术层。为什么要按技术进行隔离呢?一是因为IT部门和外包业务通常是按技术划分的,二是因为这样有助于快速减少参与人员的数量。由于只会牵涉到一个故障域,技术隔离可以避免整个部门及外部企业由于接受调查而导致业务停顿。这就好比您不会让一名神经外科医生来检查脚趾骨折一样。

FDI的一个主要目的是防止调查过程中“相互推诿”的现象。要使FDI更为有效,必须提供确凿的证据,证实某个“可疑”子系统或技术层是导致问题的根本原因。同时,还需要确认任何其他子系统或技术层不可能是问题的根源所在。当故障域位于外包技术中时,这一点尤为重要。

在将问题移交给负责的团队或服务提供商处理的时候,有效的FDI还有助于提供与特定技术相关、可付诸行动的数据,这将为技术团队提供相关情景、症状和信息,以便他们立即针对其所负责的系统进行深入的根本原因分析。

图1: 事故响应流程

只需要一组事实

为保证其效率及有效性,FDI需要根据在技术层之间交换的实际数据包进行分析。数据包不会“撒谎”,它们也不会掩盖平均值或统计数据中的关键细节。以基本数据包作为证据可以确保FDI流程找到对于事故具有不可推卸责任的故障技术层。

“首要FDI”指的是将事故交予特定技术团队或外包服务提供商。它的目标相对简单,即在少数部门、团队以及外包服务商中分配事故,因而是一种极为经济的实施方法。在实际操作中,它涉及的技术层、网络中的分路点以及在每个技术层之间进行监控的网络记录器均相对较少。

什么原因导致了延迟?

当人们认真地进行RCA并且有自信确定问题所在的时候,人们就可以降低成本并缩短解决问题的时间。当负责处理问题的人员拥有正确评估原因及解决问题的专业技能时,RCA就能达到最佳效果。

在前文,我们提到以数据包为导向的FDI流程能够有效加快事故调查并减少参与人员数量。此外,FDI不需要很多分路器和设备即可对主要技术层进行隔离,从而实现其首要目标——仅指派相关的人员参与事故调查。那么,为什么很多重大事故调查仍然需要召开专家小组会议呢?

问题在于,有的人认为,仅仅依靠若干分路器和网络记录器不足以完全解决复杂的事故。您知道吗?他们的看法是正确的。但是,这并不是事故调查流程FDI阶段的目标,该阶段的目标是隔离故障。通过基本数据包以及数据包分析的流程,您可以简单有效地实现这一目标。

分而治之

首要/一级FDI流程会将事故隔离到由企业内部结构和外包安排所定义的单一技术层。要达到首要FDI的最佳效果,我们需要:1) 使用网络记录工具监控和储存技术层之间产生的网络流量;2) 通过应用事务分析(Application Transaction Analysis)来进行故障隔离。数据包存储对于高效的FDI所依赖的回顾性分析(Back-in-time Analysis)至关重要。

您可能已经猜到,FDI是一个可以分层部署的“分治”流程。您还可以在每个技术层次中进行FDI,从而进一步隔离问题,直到高效完成RCA。这个过程可以称为“层内FDI”或“辅助FDI”。

辅助FDI工作流程尤其适用于网络事故调查。同理,为达到FDI的最佳效果,我们需要监控并储存关键网络组件之间的实际数据包流,从而进行有效的回顾性分析。

如果以网络内FDI作为目标,则需要了解应在哪些位置部署网络分路器和网络记录工具。首要FDI与网络内FDI之间的主要区别在于观察点的位置更多与物理位置、技术、员工专业技能以及外包程度和外部提供商有关,与组织问题关系不大。但是,FDI流程较为类似:执行基于数据包的分析以提供确凿证据,从而确定哪些技术或服务提供商存在问题、哪些不存在问题。

始终运行还是始终可用?

我们不希望等到发生重大事故时才开始部署执行FDI所需的分路器和监控工具,这将与FDI的初衷背道而驰。因此,我们应部署并始终运行执行主要/一级FDI所需的分路器和网络记录工具。

但是,如何执行辅助/技术内FDI呢?如何处理远程站点、地区性数据中心和非关键性应用呢?您不可能四处进行分路,也无法储存一切内容。

幸运的是,人们开发了许多网络记录工具,以满足主要技术层之间的“始终运行”记录需求,以及通过网络数据包代理连接到众多二级分路点的“始终可用”记录需求。始终可用的设备不一定能够保证长期的回顾可视性,但您可以在需要时快速配置这些设备,根据当前事故调查的特定可视性需求进行监控。

如此简单?

那么,FDI真的像我们所说的那么简单吗?我们需要辩证地回答这个问题。很显然,在现代企业联网业务应用基础架构这样复杂的动态系统中,可能会出现各种反常、复杂甚至是匪夷所思的问题。您始终需要对这些类型的问题进行深入调查,并利用专家的技能和知识来加以解决。但这并不能说明FDI与有效解决这些负载问题无关。事实上,这些问题使一个严格、可重复、由数据驱动的FDI流程更为重要了。要解决复杂问题,为什么不采用FDI这种久经考验的“分治”方法呢?

责任编辑:gt

收藏 人收藏
分享:

评论

相关推荐

使用监控软件解决网络性能问题

畅通无阻的网络性能是许多 NetOps 活动的核心目标,其中之一是通过使用数据包数据和网络流来解决网....
的头像 广州虹科电子科技有限公司 发表于 10-20 09:31 143次 阅读

3D可视化运维的数字孪生地铁站方案

正在建设智慧城市的北京,提出要打造‘地上地下一张图’,地下一张图指的就是地铁。绘制地铁车站的三维数字....
发表于 10-14 09:34 29次 阅读

电梯监控无线网桥的安装方法

电梯作为楼宇的重要密闭型公共区域和上下出入关键通道,电梯视频监控对整个区域的安防工作具有重要作用,是....
发表于 10-13 15:44 53次 阅读

如何建立电梯物联网安全运行预警体系

电梯,是大楼内的主要垂直交通工具,它肩负着人员和货物的运输。近年来,因使用电梯而造成的人身伤亡事故不....
发表于 10-12 14:32 139次 阅读

电工知识:监控供电安装小知识

一、摄像机的供电摄像机的供电因地制宜,可采用集中供电,也可以本地供电,视现场情况而定,两者区别如图。 二、摄像机镜头焦距...
发表于 10-12 13:40 190次 阅读

鸿蒙的网络管理功能你们知道有多厉害吗

  本示例演示了如何使用网络管理模块相关接口,演示了以下功能: 功能 1: 使用默认网络,打开连接,....
的头像 HarmonyOS技术社区 发表于 10-11 14:26 300次 阅读
鸿蒙的网络管理功能你们知道有多厉害吗

抗洪救灾中的科技力量,傲势无人机显身手

争分夺秒,傲势无人机系统实现全方位监控 今年河南遭遇百年不遇的特大洪水,7月21日,沃飞长空救援团队....
的头像 话说科技 发表于 10-09 11:34 911次 阅读
抗洪救灾中的科技力量,傲势无人机显身手

监控摄像头的详细安装方法

随着视频监控技术民用化的发展,越来越多的超市、餐馆、商铺、办公室、工厂,甚至家庭都安装了监控监控摄像....
的头像 汽车玩家 发表于 10-05 15:44 424次 阅读

六要素新型自动气象站的简单介绍

六要素新型自动气象站厂家介绍FT-QC6【风途】全市大部地区出现了暴雨,区域暴雨整体强度为重度,为2....
发表于 09-30 17:21 41次 阅读

家具五金配件高效清洗工艺优化控制解决方案

家具五金配件企业在生产有特殊表面要求的金属零件过程中,预处理方法的可靠性是高品质产品的基础。清洗过程....
发表于 09-27 12:06 18次 阅读

工厂车间全景航拍三维可视化VR线上展厅

互联网时代和数字孪生工厂等可视化VR线上展厅建设的不断深入,以地理信息系统为基础,融合VR全景线上展....
的头像 商迪3D 发表于 09-26 15:08 320次 阅读

揭秘DDOS攻击的基本概念及DDOS攻击分类

DDOS简介 DDOS又称为分布式拒绝服务,全称是Distributed Denial of Ser....
的头像 Linux爱好者 发表于 09-24 10:36 278次 阅读
揭秘DDOS攻击的基本概念及DDOS攻击分类

扬尘监测仪器检测仪器系统组成有哪些?

扬尘监测仪器检测仪器系统组成有哪些?缺乏有效的在线监测技术和定量化监管手段,缺乏颗粒物总量核定办法和....
发表于 09-22 11:53 55次 阅读

智慧城市里游览公园排水口水质监测设备和设计方案都有哪些?

游览公园排水口水质监测设备和设计方案 1、检测因素:pH、导电率 2、监管感应器需具有计量检定形式批....
发表于 09-18 11:16 401次 阅读

矿井人员定位系统可以实现哪些功能

随着《安全生产法》第三次修改敲定,对于处在行业智能化升级改造变革的煤矿行业而言,如何落实新《安全生产....
发表于 09-16 17:24 39次 阅读

农药残留检测仪预防农残超标问题

为了防止农药残留所造成的危害,不仅要大力推广使用高效、低毒、低残留的农药,还要使用农药残留检测仪对果....
发表于 09-15 11:44 51次 阅读

服务器硬件监控开源软件

总览  随着发电向更清洁,更智能的能源发展,小型光伏面板阵列正在屋顶和后院中兴起。 其中一些安装非常复杂,具有高度...
发表于 09-15 07:34 0次 阅读

分享一种针孔监控摄像头检测神器

大家好,我是懂王。马上就过年了,出门在外的返乡人员越来越多,火车站高铁站近期基本上都是满票,可想而知在车站的候车厅每天有...
发表于 09-15 07:30 0次 阅读

矿井人员定位与车辆定位的功能

伴随着煤矿智能化建设的有序推进,高精度矿井人员定位在煤矿生产中的应用对象已不再局限于人员。而是从人到....
发表于 09-10 17:04 131次 阅读

Win10系统官网下载教程

Win10系统官网下载教程
发表于 09-09 16:06 69次 阅读

怎样通过手机微信去监控PLC数据呢

怎样通过手机微信去监控PLC数据呢? 怎样通过Python开发一个OPC UA客户端访问PLC数据呢 ...
发表于 09-09 06:32 0次 阅读

配电室综合监控系统解决方案

配电室综合监控是整个供配电管理系统中的一个重要环节。目前,配电室一般都采取无人值守,定时巡查制度,这....
发表于 09-08 10:12 593次 阅读

浅析ubuntu风扇转速控制与系统状态监控

现在大家都是在家搞ubuntu吧,我的电脑就时常烫手,但是机子不转,上网找了点办法,让风扇转起来,这对电脑的性能发挥和寿命都有...
发表于 09-08 07:10 0次 阅读

Ocss各模块重要菜单说明

《TT服务器使用手册》由会员分享,可在线阅读,更多相关《TT服务器使用手册(21页珍藏版)》请在人人文库网上搜索。1、F8fg95...
发表于 09-06 07:07 0次 阅读

智能订单管理系统能解决哪些难题

以生鲜行业为例,现在对于生鲜食品类的使用,在人们日常生活已经成为常态,由于生鲜食品类本身具有一定的特....
发表于 09-04 15:44 102次 阅读

电力企业消防安全管理问题研究

电力企业是我国重要的能源类企业,电力企业的安全生产及经营既关系到人民的生产、生活稳定、有序地进行,更....
发表于 08-26 08:42 57次 阅读

STM32串口通信怎样来发送接收一个完整的数据包

STM32串口通信校验问题这里以串口作为传输媒介,介绍下怎样来发送接收一个完整的数据包。过程涉及到封包与解包。设计一个良好...
发表于 08-24 06:56 101次 阅读

气体检测仪检测不准的解决方法

对于许多工厂气体检测是其中一项非常重要的程序,很多生产工序需要用到有潜在毒性的气体,以及部分工序会产....
发表于 08-23 11:43 606次 阅读

无人值班变电站的运维管理研究

当前,在行业整体电力系统当中,无人值班变电站占比不断增大,是较为成熟的一种变电站技术,对其运行维护管....
发表于 08-23 10:08 341次 阅读

电力监控系统在配电房改造工程中的应用

本文介绍湖北保利大酒店配电房改造工程电力监控系统,采用智能电力仪表、采集配电现场的各种电参量和开关信....
发表于 08-23 10:00 72次 阅读

小容量分布式光伏电站信息采集系统介绍

近年来,各类分布式光伏电站建设非常迅速,有效地缓解了环境与资源的矛盾。小型光伏电站规模不大,装机容量....
发表于 08-20 14:25 617次 阅读

电气火灾的主要原因及预防方法

目前在我国发生的火灾中,有半数以上属于电气火灾。据权威数据表明,电气火灾造成的财产损失占火灾总损失的....
发表于 08-20 14:23 513次 阅读

智慧消防社会化存在的问题及解决方法

近些年我国火灾事故频发,消防力量跟不上时代的步伐,促进消防社会化是提高全民防火能力的捷径,响应公共服....
发表于 08-20 14:15 373次 阅读

怎样去设计一种基于STM32的智慧矿山之矿井安全监控终端

一、技术参数:硬件平台为基于Cortex-M3内核的奋斗STM32F103开发板,各传感器模块采用数字化模块,LCD模块采用FSMC...
发表于 08-20 06:32 0次 阅读

地铁消防安全存在的问题及解决方法

地铁目前已经发展成为我国各个地区和大城市重要的公共交通运输方面不可或缺的一部分遥其节约能源尧运行量大....
发表于 08-18 10:40 423次 阅读

电池组保护和监控芯片OZ8930数据手册

电池组保护和监控芯片OZ8930数据手册
发表于 08-17 17:44 120次 阅读

电池组保护和监控芯片OZ8920数据手册

电池组保护和监控芯片OZ8920数据手册
发表于 08-17 17:40 119次 阅读

电池组保护和监控芯片OZ890数据手册

电池组保护和监控芯片OZ890数据手册
发表于 08-17 17:06 90次 阅读

虫情测报灯在农业生产中的应用

害虫对农业的影响还是比较大的,害虫造成的损失基本都属于毁灭性的,害虫以植物的叶片为食,在害虫发生严重....
发表于 08-14 16:29 61次 阅读

分布式光伏发电监测系统解决方案

“十四五”期间,随着“双碳”目标提出及逐步落实,本就呈现出较好发展势头的分布式光伏发展有望大幅提速。....
发表于 08-13 14:38 236次 阅读

如何去安装K-Φ24系列开口电流互感器

K-Φ24系列开口电流互感器的特点是什么? K-Φ24系列开口电流互感器有哪些应用? 如何去安装K-Φ24系列开口电流互感器? ...
发表于 08-11 08:42 0次 阅读

虹科便携式网络TAP提供完整数据包可见性

数据包是网络中传输的最小数据单位。网络管理员需要这个粒度单元来收集全面的网络分析,但当信息系统被信息....
的头像 OPPOstory 发表于 08-10 09:55 404次 阅读

智慧消防系统设计方案

智慧消防系统是一种将GPS(全球卫星定位系统)、GIS(地理信息系统)、GSM(无线移动通信系统)和....
发表于 08-06 09:34 250次 阅读

如何去使用nRF24L01

最近在一个项目中用到了nRF24L01这个无线2.4G收发芯片,项目中有主机和分机,默认都是使用数据通道0,主机通过nRF24L01发...
发表于 08-05 07:18 101次 阅读

LNG/LPG容器监控的简单介绍

预计在未来几十年中,天然气的使用将大大增加,这需要额外的运输基础设施。 通过天然气管道的运输已经被广....
发表于 07-30 09:05 88次 阅读

基于边缘网关的远程监控/数据采集/远程锁机方案

佰马BMG700边缘计算智能网关,是佰马科技结合工业物联网、设备远程通信、远距离控制、智能设备集中接....
发表于 07-28 15:33 216次 阅读

油烟浓度在线监控仪的应用案例

采用GPRS/CDMA/4G无线通讯,支持专网接入,TCP通讯方式将污染信息数据上报至管理部门的在线....
发表于 07-20 16:21 169次 阅读

路灯照明实时监控方案

伴随着城市智能化的不断推进,节能环保的太阳能路灯已逐步取代传统路灯。由于太阳能路灯成本高,太阳能路灯....
发表于 07-09 09:21 247次 阅读

手把手教你如何搭建bzz节点监控程序

对于节点较多的用户,采用B/S方案,在服务器(支持Windows/Linux)上运行采集和监控程序,....
的头像 深圳市恒讯科技有限公司 发表于 07-07 17:25 548次 阅读

高精度室内人员定位方案

高精度室内人员定位系统采用UWB定位技术,通过TDOA到达时间差的算法实现三维定位,定位精度优于30....
发表于 07-07 14:55 168次 阅读

室内人员定位管理系统解决方案

我司(DONWIT东识)室内人员定位管理系统是依托互云计算、大数据、蓝牙定位技术、数据库技术、AI、....
发表于 07-07 11:21 231次 阅读

电气火灾监控系统的构成

电气火灾监控系统早已慢慢变成建筑消防配电设计中务必考虑到的关键一部分。那麼大伙儿了解电气火灾监控系统....
发表于 07-07 09:34 155次 阅读

如何区分电气火灾监控系统的好坏

电气火灾监控系统警报是为了更好地防止损害,而传统式火灾事故全自动报警设备是为了更好地减少损失。那麼大....
发表于 07-07 09:24 114次 阅读

安防巡逻机器人有什么作用

说到安全系统,我们首先想到的是监控系统。由于传统监控系统的位置是固定的,摄像头存在一定的盲区,视野有....
发表于 07-06 17:07 350次 阅读

如何建设管廊综合管控系统

城市地下管线是指城市范围内供水、排水、燃气、热力、电力、通信、广播电视、工业等管线及其附属设施,是保....
发表于 07-06 14:51 310次 阅读

智能网联汽车信息安全运维应用管理的建设及挑战

汽车信息安全领域的法规和标准要求正在日趋严格。目前已发布或在制定的汽车信息安全法规和标准中,都提到了....
的头像 联合电子 发表于 07-05 14:39 674次 阅读
智能网联汽车信息安全运维应用管理的建设及挑战

余压监控控制系统的详细介绍

余压监控控制系统的所有目的就是保持楼梯间和前解决室的余压值维持在我国国家标准范围,阻止有伤害粉尘进入....
发表于 07-05 09:54 422次 阅读

求一种为车内监控提供全局快门图像传感器的解决方案

据报道,全球领先的半导体厂商意法半导体近日宣布,与基于视觉的人工智能软件和车内传感器融合技术的全球领....
的头像 MEMS 发表于 07-04 09:58 562次 阅读

对虾养殖水体的稳定该如何监控如何维护

对虾养殖水体的稳定该如何维护? 跟专家学学这几招 老话说水里求财难见,近两年来,对虾养殖面积逐年增加....
发表于 07-02 10:51 0次 阅读