网络故障定位方法及装置制造方法及图纸

技术编号:36330495 阅读:61 留言:0更新日期:2023-01-14 17:40
本申请实施例提供一种网络故障定位方法及装置,可用于金融领域,方法包括:采集边缘接入交换机转发的数据流量并进行报文分析,确定具有拥塞可能的数据流量;判断所述具有拥塞可能的数据流量是否为微突发数据流,若否,则对所述数据流量的往返特征报文进行关联性匹配和生命周期标识;在所述关联性匹配和生命周期标识完成后对所述数据流量进行延时分析,确定网络故障位置;本申请能够准确定界网络故障原因。因。因。

【技术实现步骤摘要】
网络故障定位方法及装置


[0001]本申请涉及数据处理领域,也可用于金融领域,具体涉及一种网络故障定位方法及装置。

技术介绍

[0002]数据中心存储业务普遍存在网络拥塞导致全链路大量丢包、业务交易量下降的风险。当前数据中心缺失存储业务网络建模,导致网络性能与存储业务质量之间的关联性不明确,网络丢包、吞吐等指标仅仅能解释部分基础网络问题,当前主流的基础网络监测手段测量粒度细但与存储业务关联性很低,导致存储业务具体问题定界困难,业务性能问题则很难解释,无法满足业务的需求。

技术实现思路

[0003]针对现有技术中的问题,本申请提供一种网络故障定位方法及装置,能够准确定界网络故障原因。
[0004]为了解决上述问题中的至少一个,本申请提供以下技术方案:
[0005]第一方面,本申请提供一种网络故障定位方法,包括:
[0006]采集边缘接入交换机转发的数据流量并进行报文分析,确定具有拥塞可能的数据流量;
[0007]判断所述具有拥塞可能的数据流量是否为微突发数据流,若否,则对所述数据流量的往返特征报文进行关联性匹配和生命周期标识;
[0008]在所述关联性匹配和生命周期标识完成后对所述数据流量进行延时分析,确定网络故障位置。
[0009]进一步地,所述采集边缘接入交换机转发的数据流量并进行报文分析,确定具有拥塞可能的数据流量,包括:
[0010]实时监测存储业务边缘接入交换机转发的数据流量并采集所述数据流量的报文头信息;
[0011]对所述数据流量的报文头信息进行特征分析,确定具有拥塞可能的数据流量。
[0012]进一步地,所述判断所述具有拥塞可能的数据流量是否为微突发数据流,包括:
[0013]根据设定时间周期内读取到的芯片缓存队列深度信息对所述具有拥塞可能的数据流量进行微突发数据流判断。
[0014]进一步地,所述对所述数据流量的往返特征报文进行关联性匹配和生命周期标识,包括:
[0015]分别在客户端侧和存储阵列侧接入的边缘接入交换机处理器上对所述数据流量的往返特征报文进行关联性匹配;
[0016]对所述数据流量生命周期中的端侧数据接入延时、数据准备延时、数据传输延时、数据确认延时进行标识。
[0017]进一步地,所述在所述关联性匹配和生命周期标识完成后对所述数据流量进行延时分析,包括:
[0018]根据所述往返特征报文的关联性匹配结果对所述数据流量进行大小流类型区分;
[0019]若所述数据流量属于小流量类型,则通过数据镜像方式上送至设定采集服务器进行延时分析;
[0020]若所述数据流量属于大流量类型,则先进行数据预处理后再上送至设定采集服务器进行延时分析。
[0021]进一步地,所述在所述关联性匹配和生命周期标识完成后对所述数据流量进行延时分析,确定网络故障位置,包括:
[0022]若所述数据传输延时的延时占比超过阈值,则判定网络侧发生故障,将网络交换机带宽利用率和丢包率发送至网络运维端以进行应急处理;
[0023]若所述数据准备延时和/或数据确认延时的延时占比超过阈值,则判定端侧发生故障,通知系统运维端进行客户端和存储阵列检查。
[0024]第二方面,本申请提供一种网络故障定位装置,包括:
[0025]信息采集模块,用于采集边缘接入交换机转发的数据流量并进行报文分析,确定具有拥塞可能的数据流量;
[0026]数据量关联模块,用于判断所述具有拥塞可能的数据流量是否为微突发数据流,若否,则对所述数据流量的往返特征报文进行关联性匹配和生命周期标识;
[0027]延时故障分析模块,用于在所述关联性匹配和生命周期标识完成后对所述数据流量进行延时分析,确定网络故障位置。
[0028]进一步地,所述信息采集模块包括:
[0029]报文头信息采集单元,用于实时监测存储业务边缘接入交换机转发的数据流量并采集所述数据流量的报文头信息;
[0030]报文头特征分析单元,用于所述数据流量的报文头信息进行特征分析,确定具有拥塞可能的数据流量。
[0031]进一步地,所述数据量关联模块包括:
[0032]微突发判断单元,用于根据设定时间周期内读取到的芯片缓存队列深度信息对所述具有拥塞可能的数据流量进行微突发数据流判断。
[0033]进一步地,所述数据量关联模块包括:
[0034]关联性匹配单元,用于分别在客户端侧和存储阵列侧接入的边缘接入交换机处理器上对所述数据流量的往返特征报文进行关联性匹配;
[0035]生命周期标识单元,用于对所述数据流量生命周期中的端侧数据接入延时、数据准备延时、数据传输延时、数据确认延时进行标识。
[0036]进一步地,所述延时故障分析模块包括:
[0037]大小流区分单元,用于根据所述往返特征报文的关联性匹配结果对所述数据流量进行大小流类型区分;
[0038]小流量上送单元,用于若所述数据流量属于小流量类型,则通过数据镜像方式上送至设定采集服务器进行延时分析;
[0039]大流量上送单元,用于若所述数据流量属于大流量类型,则先进行数据预处理后
再上送至设定采集服务器进行延时分析。
[0040]进一步地,所述延时故障分析模块包括:
[0041]网络侧故障定位单元,用于若所述数据传输延时的延时占比超过阈值,则判定网络侧发生故障,将网络交换机带宽利用率和丢包率发送至网络运维端以进行应急处理;
[0042]端侧故障定位单元,用于若所述数据准备延时和/或数据确认延时的延时占比超过阈值,则判定端侧发生故障,通知系统运维端进行客户端和存储阵列检查。
[0043]第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的网络故障定位方法的步骤。
[0044]第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的网络故障定位方法的步骤。
[0045]第五方面,本申请提供一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现所述的网络故障定位方法的步骤。
[0046]由上述技术方案可知,本申请提供一种网络故障定位方法及装置,通过采集边缘接入交换机转发的数据流量并进行报文分析,准确分区微突发数据流,大幅减小采集数据总量,避免遇到数据采集瓶颈,并根据数据流量总延时的分解准确区分、定界异常原因。
附图说明
[0047]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]图1为本申请实施例中的网络故障定位方法的流程示意图之一;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络故障定位方法,其特征在于,所述方法包括:采集边缘接入交换机转发的数据流量并进行报文分析,确定具有拥塞可能的数据流量;判断所述具有拥塞可能的数据流量是否为微突发数据流,若否,则对所述数据流量的往返特征报文进行关联性匹配和生命周期标识;在所述关联性匹配和生命周期标识完成后对所述数据流量进行延时分析,确定网络故障位置。2.根据权利要求1所述的网络故障定位方法,其特征在于,所述采集边缘接入交换机转发的数据流量并进行报文分析,确定具有拥塞可能的数据流量,包括:实时监测存储业务边缘接入交换机转发的数据流量并采集所述数据流量的报文头信息;对所述数据流量的报文头信息进行特征分析,确定具有拥塞可能的数据流量。3.根据权利要求1所述的网络故障定位方法,其特征在于,所述判断所述具有拥塞可能的数据流量是否为微突发数据流,包括:根据设定时间周期内读取到的芯片缓存队列深度信息对所述具有拥塞可能的数据流量进行微突发数据流判断。4.根据权利要求1所述的网络故障定位方法,其特征在于,所述对所述数据流量的往返特征报文进行关联性匹配和生命周期标识,包括:分别在客户端侧和存储阵列侧接入的边缘接入交换机处理器上对所述数据流量的往返特征报文进行关联性匹配;对所述数据流量生命周期中的端侧数据接入延时、数据准备延时、数据传输延时、数据确认延时进行标识。5.根据权利要求1所述的网络故障定位方法,其特征在于,所述在所述关联性匹配和生命周期标识完成后对所述数据流量进行延时分析,包括:根据所述往返特征报文的关联性匹配结果对所述数据流量进行大小流类型区分;若所述数据流量属于小流量类型,则通过数据镜像...

【专利技术属性】
技术研发人员:余学山赵耀杨飘飘陈镛先
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1