故障设备定位方法、装置、电子设备、介质和程序产品制造方法及图纸

技术编号:34048771 阅读:65 留言:0更新日期:2022-07-06 15:17
本公开提供了一种基于网络拓扑结构的故障设备定位方法、装置、电子设备、介质和计算机程序产品。上述方法和装置可用于人工智能技术领域。基于网络拓扑结构的故障设备定位方法包括:根据预先构建的网络拓扑结构确定异常设备节点;将所述异常设备节点作为根节点;确定所述网络拓扑结构中所述根节点所在的m个链路,其中,m为大于等于1的整数;从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测;直到检测的链路连通性故障时,将该链路作为故障链路;以及通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备。出故障设备。出故障设备。

Fault equipment location method, device, electronic equipment, media and program products

【技术实现步骤摘要】
故障设备定位方法、装置、电子设备、介质和程序产品


[0001]本公开涉及人工智能
,更具体地,涉及一种基于网络拓扑结构的故障设备定位方法、装置、电子设备、介质和计算机程序产品。

技术介绍

[0002]随着互联网技术的迅猛发展,大数据、人工智能等新兴业务等蓬勃升起,高带宽、低延时、低CPU资源使用率的高性能RDMA(Remote Direct Memory Access,远程直接数据存取)协议越来越多地被金融机构选择。并且随着数据中心流量的快速增长,网络规模也逐渐扩大。现有RDMA网络结构一般采用树形结构,核心放置几台转发容量较大的设备,为保证足够多的端口数量,需下挂多层设备,数十台甚至几百台的网络设备级联到一起,实现多层级联。为满足日益增长的数据中心网络流量和业务需求,需不断增加网络设备,一旦出现故障,难以迅速从数百台设备中找到故障设备。
[0003]现有技术中,当网络出现故障时,往往先从应用侧得到故障反馈,运维人员首先从应用人员处了解网络故障现象;然后查看设备的一些日志和端口流量,找出丢包或者不通的IP地址来,对这个故障流量经过的设备进行网络流通,找出故障设备。首先应用人员只能反馈局部表面现象,无法反映出整个网络的故障情况;其次当出现网络故障时,对设备的一些日志和端口流量做监控,但是更多的时候这些信息并不够,若极端情况或者设备故障时导致无日志或告警输出,并不能及时发现问题;通过ping或者Traceroute路由跟踪功,查找丢包或者不通的IP地址进行网络流通时,需要对故障流量经过的设备都做流通。/>
技术实现思路

[0004]有鉴于此,本公开提供了一种快速、高质量的基于网络拓扑结构的故障设备定位方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0005]本公开的一个方面提供了一种基于网络拓扑结构的故障设备定位方法,包括:根据预先构建的网络拓扑结构确定异常设备节点;将所述异常设备节点作为根节点;确定所述网络拓扑结构中所述根节点所在的m个链路,其中,m为大于等于1的整数;从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测;直到检测的链路连通性故障时,将该链路作为故障链路;以及通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备。
[0006]根据本公开实施例的基于网络拓扑结构的故障设备定位方法,通过确定故障链路,在故障链路中通过最小二分法定位故障设备,与现有技术相比,无需对整个拓扑结构进行流通性测试,由此可以减少定位过程耗费的时间,降低寻找故障设备的难度。本公开从包括节点数量最多的链路开始,按照节点数量降序依次对m个链路进行连通性检测,可以减少故障排查次数,实现对故障链路的快速定位。采用最小二分法对故障链路进行连通性检查时可以检测网络端到端的各段链路的链路质量,从而准确定位故障设备,减轻运维人员压力。
[0007]在一些实施例中,所述连通性检测通过ping探索器检测。
[0008]在一些实施例中,所述从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测,具体包括:根据节点数量给所述m个链路降序排序;以及根据排序顺序,依次对所述m个链路进行连通性检测。
[0009]在一些实施例中,所述通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备,具体包括:步骤一:将所述故障链路从中间节点划分为两个子链路;步骤二:检测所述两个子链路中的一个子链路的连通性;步骤三:当该子链路有连通故障时,将该子链路确定为故障链路;以及步骤四:重复步骤一至步骤三,直至定位出故障设备。
[0010]在一些实施例中,所述通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备,具体还包括:步骤五:当该子链路无连通故障时,将所述两个子链路中的另一个子链路确定为故障链路;步骤六:重复步骤一至步骤五,直至定位出故障设备。
[0011]本公开的另一个方面提供了一种基于网络拓扑结构的故障设备定位装置,包括:第一确定模块,所述第一确定模块用于执行根据预先构建的网络拓扑结构确定异常设备节点;第二确定模块,所述第二确定模块用于执行将所述异常设备节点作为根节点;第三确定模块,所述第二确定模块用于执行确定所述网络拓扑结构中所述根节点所在的m个链路,其中,m为大于等于1的整数;检测模块,所述检测模块用于执行从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测;第四确定模块,所述第四确定模块用于执行直到检测的链路连通性故障时,将该链路作为故障链路;以及定位模块,所述定位模块用于执行通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备。
[0012]本公开的另一方面提供了一种电子设备,包括一个或多个处理器以及一个或多个存储器,其中,所述存储器用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现如上所述方法。
[0013]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
[0014]本公开的另一方面提供了一种计算机程序产品,包括计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
[0015]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0016]图1示意性示出了根据本公开实施例的可以应用方法、装置的示例性系统架构;
[0017]图2示意性示出了根据本公开实施例的基于网络拓扑结构的故障设备定位方法的流程图;
[0018]图3示意性示出了根据本公开实施例的网络拓扑结构的示意图;
[0019]图4示意性示出了根据本公开实施例的从包括节点数量最多的链路开始,按照节点数量降序依次对m个链路进行连通性检测的流程图;
[0020]图5示意性示出了根据本公开实施例的通过最小二分法对故障链路进行故障定位,直到定位出故障设备的流程图;
[0021]图6示意性示出了根据本公开实施例的通过最小二分法对故障链路进行故障定
位,直到定位出故障设备的流程图;
[0022]图7示意性示出了根据本公开实施例的基于网络拓扑结构的故障设备定位装置的框图;
[0023]图8示意性示出了根据本公开实施例的基于网络拓扑结构的故障设备定位方法的流程图;
[0024]图9示意性示出了根据本公开实施例的基于网络拓扑结构的故障设备定位装置的框图;
[0025]图10示意性示出了根据本公开实施例的电子设备的方框图。
具体实施方式
[0026]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于网络拓扑结构的故障设备定位方法,其特征在于,包括:根据预先构建的网络拓扑结构确定异常设备节点;将所述异常设备节点作为根节点;确定所述网络拓扑结构中所述根节点所在的m个链路,其中,m为大于等于1的整数;从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测;直到检测的链路连通性故障时,将该链路作为故障链路;以及通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备。2.根据权利要求1所述的方法,其特征在于,所述连通性检测通过ping探索器检测。3.根据权利要求1所述的方法,其特征在于,所述从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测,具体包括:根据节点数量给所述m个链路降序排序;以及根据排序顺序,依次对所述m个链路进行连通性检测。4.根据权利要求1所述的方法,其特征在于,所述通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备,具体包括:步骤一:将所述故障链路从中间节点划分为两个子链路;步骤二:检测所述两个子链路中的一个子链路的连通性;步骤三:当该子链路有连通故障时,将该子链路确定为故障链路;以及步骤四:重复步骤一至步骤三,直至定位出故障设备。5.根据权利要求4所述的方法,其特征在于,所述通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备,具体还包括:步骤五:当该子链路无连通故障时,将所述两个...

【专利技术属性】
技术研发人员:杨飘飘余学山赵耀
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1