【技术实现步骤摘要】
故障设备定位方法、装置、电子设备、介质和程序产品
[0001]本公开涉及人工智能
,更具体地,涉及一种基于网络拓扑结构的故障设备定位方法、装置、电子设备、介质和计算机程序产品。
技术介绍
[0002]随着互联网技术的迅猛发展,大数据、人工智能等新兴业务等蓬勃升起,高带宽、低延时、低CPU资源使用率的高性能RDMA(Remote Direct Memory Access,远程直接数据存取)协议越来越多地被金融机构选择。并且随着数据中心流量的快速增长,网络规模也逐渐扩大。现有RDMA网络结构一般采用树形结构,核心放置几台转发容量较大的设备,为保证足够多的端口数量,需下挂多层设备,数十台甚至几百台的网络设备级联到一起,实现多层级联。为满足日益增长的数据中心网络流量和业务需求,需不断增加网络设备,一旦出现故障,难以迅速从数百台设备中找到故障设备。
[0003]现有技术中,当网络出现故障时,往往先从应用侧得到故障反馈,运维人员首先从应用人员处了解网络故障现象;然后查看设备的一些日志和端口流量,找出丢包或者不通的IP地址来 ...
【技术保护点】
【技术特征摘要】
1.一种基于网络拓扑结构的故障设备定位方法,其特征在于,包括:根据预先构建的网络拓扑结构确定异常设备节点;将所述异常设备节点作为根节点;确定所述网络拓扑结构中所述根节点所在的m个链路,其中,m为大于等于1的整数;从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测;直到检测的链路连通性故障时,将该链路作为故障链路;以及通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备。2.根据权利要求1所述的方法,其特征在于,所述连通性检测通过ping探索器检测。3.根据权利要求1所述的方法,其特征在于,所述从包括节点数量最多的链路开始,按照节点数量降序依次对所述m个链路进行连通性检测,具体包括:根据节点数量给所述m个链路降序排序;以及根据排序顺序,依次对所述m个链路进行连通性检测。4.根据权利要求1所述的方法,其特征在于,所述通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备,具体包括:步骤一:将所述故障链路从中间节点划分为两个子链路;步骤二:检测所述两个子链路中的一个子链路的连通性;步骤三:当该子链路有连通故障时,将该子链路确定为故障链路;以及步骤四:重复步骤一至步骤三,直至定位出故障设备。5.根据权利要求4所述的方法,其特征在于,所述通过最小二分法对所述故障链路进行故障定位,直到定位出故障设备,具体还包括:步骤五:当该子链路无连通故障时,将所述两个...
【专利技术属性】
技术研发人员:杨飘飘,余学山,赵耀,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。