故障定位方法和网络设备技术

技术编号:19101509 阅读:26 留言:0更新日期:2018-10-03 03:48
本发明专利技术实施例提供了一种故障定位方法和网络设备,该方法包括:第一网络设备接收网络中除第一网络设之外的其他网络设备以泛洪方式发送的故障信息报文,每个故障信息报文包括发送所述故障信息报文的网络设备关于内部网关协议的报文的统计信息,每个网络设备的统计信息包括所述网络设备对一个或多个关键性能指标KPI的统计结果;根据第一网络设备的统计信息以及其他网络设备的统计信息,确定所述网络中发生故障的网络设备。本发明专利技术实施例通过接收网络设备以泛洪方式发送的故障信息报文,能够快速收集故障定位所需的信息,即网络设备的KPI,从而加速了故障定位的过程,缩短了故障定位时间。

【技术实现步骤摘要】
故障定位方法和网络设备
本专利技术实施例涉及通信领域,并且更具体的,涉及一种故障定位方法和网络设备。
技术介绍
网络经常发生故障,当故障发生时,如果不及时定位出发生故障的网络设备或者链路并处理,该故障就可能扩散至整个网络,即发生网络震荡。网络震荡会引起全网瘫痪和业务中断。例如,假设某路由设备发生时钟故障,导致该路由设备的系统时间比网络中的其它路由设备的系统时间快数百倍,这样会引发整个网络的其他路由设备反复删除和生成该路由设备对应的表项,严重消耗了其他路由设备的资源,当其他路由设备的资源被耗尽时,会引发全网瘫痪和全网业务中断。网络发生故障时,如何定位发生故障的网络设备是一个难题。以震荡类故障为例,震荡类故障的定位存在如下两个问题:一是震荡类故障发生的时候,难以采集整个网络中的网络设备的故障信息,严重影响故障分析的进程。因为整个网络中,网络设备众多,部分网络设备不支持网管维护,部分网络设备不在网管部署的范围内,导致震荡类故障发生时,一般需要通过远程登陆服务标准协议(英文:Telnet)登陆到不同的网络设备上,分别收集登陆的网络设备的故障信息,例如,收集全网所有路由器的中央处理单元(英文:centralprocessingunit,简称为“CPU”)的状态信息时,需要登陆到整个网络中的每个路由器,对每个路由器的CPU的状态信息分别进行采集,且该Telnet协议只能分组、串行登陆到不同网络设备上进行信息的采集。所以,在这种情况下,需要多台网络设备远程接入网络,且故障信息采集和定位的效率低。二是在分析震荡类故障的时候,需要在众多的网络设备的海量信息中做人工排查,这种方式需要运维人员具有丰富的设备运营维护经验,且分析效率低下,导致故障持续的时间长,业务受影响面积大。
技术实现思路
本专利技术实施例提供一种故障定位方法和网络设备,能够对网络中发生故障的网络设备进行快速、准确的定位。第一方面,提供一种故障定位的方法。第一网络设备接收除所述第一网络设备外的其他网络设备以泛洪方式发送的故障信息报文,每个故障信息报文包括发送所述故障信息报文的网络设备关于内部网关协议的报文的统计信息,每个网络设备的统计信息包括所述网络设备对一个或多个关键性能指标KPI的统计结果;所述第一网络设备根据所述第一网络设备的统计信息以及所述其他网络设备统计信息,确定所述网络中发生故障的网络设备。通过接收网络设备以泛洪方式发送的故障信息报文,能够快速收集故障定位所需的信息,即网络设备的KPI,从而加速了故障定位的过程,缩短了故障定位时间。结合第一方面,在第一方面的第一种实现方式中,所述第一网络设备获取所述第一网络设备的统计信息,所述统计信息包括所述第一网络设备的一个或多个KPI的统计结果;所述第一网络设备以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文,所述第一网络设备的故障信息报文包含所述第一网络设备的统计信息。结合第一方面的第一种实现方式,在第一方面的第二种实现方式中,所述第一网络设备以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文,包括:所述第一网络设备按照第一预设周期,以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文;或在所述第一网络设备的第一KPI的统计结果满足预设条件的情况下,所述第一网络设备以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文。结合第一方面的第二种实现方式,在第一方面的第三种实现方式中,所述满足预设条件包括所述第一网络设备的所述第一KPI的统计结果大于或者等于所述第一网络设备为所述第一KPI设置的KPI阈值。通过以第一网络设备的KPI满足预设条件这种泛洪方式,向其他网络设备发送第一网络设备的故障信息报文,节省了故障信息报文对网络带宽的资源占用。结合第一方面或第一方面的第一种至第三种实现方式中的任一种,在第一方面的第四种实现方式中,所述第一网络设备根据所述第一网络设备的统计信息以及其他网络设备的统计信息,确定所述网络中的发生故障的网络设备,包括:所述第一网络设备确定目标KPI;所述第一网络设备根据所述第一网络设备的统计信息以及所述其他网络设备的统计信息,计算所述网络中每个网络设备上所述目标KPI的KPI变化率;所述第一网络设备根据所述网络中的每个网络设备上目标KPI的KPI变化率,从所述第一网络设备和所述其他网络设备中选取发生故障的网络设备,其中所述发生故障的网络设备的目标KPI的KPI变化率大于或等于预设KPI变化率阈值。通过对网络设备的KPI变化率的分析,能够快速地定位发生故障的网络设备。结合第一方面或第一方面的第一种至第三种实现方式中的任一种,在第一方面的第五种实现方式中,所述第一网络设备根据所述第一网络设备的统计信息和所述其他网络设备的统计信息,确定所述网络中的发生故障的网络设备,包括:所述第一网络设备确定目标KPI;所述第一网络设备根据所述第一网络设备的统计信息以及所述其他网络设备的统计信息,获取所述网络中任意两个网络设备之间传输的所述目标KPI对应内部网关协议的报文的统计结果;根据所述任意两个网络设备之间传输的所述目标KPI对应内部网关协议的报文的统计结果,生成邻接矩阵;根据所述邻接矩阵,确定所述网络中的每个网络设备的中心度;根据所述每个网络设备的中心度,确定所述网络中的发生故障的网络设备。通过任意两个网络设备之间传输的所述目标KPI对应内部网关协议报文的统计结果,生成邻接矩阵,并计算生成的邻接矩阵的中心度,能够准确的定位发生故障的网络设备。结合第一方面或第一方面的第一种至第五种实现方式中的任一种,在第一方面的第六种实现方式中,所述故障信息报文是专门用于承载网络设备的KPI的报文。结合第一方面或第一方面的第一种至第五种实现方式中的任一种,在第一方面的第七种实现方式中,所述故障信息报文是基于内部网关协议IGP的报文。结合第一方面或第一方面的第一种至第七种实现方式中的任一种,在第一方面的第八种实现方式中,所述其他网络设备包括第二网络设备,所述第二网络设备发送的故障信息报文携带与所述第二网络设备相邻的第三网络设备的一个或多个KPI的统计结果,所述第三网络设备是不支持故障信息报文传输的网络设备。第二方面,提供一种网络设备,包括用于执行第一方面中的方法的一个或多个模块。第三方面,提供一种网络设备,包括存储器和处理器,所述存储器用于存储程序代码,所述处理器用于调用所述程序代码以实现上述第一方面及所述第一方面的各实现方式中的方法。第四方面,提供一种计算机可读介质,所述计算机可读介质用于存储可被所述网络设备执行的程序代码,所述程序代码包括用于执行上述第一方面及所述第一方面的各实现方式中的方法的指令。附图说明图1是根据本专利技术实施例的应用场景的示意性架构图。图2是根据本专利技术实施例的故障定位方法的示意性流程图。图3是根据本专利技术实施例的故障定位方法的另一示意性流程图。图4是可应用于本专利技术实施例的网络示意图。图5是可应用于本专利技术实施例的另一网络示意图。图6是根据本专利技术实施例的网络设备的示意性框图。图7是根据本专利技术实施例的网络设备的示意性结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。图1示出了本专利技术实施例的一种应用场景的示意性架构图本文档来自技高网
...

【技术保护点】
1.一种故障定位方法,其特征在于,所述方法包括:第一网络设备接收网络中除所述第一网络设备外的其他网络设备以泛洪方式发送的故障信息报文,每个故障信息报文包括发送所述故障信息报文的网络设备关于内部网关协议的报文的统计信息,每个网络设备的统计信息包括所述网络设备对一个或多个关键性能指标KPI的统计结果;所述第一网络设备根据所述第一网络设备的统计信息以及其他网络设备的统计信息,确定所述网络中发生故障的网络设备。

【技术特征摘要】
1.一种故障定位方法,其特征在于,所述方法包括:第一网络设备接收网络中除所述第一网络设备外的其他网络设备以泛洪方式发送的故障信息报文,每个故障信息报文包括发送所述故障信息报文的网络设备关于内部网关协议的报文的统计信息,每个网络设备的统计信息包括所述网络设备对一个或多个关键性能指标KPI的统计结果;所述第一网络设备根据所述第一网络设备的统计信息以及其他网络设备的统计信息,确定所述网络中发生故障的网络设备。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述第一网络设备获取所述第一网络设备的统计信息,所述统计信息包括所述第一网络设备的一个或多个KPI的统计结果;所述第一网络设备以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文,所述第一网络设备的故障信息报文包含所述第一网络设备的统计信息。3.根据权利要求2所述的方法,其特征在于,所述第一网络设备以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文,包括:所述第一网络设备按照第一预设周期,以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文;或在所述第一网络设备的第一KPI的统计结果满足预设条件的情况下,所述第一网络设备以泛洪方式向所述其他网络设备发送所述第一网络设备的故障信息报文。4.根据权利要求3所述的方法,其特征在于,所述满足预设条件包括所述第一KPI的统计结果大于或者等于所述第一网络设备为所述第一KPI设置的KPI阈值。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述第一网络设备根据所述第一网络设备的统计信息以及其他网络设备的统计信息,确定所述网络中的发生故障的网络设备,包括:所述第一网络设备确定目标KPI;所述第一网络设备根据所述第一网络设备的统计信息以及所述其他网络设备的统计信息,计算所述网络中每个网络设备上所述目标KPI的KPI变化率;所述第一网络设备根据所述网络中每个网络设备上所述目标KPI的KPI变化率,从所述第一网络设备和所述其他网络设备中选取发生故障的网络设备,其中所述发生故障的网络设备的所述目标KPI的KPI变化率大于或等于预设KPI变化率阈值。6.根据权利要求1至4中任一项所述的方法,其特征在于,所述第一网络设备根据所述第一网络设备的统计信息以及其他网络设备的统计信息,确定所述网络中的发生故障的网络设备,包括:所述第一网络设备确定目标KPI;所述第一网络设备根据所述第一网络设备的统计信息以及所述其他网络设备的统计信息,获取所述网络中任意两个网络设备之间传输的所述目标KPI对应内部网关协议的报文的统计结果;根据所述任意两个网络设备之间传输的所述目标KPI对应内部网关协议的报文的统计结果,生成邻接矩阵;根据所述邻接矩阵,确定所述网络中的每个网络设备的中心度;根据所述每个网络设备的中心度,确定所述网络中的发生故障的网络设备。7.根据权利要求1至6中任一项所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:薛莉谢于明张亮吴俊丁律
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1