一种故障处理方法、装置和存储介质制造方法及图纸

技术编号:27805316 阅读:13 留言:0更新日期:2021-03-30 09:15
本申请提供了一种故障处理方法、装置及存储介质。在一种故障处理方法中,第一网络设备和第二网络设备为运行有双向收发检测BFD的网络设备,当第一网络设备有多个接口板之间对BFD报文进行负载分担转发,且运行有BFD状态机的接口板故障时,第一网络设备的主控板或接口板能够及时发现第一接口板故障,并发送第一报文通知第二网络设备第一网络设备BFD管理宕。通过这种方法,可以减少因为接口板故障出现的业务丢包的情况。业务丢包的情况。业务丢包的情况。

【技术实现步骤摘要】
一种故障处理方法、装置和存储介质


[0001]本申请涉及通信领域,尤其涉及一种故障处理方法、装置和存储介质。

技术介绍

[0002]双向转发检测(bidirectional forwarding detection,BFD)提供一种轻负载、快速检测两台网络设备之间转发路径连通状态的方法。BFD是一个简单的“Hello”协议,一对设备在它们之间的通道上周期性的发送BFD控制报文,如果某个设备在协商好的会话宕(down)确认时间内没有接收到对端设备发送的BFD控制报文,则认为到对端系统的通道出了故障。
[0003]通常,为了减少网络设备的负担,会将BFD状态机运行在接口板上,主控板负责BFD的协商和故障通知,多个接口板负责BFD探测报文的接收和发送。此种方案,存在当运行BFD状态机的接口板故障,导致BFD故障误报,导致上层业务如边界网关协议(Border Gateway Protocol,BGP)或开放式最短路优先协议(open shortest path fist,OSPF)收敛,出现路由震荡和业务丢包的情况。

技术实现思路

[0004]本申请提供了一种故障处理方法、装置和存储介质,用于解决运行BFD状态机的接口板故障,导致BFD故障误报,进而导致上层业务如BGP或OSPF收敛的问题。
[0005]第一方面,提供了一种故障处理方法,所述方法应用于第一网络设备,所述第一网络设备可以是互联网协议(Internet Protocol,IP)网络设备,如:路由器、交换机等,也可以是运行在通用服务器上的具有IP转发功能的虚拟网络设备,还可以是分组传送网(packet transport network,PTN)设备、接入传输(access transport network,ATN)设备,本申请不做具体限定。该方法包括:第一网络设备确定第一接口板故障,所述第一接口板为运行有BFD状态机的接口板,所述第一网络设备包括主控板、所述第一接口板和第二接口板;响应于确定第一接口板故障,所述第一网络设备生成第一报文,所述第一报文用于向第二网络设备通告所述第一网络设备BFD管理宕;所述第一网络设备通过所述第二接口板向所述第二网络设备发送所述第一报文。
[0006]通过以上第一方面提供的故障处理方法,当第一网络设备运行有BFD状态机的故障之后,通过第一网络设备主动向第二网络设备发送一个管理宕的报文,避免了由于BFD故障误报而导致第一网络设备和第二网络设备的上层业务如BGP或OSPF进行业务收敛的问题。
[0007]在一种可能的方式中,所述第一网络设备有到达所述第二网络设备的多条路由,所述多条路由的出接口包括所述第一接口板的出接口和所述第二接口板的出接口。
[0008]通过多条路由负载分担的方式,可以减小第一网络设备收发BFD报文的压力。在多条路由负载分担的情况下,即使运行有BFD状态机的接口板故障,也不会影响第一网络设备和第二网络设备之间的通信。此时如果不做特殊处理,则可能导致两台设备BFD会话宕,从
而导致上层业务收敛。通过上述可选方式,通过第一网络设备向第二网络设备通告BFD管理宕的方式,则避免了上层业务收敛的情况。
[0009]在一种可能的方式中,所述第一网络设备确定所述第一接口板故障,包括:所述主控板确定所述第一接口板故障;或所述第二接口板确定所述第一接口板故障。
[0010]通过主控板或第二接口板确定第一接口板故障的方式,可以及时发现运行有BFD状态机的接口板故障,避免故障误报,导致BFD会话宕,从而导致上层业务收敛。
[0011]在一种可能的方式中,所述第一网络设备生成第一报文,包括:当所述确定第一接口板故障为所述主控板确定所述第一接口板故障时,所述主控板生成所述第一报文;或当所述确定第一接口板故障为所述第二接口板确定第一接口板故障时,所述第二接口板生成所述第一报文。
[0012]通过第二接口板直接生成第一报文的方式,可以减少故障处理的复杂度以及减少处理的时间。
[0013]在一种可能的方式中,在所述第二接口板确定所述第一接口板故障之后,所述方法还包括:所述第二接口板向所述主控板发送消息,所述消息指示第一BFD管理宕。
[0014]通过第二接口板向主控板发送消息的方式,知会主控板第一接口板故障,可以在较短的时间内让主控板针对BFD管理宕进行处理,减少故障处理时间。
[0015]在一种可能的方式中,所述第二接口板生成所述第一报文,包括:在所述第二接口板确定所述第一接口板故障之前,所述第一网络设备接收所述第二网络设备发送的第二报文;所述第一报文的源地址为所述第二报文的目的地址,所述第一报文的目的地址为所述第二报文的源地址,所述第一报文的状态字为管理宕。
[0016]通过第二接口板直接根据第二报文生成第一报文的方式,可以减少故障处理的复杂度以及减少处理的时间。
[0017]在一种可能的方式中,所述第二接口板确定所述第一接口板故障,包括:所述第二接口板在时间间隔内未收到所述第一接口板发送的探测报文,所述第二接口板确定所述第一接口板故障;所述时间间隔小于第一网络设备和第二网络设备的BFD会话宕确认时间。
[0018]通过在多个接口板之间互相发送探测报文,可以及时的发现接口板故障,减少故障处理时间。
[0019]在一种可能的方式中,所述第二接口板向所述主控板发送消息,包括:所述第二接口板根据所述第二报文生成所述消息,所述消息指示所述主控板修改所述第一网络设备的BFD状态;所述第二接口板向所述主控板发送所述消息。
[0020]通过第二接口板根据第二报文生成消息,并向主控板发送该消息的方式,知会主控板第一接口板故障,可以在较短的时间内让主控板针对BFD管理宕进行处理,减少故障处理时间。
[0021]在一种可能的方式中,在所述第一网络设备确定所述第一接口板故障之后,所述第一网络设备修改BFD状态为管理宕或者宕。
[0022]通过修改BFD状态,可以使得第一网络设备尽快启动与第二网络设备的新的BFD会话协商,尽快恢复第一网络设备与第二网络设备互相发送BFD报文,减少故障处理时间,减少对上层业务的影响。
[0023]第二方面,提供了一种第一网络设备,所述第一网络设备具有实现上述第一方面
或第一方面任一种可选方式的故障处理方法的功能。所述第一网络设备可以是IP网络设备,如:路由器设备、交换机设备,也可以是运行在通用服务器上的具有IP转发功能的虚拟网络设备,还可以是PTN设备、ATN设备,本申请不做具体限定。所述第一网络设备包括:主控板、第一接口板、第二接口板、处理器和网络接口,所述处理器位于所述第二接口板或所述主控板,所述处理器可以是一个或多个处理器,所述网络接口位于所述第二接口板。所述处理器,用于确定第一接口板故障,所述第一接口板为运行有BFD状态机的接口板;响应于确定第一接口板故障,所述处理器还用于生成第一报文,所述第一报文用于向第二网络设备通告所述BFD管理宕;所述网络接口,用于向所述第二网络本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障处理方法,其特征在于,包括:第一网络设备确定第一接口板故障,所述第一接口板为运行有双向转发检测BFD状态机的接口板,所述第一网络设备包括主控板、所述第一接口板和第二接口板;响应于确定第一接口板故障,所述第一网络设备生成第一报文,所述第一报文用于向第二网络设备通告所述第一网络设备BFD管理宕;所述第一网络设备通过所述第二接口板向所述第二网络设备发送所述第一报文。2.根据权利要求1所述的方法,其特征在于,所述第一网络设备有到达所述第二网络设备的多条路由,所述多条路由的出接口包括所述第一接口板的出接口和所述第二接口板的出接口。3.根据权利要求1或2所述的方法,其特征在于,所述第一网络设备确定所述第一接口板故障,包括:所述主控板确定所述第一接口板故障;或所述第二接口板确定所述第一接口板故障。4.根据权利要求1-3任一项所述的方法,其特征在于,所述第一网络设备生成第一报文,包括:当所述确定第一接口板故障为所述主控板确定所述第一接口板故障时,所述主控板生成所述第一报文;或当所述确定第一接口板故障为所述第二接口板确定第一接口板故障时,所述第二接口板生成所述第一报文。5.根据权利要求3或4所述的方法,其特征在于,在所述第二接口板确定所述第一接口板故障之后,所述方法还包括:所述第二接口板向所述主控板发送消息,所述消息指示BFD管理宕。6.根据权利要求4或5所述的方法,其特征在于,所述第二接口板生成所述第一报文,包括:在所述第二接口板确定所述第一接口板故障之前,所述第一网络设备接收所述第二网络设备发送的第二报文;所述第一报文的源地址为所述第二报文的目的地址,所述第一报文的目的地址为所述第二报文的源地址,所述第一报文的状态字为管理宕。7.根据权利要求3-6任一项所述的方法,其特征在于,所述第二接口板确定所述第一接口板故障,包括:所述第二接口板在时间间隔内未收到所述第一接口板发送的探测报文,所述第二接口板确定所述第一接口板故障;所述时间间隔小于第一网络设备和第二网络设备的BFD会话宕确认时间。8.根据权利要求6所述的方法,其特征在于,所述第二接口板向所述主控板发送消息,包括:所述第二接口板根据所述第二报文生成所述消息,所述消息指示所述主控板修改所述第一网络设备的BFD状态;所述第二接口板向所述主控板发送所述消息。9.根据权利要求1-8任一项所述的方法,其特征在于,所述方法还包括:
在所述第一网络设备确定所述第一接口板故障之后,所述第一网络设备修改所述...

【专利技术属性】
技术研发人员:刘家兵孟浩金宝李红许柯
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1