网络的故障定界方法、装置以及计算机存储介质制造方法及图纸

技术编号:21065218 阅读:47 留言:0更新日期:2019-05-08 09:51
本申请提供一种网络的故障定界方法、装置以及计算机存储介质,所述方法包括:控制设备向用于进行故障定界的服务器发送故障检测指示消息,该故障指示消息用于指示服务器使用待追踪的故障IP对发送追踪报文,控制设备接收网络中的各交换机发送的追踪报文的个数,追踪报文的个数是交换机根据报文匹配策略得到的,其中,各交换机上的报文匹配策略相同,控制设备根据各交换机发送的追踪报文的个数,确定发生故障的交换机。该方法中,由于各交换机上的报文匹配策略相同,并且交换机的报文匹配策略不受组网影响,从而使得交换机的配置量大大减少,且该方法根据追踪报文的个数进行故障定界,实现简单,定界快速准确。

【技术实现步骤摘要】
网络的故障定界方法、装置以及计算机存储介质
本申请涉及通信技术,尤其涉及一种网络的故障定界方法、装置以及计算机存储介质。
技术介绍
服务器之间的业务交互需要经过多台交换设备,网络中的任意一台交换设备发生硬件和/或软件故障都会导致业务报文丢失,因此,当网络发生故障时,需要快速进行网络的故障定界,即快速找到发生故障的交换设备。随着网络规模和复杂度的增加,网络的故障定界的难度也逐渐增大。以CLOS(克劳斯)网络为例,CLOS网络采用多级交换架构,CLOS网络中存在多条等价路由(EqualCostMulti-Path,ECMP),从而能够做到无阻塞。交换设备在转发报文时,可以根据报文的五元组的哈希值选择转发路径,一般情况下,同一条流上的报文的转发路径是固定的,不同的流上的报文会路由到不同的路径中。当发生网络故障时,虽然用于固定定界的设备检测到故障的网际协议(IntentProtocol,IP)对,但是由于存在的转发路径较多,采用传统的因特网包探索器(PacketInternetGroper,ping)和路由跟踪(transroute)方法无法完成网络的故障定界,因此现有技术中,经常采用网络质本文档来自技高网...

【技术保护点】
1.一种网络的故障定界方法,其特征在于,包括:控制设备向用于进行故障定界的服务器发送故障检测指示消息,所述故障检测指示消息用于指示所述服务器使用待追踪的故障网际协议IP对发送追踪报文;所述控制设备接收网络中的各交换机发送的追踪报文的个数,所述追踪报文的个数是所述交换机根据报文匹配策略匹配得到的,所述报文匹配策略用于指示交换机对所述服务器发送的追踪报文进行匹配和计数,其中,所述各交换机上的报文匹配策略相同;所述控制设备根据所述各交换机发送的追踪报文的个数,确定发生故障的交换机。

【技术特征摘要】
1.一种网络的故障定界方法,其特征在于,包括:控制设备向用于进行故障定界的服务器发送故障检测指示消息,所述故障检测指示消息用于指示所述服务器使用待追踪的故障网际协议IP对发送追踪报文;所述控制设备接收网络中的各交换机发送的追踪报文的个数,所述追踪报文的个数是所述交换机根据报文匹配策略匹配得到的,所述报文匹配策略用于指示交换机对所述服务器发送的追踪报文进行匹配和计数,其中,所述各交换机上的报文匹配策略相同;所述控制设备根据所述各交换机发送的追踪报文的个数,确定发生故障的交换机。2.根据权利要求1所述的方法,其特征在于,所述控制设备接收网络中的各交换机发送的追踪报文的个数之前,还包括:所述控制设备向所述各交换机发送使能指示消息,所述使能指示消息用于指示交换机使能所述报文匹配策略。3.根据权利要求2所述的方法,其特征在于,在确定发生故障的交换机之后,还包括:所述控制设备向所述各交换机发送去使能指示消息,所述去使能指示消息用于指示交换机对所述报文匹配策略去使能。4.根据权利要求1-3任一项所述的方法,其特征在于,所述控制设备向用于进行故障定界的服务器发送故障检测指示消息之前,还包括:所述控制设备接收至少一个服务器发送的故障告警消息,所述故障告警消息中包括服务器检测到的故障IP对;所述控制设备根据接收到的故障IP对,从所述至少一个服务器中确定用于进行故障检测的服务器以及所述待追踪的故障IP对。5.根据权利要求1-4任一项所述的方法,其特征在于,所述控制设备向用于进行故障定界的服务器发送故障检测指示消息之前,还包括:所述控制设备为所述各交换机配置所述报文匹配策略。6.一种网络故障的定界方法,其特征在于,包括:服务器向网络中其他服务器发送探测报文;当所述服务器根据所述探测报文检测到故障网际协议IP对时,所述服务器向控制设备发送故障告警消息,所述故障告警消息中包括所述服务器检测到的故障IP对;所述服务器接收所述控制设备发送的故障检测指示消息,所述故障检测指示消息用于指示所述服务器使用待追踪的故障IP对发送追踪报文;所述服务器向交换机发送N个追踪报文,所述追踪报文的IP对为所述待追踪的故障IP对,N为大于1的整数。7.一种网络故障的定界方法,其特征在于,包括:交换机接收服务器或其他交换机发送的报文;所述交换机根据预先配置的报文匹配策略,对接收到的报文进行匹配,当匹配到追踪报文时,将追踪报文的个数加1,所述报文匹配策略用于指示交换机对服务器发送的追踪报文进行匹配和计数;在满足上报条件时,所述交换机向控制设备发送匹配到的追踪报文的个数。8.根据权利要求7所述的方法,其特征在于,所述交换机根据报文匹配策略,对接收到的报文进行匹配之前,还包括:所述交换机接收控制设备发送的使能指示消息,所述使能指示消息用于指示使能所述报文匹配策略;所述交换机根据所述使能指示消息使能所述报文匹配策略。9.根据权利要求8所述的方法,其特征在于,所述交换机向所述控制设备发送追踪报文的个数之后,还包括:所述交换机接收所述控制设备发送的去使能指示消息,所述去使能指示消息用于指示对所述报文匹配策略去使能;所述交换机根据所述去使能指示消息对所述报文匹配策略去使能。10.根据权利要求7所述的方法,其特征在于,所述交换机根据报文匹配策略,对接收到的报文进行匹配之前还包括:所述交换机接收所述控制设备发送的配置消息,所述配置消息用于配置所述报文匹配策略。11.根据权利要求1-10任一项所述的方法,其特征在于,所述报文匹配策略为服务质量QoS策略;所述QoS策略包括:一个高级访问控制列表ACL、流类型和流动作,所述流类型和所述流动作关联;其中,所述高级ACL的匹配选项包括以下信息中的至少一个:追踪报文的源端口、目的端口和差分服务器代码点DSCP;所述流类型为对接收到的报文匹配所述高级ACL;所述流动作为统计匹配到的追踪报文的个数。12.根据权利要求1-10任一项所述的方法,其特征在于,所述追踪报文的源端口、目的端口和差分服务器代码点DSCP中的至少一个与网络中的其他报文不同。13.一种控制设备,其特征在于,包括:发送模块,用于向用于进行故障定界的服务器发送故障检测指示消息,所述故障检测指示消息用于指示所述服务器使用待追踪的故障网际协议IP对发送追踪报文;接收模块,用于接收网络中的各交...

【专利技术属性】
技术研发人员:徐俊杰袁舟王建
申请(专利权)人:杭州华为数字技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1