一种故障检测方法和设备技术

技术编号:15624274 阅读:206 留言:0更新日期:2017-06-14 05:54
本发明专利技术实施例涉及通信技术领域,尤其涉及一种故障检测方法和设备,用以减轻网络负荷,降低网络开销。本发明专利技术实施例中,确定第一设备与第二设备对应的所有用户设备之间未建立业务连接,确定第一设备发送故障检测报文的频率,在确定第一设备发送故障检测报文的频率不小于第一阈值时,调整第一设备发送故障检测报文的频率,以使调整后的第一设备发送故障检测报文的频率小于第一阈值;和/或所述确定所述第二设备发送故障检测报文的频率;在确定所述第二设备发送故障检测报文的频率不小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率小于第二阈值。

【技术实现步骤摘要】
一种故障检测方法和设备
本专利技术实施例涉及通信领域,尤其涉及一种故障检测方法和设备。
技术介绍
在通信领域中,为保障网络设备之间的数据传输质量,需对网络设备之间的通信故障进行快速检测,以在出现故障时及时建立新的通信链路,或切换到其它通信链路上去。目前,双向故障检测(BidirectionalForwardingDetection,简称BFD)方法,是一种应用最广泛的网络故障检测技术。BFD的特点是:轻负荷、持续时间短,且能对任何类型的通信链路进行快速,如直接的物理链路、虚拟电路、多跳路由通道等。在BFD会话建立后,BFD会话双方在会话通道上,周期性地向对端发送BFD报文;同时,在该会话通道上,也周期性地检测对端发送的BFD报文。如果在检测时间内,没有收到对端发送的BFD报文,则确定BFD会话双方之间的通信链路出现了故障。图1示出了现有技术中一种典型的数据中心组网的架构示意图。如图1所示,数据中心组网中包括多个用于转发数据的虚拟机(VirtualMachine,简称VM),多个虚拟机连接二层设备,多个二层设备连接多个三层设备,二层设备可为路由器,三层设备可为交换机,也就是说多个虚拟机通过交换机连接一个路由器,多个路由器也可通过交换机连接多个虚拟机。现有技术中,为了保证数据传输的可靠性,需要在各个设备之间发送用于检测链路是否发生故障的探测报文,比如在虚拟机和路由器之间发送BFD报文,通过探测报文检测到链路或设备发生故障之后,可以触发链路或者设备更换,从而保证数据传输的可靠性,减少数据传输中断时间。现有技术中,各个设备之间通常周期性发送BFD报文,周期为毫秒级,比如10ms,此时,一个虚拟机在1秒内需发送100个BFD报文。进一步由于多个VM通过交换机连接一个路由器,此时,路由器在1秒内需要处理的BFD则会达到10kpps级别,远远超出普通的路由器的能力,普通的路由器通过CPU处理数据时,通常仅能达到1kpps级别。可见,设备周期性发送BFD报文会加大网络负荷,增加网络开销。
技术实现思路
本专利技术实施例提供一种故障检测方法和设备,用以减轻网络负荷,降低网络开销。本专利技术实施例提供一种故障检测方法,包括:确定第一设备与第二设备对应的所有用户设备之间未建立业务连接;其中所述第二设备对应的用户设备的业务数据通过第二设备和第一设备进行传输;在确定所述第一设备发送故障检测报文的频率不小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率小于第一阈值;和/或在确定所述第二设备发送故障检测报文的频率不小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率小于第二阈值。由于在确定第一设备与第二设备对应的所有用户设备之间未建立业务连接时,第二设备对应的用户设备不会向第一设备发送业务数据,因此,此时无需以高频率发送故障检测报文,此时在确定第一设备发送故障检测报文的频率不小于第一阈值时,调整第一设备发送故障检测报文的频率,以使调整后的第一设备发送故障检测报文的频率小于第一阈值,和/或在确定第二设备发送故障检测报文的频率不小于第二阈值时,调整第二设备发送故障检测报文的频率,以使调整后的第二设备发送故障检测报文的频率小于第二阈值,即降低了故障检测报文的发送频率,从而减轻网络负荷,降低网络开销,节省了网络资源。第二设备对应的用户设备与第一设备和第二设备的连接方法有多种,比如用户设备通过其它设备与第二设备连接,第二设备通过其它设备与第一设备连接,或者用户设备直接与第二设备连接,第二设备直接与第一设备连接。无论第二设备对应的用户设备如何与第一设备和第二设备的连接,用户设备的业务数据均需要经过第一设备和第二设备进行传输。用户设备与第一设备之间建立业务连接具体是指用户设备通过第二设备以及第一设备传输请求与另一个用户设备建立业务连接的请求,在业务连接成功建立之后,用户设备与第二设备、用户设备与第一设备、以及用户设备与另一个用户设备之间均成功建立业务连接,可通过该建立成功的业务连接链路进行通信,即传输业务数据。本专利技术实施例中,确定第一设备发送故障检测报文的频率,具体有多种方式,比如通过获取用于确定第一设备发送故障检测报文的频率的定时器的参数,将该定时器的时间参数进行更改,以便达到调整第一设备发送故障检测报文的频率的目的。可选地,还包括:在确定所述第二设备对应的至少一个用户设备与所述第一设备之间建立业务连接时,确定出所述第一设备在预设时长内接收到的所述第二设备发送的业务数据的数量;在确定出所述业务数据的数量为零时,确定所述第一设备发送故障检测报文的频率,在确定所述第一设备发送故障检测报文的频率小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率不小于第一阈值;和/或在确定出所述业务数据的数量为零时,确定所述第二设备发送故障检测报文的频率,在确定所述第二设备发送故障检测报文的频率小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率不小于第二阈值。由于在确定第二设备对应的至少一个用户设备与第一设备之间建立业务连接,因此,用户设备一定会通过第二设备和第一设备进行业务数据传输,如果在预设时长内接收到的第二设备发送的业务数据的数量为零,则说明在预设时长内第二设备未向第一设备传输用户设备所对应的业务数据,此时判定第二设备可能出现故障,因此,可将故障检测报文的频率提高。如此,则在设备或链路出现故障时,提高故障检测速率,进而减少了在设备或链路出现故障时数据传输的中断时间。进一步,当第二设备故障时,第二设备上的业务数据传输中断,此时在某个接口上发现第二设备上传输的业务数据中断后,立即提高故障检测报文的发送频率,第一设备通过该接口发送故障检测报文。由于多数情况下都是单个设备发生故障,因此个别设备提高故障检测报文的发送频率,也不会为网络带了较大的负荷,且也提高了故障检测速度。可选地,所述在确定所述第二设备对应的至少一个用户设备与所述第一设备之间建立业务连接时,确定出所述第一设备在预设时长内接收到的所述第二设备发送的业务数据的数量之后,还包括:在确定出所述业务数据的数量不为零时,且所述第一设备在向所述第二设备发送故障检测报文时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备停止向所述第二设备发送故障检测报文;和/或在确定出所述业务数据的数量不为零时,且所述第二设备在向所述第一设备发送故障检测报文时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备停止向所述第一设备发送故障检测报文。由于在确定第二设备对应的至少一个用户设备与第一设备之间建立业务连接,因此,用户设备一定会通过第二设备和第一设备进行业务数据传输,如果在预设时长内接收到的第二设备发送的业务数据的数量为不为零,则说明第一设备和第二设备之间的链路及设备均正常,此时可停止发送故障检测报文,以便减轻网络负荷,降低网络开销,节省了网络资源。可选地,所述在确定所述第二设备对应的至少一个用户设备与所述第一设备之间建立业务连接时,确定出所述第一设备在预设时长内接收到的所述第本文档来自技高网
...
一种故障检测方法和设备

【技术保护点】
一种故障检测方法,其特征在于,包括:确定第一设备与第二设备对应的所有用户设备之间未建立业务连接;其中所述第二设备对应的用户设备的业务数据通过第二设备和第一设备进行传输;在确定所述第一设备发送故障检测报文的频率不小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率小于第一阈值;和/或在确定所述第二设备发送故障检测报文的频率不小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率小于第二阈值。

【技术特征摘要】
1.一种故障检测方法,其特征在于,包括:确定第一设备与第二设备对应的所有用户设备之间未建立业务连接;其中所述第二设备对应的用户设备的业务数据通过第二设备和第一设备进行传输;在确定所述第一设备发送故障检测报文的频率不小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率小于第一阈值;和/或在确定所述第二设备发送故障检测报文的频率不小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率小于第二阈值。2.如权利要求1所述的方法,其特征在于,还包括:在确定所述第二设备对应的至少一个用户设备与所述第一设备之间建立业务连接时,确定出所述第一设备在预设时长内接收到的所述第二设备发送的业务数据的数量;在确定出所述业务数据的数量为零时,确定所述第一设备发送故障检测报文的频率,在确定所述第一设备发送故障检测报文的频率小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率不小于第一阈值;和/或在确定出所述业务数据的数量为零时,确定所述第二设备发送故障检测报文的频率,在确定所述第二设备发送故障检测报文的频率小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率不小于第二阈值。3.如权利要求2所述的方法,其特征在于,所述在确定所述第二设备对应的至少一个用户设备与所述第一设备之间建立业务连接时,确定出所述第一设备在预设时长内接收到的所述第二设备发送的业务数据的数量之后,还包括:在确定出所述业务数据的数量不为零时,且所述第一设备在向所述第二设备发送故障检测报文时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备停止向所述第二设备发送故障检测报文;和/或在确定出所述业务数据的数量不为零时,且所述第二设备在向所述第一设备发送故障检测报文时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备停止向所述第一设备发送故障检测报文。4.如权利要求2所述的方法,其特征在于,所述在确定所述第二设备对应的至少一个用户设备与所述第一设备之间建立业务连接时,确定出所述第一设备在预设时长内接收到的所述第二设备发送的业务数据的数量之后,还包括:在确定出所述业务数据的数量不为零时,确定所述第一设备发送故障检测报文的频率;在确定所述第一设备发送故障检测报文的频率不小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率小于第一阈值;和/或在确定出所述业务数据的数量不为零时,确定所述第二设备发送故障检测报文的频率;在确定所述第二设备发送故障检测报文的频率不小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率小于第二阈值。5.如权利要求4所述的方法,其特征在于,所述在确定所述第一设备发送故障检测报文的频率不小于第一阈值时,调整所述第一设备发送故障检测报文的频率,具体包括:在确定所述第一设备发送故障检测报文的频率不小于第一阈值时,根据所述所述业务数据的数量调整所述第一设备发送故障检测报文的频率;其中,所述业务数据的数量越小,调整后所述第一设备发送故障检测报文的频率越大;所述在确定所述第一设备发送故障检测报文的频率不小于第一阈值时,调整所述第二设备发送故障检测报文的频率,具体包括:在确定所述第二设备发送故障检测报文的频率不小于第二阈值时,根据所述所述业务数据的数量调整所述第二设备发送故障检测报文的频率;其中,所述业务数据的数量越小,调整后所述第二设备发送故障检测报文的频率越大。6.一种故障检测设备,其特征在于,包括:确定单元,用于确定第一设备与第二设备对应的所有用户设备之间未建立业务连接;其中所述第二设备对应的用户设备的业务数据通过第二设备和第一设备进行传输;处理单元,用于在通过确定单元确定所述第一设备发送故障检测报文的频率不小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率小于第一阈值;和/或在通过确定单元确定所述第二设备发送故障检测报文的频率不小于第二阈值时,调整所述第二设备发送故障检测报文的频率,以使调整后的所述第二设备发送故障检测报文的频率小于第二阈值。7.如权利要求6所述的设备,其特征在于,所述确定单元,还用于:在确定所述第二设备对应的至少一个用户设备与所述第一设备之间建立业务连接时,确定出所述第一设备在预设时长内接收到的所述第二设备发送的业务数据的数量;所述处理单元,还用于:在通过所述确定单元确定出所述业务数据的数量为零时,确定所述第一设备发送故障检测报文的频率,在确定所述第一设备发送故障检测报文的频率小于第一阈值时,调整所述第一设备发送故障检测报文的频率,以使调整后的所述第一设备发送故障检测报文的频率不小于第一阈值;和/或在通过所述确定单元确定出所述业务数据的数量为零时,确定所述第二设备发送故障检测报文的频率,在确定所述第二设备发送故障检测报文的频率小于第二阈值时,调整所述第二...

【专利技术属性】
技术研发人员:张驰张晋
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1