一种BFD检测方法与装置制造方法及图纸

技术编号:14445007 阅读:71 留言:0更新日期:2017-01-15 10:26
本发明专利技术实施例提供了一种BFD检测方法、装置与系统。第一虚拟机接收第二虚拟机的BFD检测报文时,获取预测时长和预定数量个样本时间间隔;根据预测时长以及预定数量个样本时间间隔得到特征值;特征值用来表示第二虚拟机中应用出现故障的可能性;针对第二虚拟机中正在运行的一个应用,将特征值与该应用的预设故障判定标准进行对照,并根据对照结果判定该应用是否发生故障。本发明专利技术通过将特征值与不同应用的预设故障判定标准进行比较,进而进行故障判定和处理,以使得BFD检测能够适应不同类型应用/业务的要求,而不再对所有的应用/业务采用统一的故障判定标准,减少由此带来的故障误判。

【技术实现步骤摘要】

本专利技术涉及通信
,尤其涉及一种BFD检测方法与装置
技术介绍
在当前的虚拟化云环境中,故障检测通常采用虚拟机(可以等同于一个通信节点)间的心跳机制,这种心跳机制的基本原理下:以节点q监测节点p为例,节点p以固定的时间间隔Δi发送心跳报文给节点q,节点q则以固定的时间间隔Δt接收心跳报文,如果在规定的时间内(如三个Δi)没有接收到节点p发来的心跳报文,则判定节点p发生了故障;例如连续丢几个包,即若干个时间间隔节点q没有收到节点p的响应,则认为节点p故障。这种心跳检测的时间通常都在秒级甚至分钟级,无法满足对实时性要求较高的电信业务的可靠性要求。尤其当数据速率到吉比特时,故障反馈时间长代表着大量数据的丢失。相邻节点间快速监测通信故障的需求日益增多,而且也显得越来越重要。于是就产生了一种在双向路由引擎之间建立一条路径的快速检测方法-双向转发检测机制BFD(BidirectionalForwardingDetection)。BFD通过与上层路由协议联动,可以实现路由的快速收敛,可以实现链路的快速检测,提供毫秒级的检测。BFD检测重点在于确定BFD的检测时间,在BFD的检测时间主要取决于下面三个参数:本端节点想要采用的最短BFD检测报文发送周期DMTI(DesiredMinTxInterval);本端节点能够支持的最短BFD检测报文接收周期RMRI(RequiredMinRxInterval);检测时间的倍数DetectMult(Detecttimemultiplier)。首先,一个节点B接收到对端节点A发来的BFD检测报文后,将该检测报文携带的A端节点的RMRI与B端本地的DMTI进行比较,取二者中的较大值作为B端节点发送BFD检测报文的速率。BFD包含异步模式和查询模式,两种检测方式不同,因此检测时间也不同,一般通过使用不同的DetectMult值来实现。异步模式的检测时间=接收到的远端DetectMulti*max(本地的RMRI,接收到的DMTI);查询模式的检测时间=本地的DetectMulti*max(本地的RMRI,接收到的DMTI);DMTI、RMRI、DetectMulti在各个节点都是可以独立配置的,然而,DMTI、RMRI、Detect一旦配置完毕后,一个节点就会以固定的时间间隔接收另一个节点的BFD检测报文,如果在规定的时间内没有收到对方的检测报文则判定对方的应用/业务出现故障。这在实际应用中存在一个问题,采用统一的固定检测时间间隔,无法针对不同应用类型的电信业务要求做出较为准确的故障判定。对所有应用采用单一的判定方式,使得不同应用的故障判定结果有失偏颇。例如,不同的应用对中断时间和检测速度的要求不同,如语音数据流要求中断时间不能超过200ms、信令要求不能超过500ms,但数据业务的实时性要求没有语音那么高,但统一设定一个检测时间间隔如300ms,将无法适用于不同的应用类型;并且可能引起相应的误判。如允许中断时间为200ms的语音应用,可能出现了故障,中断时间为250ms,却因为小于BFD的检测时间间隔300ms而没有被报错;再如允许中断时间为500ms的信令应用,可能还没有出现故障,中断时间为400ms,却因为大于BFD的检测时间间隔300ms而被误认为发生了故障。
技术实现思路
有鉴于此,本专利技术实施例提供了一种BFD检测方法、装置和系统。根据本专利技术实施例的第一方面,提供了一种双向转发检测机制BFD检测方法,该方法应用于第一虚拟机接收BFD检测报文的过程中,BFD检测报文来自第二虚拟机,该方法包括:获取预测时长和预定数量个样本时间间隔;其中,上述预测时长为当前时刻距离上述第一虚拟机最近一次接收到BFD检测报文的时间间隔,上述样本时间间隔为相邻两个BFD检测报文的到达时间间隔;根据上述预测时长以及上述预定数量个样本时间间隔得到特征值;其中,上述特征值用来表示第二虚拟机中应用出现故障的可能性;针对上述第二虚拟机中正在运行的一个应用,将上述特征值与上述一个应用的预设故障判定标准进行对照,并根据对照结果判定上述一个应用是否发生故障。结合第一方面,在第一方面的第一种可能的实现方式中,上述根据上述预测时长以及上述预定数量个样本时间间隔得到特征值包括:根据上述预定数量个样本时间间隔得到上述样本时间间隔的均值和方差;根据上述样本时间间隔的均值和方差得到分布函数;将上述预测时长代入上述分布函数计算函数值;根据上述函数值得到上述特征值。结合第一方面,或者结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,上述根据上述函数值得到特征值包括:对上述函数值取负对数,得到上述特征值。结合第一方面,或者结合第一方面的上述任何一种可能的实现方式,在第一方面的第三种可能的实现方式中,上述一个应用的预设故障判定标准包括一个非故障取值区间和一个故障取值区间;上述将上述特征值与上述一个应用的预设故障判定标准进行对照,并根据对照结果判定上述一个应用是否发生故障包括:判断上述特征值落在上述非故障取值区间和上述故障取值区间中的哪一个;若对照结果为上述特征值落在上述故障取值区间,判定上述一个应用发生故障;若对照结果为上述特征值落在上述非故障取值区间,判定上述一个应用未发生故障。结合第一方面,或者结合第一方面的上述任何一种可能的实现方式,在第一方面的第四种可能的实现方式中,在判定上述一个应用发生故障之后,上述方法还包括:对上述一个应用执行故障处理。结合第一方面,或者结合第一方面的上述任何一种可能的实现方式,在第一方面的第五种可能的实现方式中,上述一个应用的预设故障判定标准包括一个非故障取值区间和至少两个故障取值区间,每一个故障取值区间对应着一个不同的故障等级;上述将上述特征值与上述一个应用的预设故障判定标准进行对照,并根据对照结果判定上述一个应用是否发生故障包括:判断上述特征值落在上述非故障取值区间和上述至少两个故障取值区间中的哪一个;若对照结果为上述特征值落在一个故障取值区间,判定上述一个应用发生的故障等级为上述一个故障取值区间对应的故障等级;其中,上述一个故障取值区间为上述至少两个故障取值区间中的一个;若对照结果为上述特征值落在上述非故障取值区间,判定上述一个应用未发生故障。结合第一方面,或者结合第一方面的上述任何一种可能的实现方式,在第一方面的第六种可能的实现方式中,每一个故障取值区间对应着一个不同的故障处理方式;在判定上述一个应用发生的故障等级为上述一个故障取值区间对应的故障等级之后,上述方法还包括:对上述一个应用执行上述一个故障取值区间对应的故障处理。结合第一方面,或者结合第一方面的上述任何一种可能的实现方式,在第一方面的第七种可能的实现方式中,上述预定数量为M,上述M个样本时间间隔为从连续的M+1个BFD检测报文中获取到的,其中M为大于20的整数。根据本专利技术实施例的第二方面,提供了一种双向转发检测机制BFD检测装置,该装置应用于第一虚拟机接收BFD检测报文的过程中,这些BFD检测报文来自第二虚拟机;该装置包括:获取模块,用于获取预测时长和预定数量个样本时间间隔;其中,上述预测时长为当前时刻距离上述第一虚拟机最近一次接收到BFD检测报文本文档来自技高网
...
一种BFD检测方法与装置

【技术保护点】
一种双向转发检测机制BFD检测方法,所述方法应用于第一虚拟机接收BFD检测报文的过程中,所述BFD检测报文来自第二虚拟机;其特征在于,所述方法包括:获取预测时长和预定数量个样本时间间隔;其中,所述预测时长为当前时刻距离所述第一虚拟机最近一次接收到BFD检测报文的时间间隔,所述样本时间间隔为相邻两个BFD检测报文的到达时间间隔;根据所述预测时长以及所述预定数量个样本时间间隔得到特征值;其中,所述特征值用来表示所述第二虚拟机中正在运行的应用出现故障的可能性;针对所述第二虚拟机中正在运行的一个应用,将所述特征值与所述一个应用的预设故障判定标准进行对照,并根据对照结果判定所述一个应用是否发生故障。

【技术特征摘要】
1.一种双向转发检测机制BFD检测方法,所述方法应用于第一虚拟机接收BFD检测报文的过程中,所述BFD检测报文来自第二虚拟机;其特征在于,所述方法包括:获取预测时长和预定数量个样本时间间隔;其中,所述预测时长为当前时刻距离所述第一虚拟机最近一次接收到BFD检测报文的时间间隔,所述样本时间间隔为相邻两个BFD检测报文的到达时间间隔;根据所述预测时长以及所述预定数量个样本时间间隔得到特征值;其中,所述特征值用来表示所述第二虚拟机中正在运行的应用出现故障的可能性;针对所述第二虚拟机中正在运行的一个应用,将所述特征值与所述一个应用的预设故障判定标准进行对照,并根据对照结果判定所述一个应用是否发生故障。2.如权利要求1所述方法,其特征在于,所述根据所述预测时长以及所述预定数量个样本时间间隔得到特征值包括:根据所述预定数量个样本时间间隔得到所述样本时间间隔的均值和方差;根据所述样本时间间隔的均值和方差得到分布函数;将所述预测时长代入所述分布函数计算函数值;根据所述函数值得到所述特征值。3.如权利要求2所述方法,其特征在于,所述根据所述函数值得到特征值包括:对所述函数值取负对数,得到所述特征值。4.如权利要求1-3任一项所述方法,其特征在于,所述一个应用的预设故障判定标准包括一个非故障取值区间和一个故障取值区间;所述将所述特征值与所述一个应用的预设故障判定标准进行对照,并根据对照结果判定所述一个应用是否发
\t生故障包括:判断所述特征值落在所述非故障取值区间和所述故障取值区间中的哪一个;若对照结果为所述特征值落在所述故障取值区间,判定所述一个应用发生故障;若对照结果为所述特征值落在所述非故障取值区间,判定所述一个应用未发生故障。5.如权利要求4所述方法,其特征在于,在判定所述一个应用发生故障之后,所述方法还包括:对所述一个应用执行故障处理。6.如权利要求1-3任一项所述方法,其特征在于,所述一个应用的预设故障判定标准包括一个非故障取值区间和至少两个故障取值区间,每一个故障取值区间对应着一个不同的故障等级;所述将所述特征值与所述一个应用的预设故障判定标准进行对照,并根据对照结果判定所述一个应用是否发生故障包括:判断所述特征值落在所述非故障取值区间和所述至少两个故障取值区间中的哪一个;若对照结果为所述特征值落在一个故障取值区间,判定所述一个应用发生的故障等级为所述一个故障取值区间对应的故障等级;其中,所述一个故障取值区间为所述至少两个故障取值区间中的一个;若对照结果为所述特征值落在所述非故障取值区间,判定所述一个应用未发生故障。7.如权利要求6所述方法,其特征在于,每一个故障取值区间对应着一个不同的故障处理方式;在判定所述一个应用发生的故障等级为所述一个故障取值区间对应的故障等级之后,所述方法还包括:对所述一个应用执行所述一个故障取值区间对应的故障处理。8.如权利要求1-7任一项所述方法,其特征在于,所述预定数量为M,所述M个样本时间间隔为从连续的M+1个BFD检测报文中获取到的,其中M为大于20的整数。9.一种双向转发检测机制BFD检测装置,所述装置应用于第一虚拟机接收BFD检测报文的过程中,所述BFD检测报文来自第二虚拟机;其特征在于,所述装...

【专利技术属性】
技术研发人员:伍湘平
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1