一种网络故障定位方法和装置制造方法及图纸

技术编号:4271745 阅读:256 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种网络故障定位方法和装置。该方法包括以下步骤:建立传播模型;处理时间片信息;过滤噪声;确定假设集合;计算信度;先验概率更新。本发明专利技术算法复杂度低、定位速度快、抗噪声能力强、定位准确度高。

【技术实现步骤摘要】

本专利技术涉及计算机网络领域,尤其涉及一种网络故障定位方法和装置
技术介绍
现有的故障定位技术主要有确定性推理技术和不确定性推理技术。确定性推理技 术是指故障的发生必然会导致某些症状的发生,主要有基于规则的、基于模型的等;而不确 定性推理技术是指故障的发生以一定的概率导致某些症状的发生,目前比较流行的是基于 贝叶斯网络的故障定位技术,包括基于静态贝叶斯网络的故障定位技术和基于动态贝叶斯 网络的故障定位技术。 基于静态贝叶斯网络的故障定位技术主要有变量消元算法、团树传播算法、迭代 信度传播算法等,以及这些算法的变种,例如IHU算法、Shrink算法、ITFD算法等,这些算法 都有一个共同的假设作为前提,即在故障定位的过程中,被管系统是不变的,即诊断过程中 各个节点的状态不会发生变化,利用当前观测周期内观测到的所有症状,对当前时间段系 统中各个节点状态进行诊断,这种方法没有考虑在观测周期内或是诊断过程中某个节点的 状态发生变化的情况。而在大量业务部署的复杂网络中,由于路由变化,访问量变化,链路 拥塞或解除等原因,节点的状态都以一定的概率发生动态的变化。在网络规模比较大时,分 布在被管网络中的站点或代理的观测周期不可能过于密集,因此在同一个观测周期内观测 到的节点状态可能出现不一致的情况,这就使得静态贝叶斯方法诊断错误率升高,诊断效 率降低。 为了解决静态贝叶斯网络进行故障定位时出现的问题,现有技术中通常采用动态 贝叶斯网络。动态贝叶斯网络将系统表示成从起始时间到终止时间的一系列快照,每一个 快照都包括一个完整的贝叶斯网络,表示系统在该时间的状态,前后两个快照之间相关的 节点添加因果联系,表示在不同时间片的节点状态传播关系。基于动态贝叶斯网络的推理 是处理动态不确定性问题的重要方法,在动态系统故障定位中发挥着重要的作用。其中,精 确推理算法有forwards-backwards算法、frontier算法、The interface算法等,但这些算 法由于精确推理算法复杂度高,不能满足大规模的动态贝叶斯网络推理的需要。 由此可以看出,上述现有技术存在以下缺陷 (1)不能解决网络中节点状态和特性随时间动态变化的问题。基于静态贝叶斯网 络的故障定位系统虽然取得了较好的诊断效率,但是他们都是以被管系统节点状态和特性 不会随时间片动态变化为前提的。在大量业务部署的复杂网络中,由于路由变化,访问量变 化,链路拥塞或解除等原因,节点的状态和特性都是以一定的概率发生动态的变化,这给基 于静态贝叶斯网络的故障定位提出了新的挑战。 (2)网络中的噪声对现有的算法影响较大。现有的基于动态贝叶斯网络的故障定 位技术中并没有考虑噪声对算法的影响。而在实际网络中,网络环境复杂,产生告警丢失或 虚假告警是在所难免的,当网络规模较大的时候,虚假症状的个数会明显增多,因此一种好 的噪声处理机制,对提高故障定位准确度意义重大。4 (3)现有的基于动态贝叶斯网络的故障定位技术算法复杂度较高,而在实际网络 节点规模比较大的情况下,故障定位的时间比较长,因此已经失去故障定位的意义。
技术实现思路
本专利技术的目的是针对现有技术中存在的缺陷和不足,提出了一种网络故障定位的 方案,其针对网络的动态性采用基于动态贝叶斯网络的模型,加入了时间片信息,并且利用 时间片之间的传播概率信息,对每个节点动态地更新其先验概率,利用先验概率参与信度 计算,同时,本专利技术的方案还实现了对虚假告警的过滤。 为达到上述目的,本专利技术提供了一种网络故障定位方法,包括以下步骤 Sl,建立传播模型利用静态贝叶斯网络进行建模,然后通过加入时间因素扩展静态贝叶斯模型得到动态贝叶斯网络模型; S2,处理时间片信息首先对当前时间片进行判断,如果是初始时间片,则进入步骤S3,否则判断当前症状集合So1是否和上一个时间片的症状集合信息So1—1相同,t表示时间片,若相同,则使用上一个时间片定位的故障节点,1—、作为当前时间片定位的故障节点H^,并进入步骤S6,否则将上一个时间片定位的故障节点并入当前时间片的疑似节点集合中,再进入步骤S3,其中,当一个端到端的网络服务失败时,该服务所经过路径上的所有节点都被认为是疑似节点,被并入到疑似节点集合中; S3,过滤噪声过滤疑似节点集合中由噪声引起的节点; S4,确定假设集合将步骤S3处理之后疑似节点集合中的所有故障节点排列组 合,得到包括单点故障和多点故障在内的所有节点集的集合,将每一个节点集所能解释的 症状与当前接收到的症状集合进行比较,若前者完全包含后者,则保留该节点集,否则将该 节点集移除,最终得到多个能够解释当前症状的假设故障节点集Hit = {FZ = 1,F/ = 1…… Fj = lhF表示故障节点,上标均表示时间片,下标均表示节点编号; S5,计算信度计算每一个假设故障节点集的信度B(Hit, S。t),然后从中选择信度 最大的假设故障节点集作为最终的定位结果『t ; S6,先验概率更新对于当前时间片中的每一个故障节点,计算其后验概率,利用后验概率和传播概率,更新当前故障节点的先验概率,将更新后的先验概率作为该故障节点下一个时间片的先验概率。 其中,所述步骤S3具体包括 S31,对于每一个疑似节点计算其观测率,其中,观测率表示一个故障节点所能解 释的所有症状中,观测到的症状所占的比率; S32,对每一个疑似节点的观测率与预设门限进行比较,如果该值小于预设门限,则将该疑似节点从疑似节点集合中移除。本专利技术还提供了一种网络故障定位装置,包括 建模单元,用于利用静态贝叶斯网络进行建模,然后通过加入时间因素扩展静态 贝叶斯模型得到动态贝叶斯网络模型; 处理时间片信息单元,用于对当前时间片进行判断,如果是初始时间片,则利用过 滤噪声单元进行噪声过滤,否则判断当前症状集合So1是否和上一个时间片的症状集合信 息So1—1相同,t表示时间片,若相同,则使用上一个时间片定位的故障节点、作为当前时间片定位的故障节点H*、并利用先验概率更新单元进行先验概率更新,否则将上一个时 间片定位的故障节点并入当前时间片的疑似节点集合中,再利用过滤噪声单元进行噪声过 滤,其中,当一个端到端的网络服务失败时,该服务所经过路径上的所有节点都被认为是疑 似节点,被并入到疑似节点集合中; 过滤噪声单元,用于过滤疑似节点集合中由噪声引起的节点; 确定假设集合单元,用于将过滤噪声单元处理之后疑似节点集合中的所有故障节点排列组合,得到包括单点故障和多点故障在内的所有节点集的集合,将每一个节点集所能解释的症状与当前接收到的症状集合进行比较,若前者完全包含后者,则保留该节点集,否则将该节点集移除,最终得到多个能够解释当前症状的假设故障节点集Hit = {Fj = 1,F/ = 1……= lhF表示故障节点,上标均表示时间片,下标均表示节点编号; 计算信度单元,用于计算每一个假设故障节点集的信度B(Hi、 S。,然后从中选择信度最大的假设故障节点集作为最终的定位结果; 先验概率更新单元,用于对于当前时间片中的每一个故障节点,计算其后验概率, 利用后验概率和传播概率,更新当前故障节点的先验概率,将更新后的先验概率作为该故 障节点下一个时间片的先验概率。 上述技术方案具有如下优点本文档来自技高网
...

【技术保护点】
一种网络故障定位方法,其特征在于,包括以下步骤:S1,建立传播模型:利用静态贝叶斯网络进行建模,然后通过加入时间因素扩展静态贝叶斯模型得到动态贝叶斯网络模型;S2,处理时间片信息:首先对当前时间片进行判断,如果是初始时间片,则进入步骤S3,否则判断当前症状集合So↑[t]是否和上一个时间片的症状集合信息So↑[t-1]相同,t表示时间片,若相同,则使用上一个时间片定位的故障节点H*↑[t-1],作为当前时间片定位的故障节点H*↑[t],并进入步骤S6,否则将上一个时间片定位的故障节点并入当前时间片的疑似节点集合中,再进入步骤S3,其中,当一个端到端的网络服务失败时,该服务所经过路径上的所有节点都被认为是疑似节点,被并入到疑似节点集合中;S3,过滤噪声:过滤疑似节点集合中由噪声引起的节点;S4,确定假设集合:将步骤S3处理之后疑似节点集合中的所有故障节点排列组合,得到包括单点故障和多点故障在内的所有节点集的集合,将每一个节点集所能解释的症状与当前接收到的症状集合进行比较,若前者完全包含后者,则保留该节点集,否则将该节点集移除,最终得到多个能够解释当前症状的假设故障节点集H↓[i]↑[t]={F↓[i]↑[t]=1,F↓[j]↑[t]=1......F↓[k]↑[t]=1},F表示故障节点,上标均表示时间片,下标均表示节点编号;S5,计算信度:计算每一个假设故障节点集的信度B(H↓[j]↑[t],S↓[o]↑[t]),然后从中选择信度最大的假设故障节点集作为最终的定位结果H↑[*t];S6,先验概率更新:对于当前时间片中的每一个故障节点,计算其后验概率,利用后验概率和传播概率,更新当前故障节点的先验概率,将更新后的先验概率作为该故障节点下一个时间片的先验概率。...

【技术特征摘要】
一种网络故障定位方法,其特征在于,包括以下步骤S1,建立传播模型利用静态贝叶斯网络进行建模,然后通过加入时间因素扩展静态贝叶斯模型得到动态贝叶斯网络模型;S2,处理时间片信息首先对当前时间片进行判断,如果是初始时间片,则进入步骤S3,否则判断当前症状集合Sot是否和上一个时间片的症状集合信息Sot-1相同,t表示时间片,若相同,则使用上一个时间片定位的故障节点H*t-1,作为当前时间片定位的故障节点H*t,并进入步骤S6,否则将上一个时间片定位的故障节点并入当前时间片的疑似节点集合中,再进入步骤S3,其中,当一个端到端的网络服务失败时,该服务所经过路径上的所有节点都被认为是疑似节点,被并入到疑似节点集合中;S3,过滤噪声过滤疑似节点集合中由噪声引起的节点;S4,确定假设集合将步骤S3处理之后疑似节点集合中的所有故障节点排列组合,得到包括单点故障和多点故障在内的所有节点集的集合,将每一个节点集所能解释的症状与当前接收到的症状集合进行比较,若前者完全包含后者,则保留该节点集,否则将该节点集移除,最终得到多个能够解释当前症状的假设故障节点集Hit={Fit=1,Fjt=1......Fkt=1},F表示故障节点,上标均表示时间片,下标均表示节点编号;S5,计算信度计算每一个假设故障节点集的信度B(Hjt,Sot),然后从中选择信度最大的假设故障节点集作为最终的定位结果H*t;S6,先验概率更新对于当前时间片中的每一个故障节点,计算其后验概率,利用后验概率和传播概率,更新当前故障节点的先验概率,将更新后的先验概率作为该故障节点下一个时间片的先验概率。2. 如权利要求1所述的网络故障定位方法,其特征在于,所述步骤S3具体包括 S31,对于每一个疑似节点计算其观测率,其中,观测率表示一个故障节点所能解释的所有症状中,观测到的症状所占的比率;S...

【专利技术属性】
技术研发人员:刘星雷振张杰李智
申请(专利权)人:北京市天元网络技术股份有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1