一种测试代价敏感的系统故障定位方法及其装置制造方法及图纸

技术编号:2828395 阅读:224 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种测试代价敏感的系统故障定位方法,该方法为:对系统进行故障模式影响分析并形成相应的故障模式库,该故障模式库包括故障表现、可能导致故障表现的故障模式、每种故障表现的测试代价和每种故障模式的发生概率;接着,根据每种故障表现的测试代价和每种故障模式的发生概率获得用于确定故障定位树的决策树;最后,将所述决策树转换为对应的故障定位树,并通过该故障定位树分析定位系统故障。这样,便解决了现有方法无法兼顾使测试代价相对最少和使生成的故障定位树相对最小的问题。本发明专利技术同时公开了一种系统故障定位装置。

【技术实现步骤摘要】

本专利技术涉及通信领域,特别涉及一种测试代价敏感的系统故障定位方法及 其装置。
技术介绍
对于通讯电子设备而言,设备故障是客观存在且随机发生的,导致设备故 障的原因不仅包括器件的硬件失效,也包括设备的人为操作失误。当由多个组 件构成的复杂系统发生故障时,维护人员往往一筹莫展,无法快速准确地找到 导致系统故障的具体原因,从而导致维修时间过长和维修费用过高,这对于通 讯设备组成的高可用系统而言是不允许的。传统的故障定位方法主要依赖于维 修人员经验的长时间积累和设备的历史故障信息,在实践中发现,这种依赖于 经验的方法只能解决常见问题,对于复杂系统或新型设备,依赖于经验的方法 无法有效的解决问题。在设备使用过程中,如何快速准确地将系统故障定位到 现场可更换单元(组件),从而提高故障定位的准确性和提高系统的可靠性, 人们一直为之困扰。目前,为了解决以上问题,人们提出了许多解决方法,其中基于决策树的 故障定位树就是一种有效的故障定位方法,其具有高诊断率、低误诊率、对噪 声具有鲁棒性和定位时间快这四大优点。在现有的技术中,基于决策树的故障 定位树的生成主要是以人工方式为主,或采用一些现有的树生成算法。在实际的故障诊断过程中,往往会先得到一些故障表现(即故障症状), 但是通常根据这些故障表现还不足以确定系统发生的根故障,为了确定根故 障,还必须对系统设备进行一定的测试,这些测试可能是自动进行的,也可能 是人工进行的,有些测试是比较容易进行的,有些测试是十分困难的,有些测试是需要中断系统业务的正常运行的,有些测试是不须中断系统业务的正常运 行,也就是说各种故障表现的检测代价是不同的,在故障定位树的生成算法中 考虑故障表现的测试代价是非常重要的,这样能使生成的故障定位树在定位树 的大小和测试代价上有一个好的平衡。法只考虑利用故障表现的分布情况使最终生成的故障定位树树尺寸最小,如CART[l]、 ID3[2]和C4.5[3]等,而没有考虑故障定位过程中故障表现的测试代 价问题;另一类算法则考虑了使故障定位树总代价最小,即根据综合数据的测 试代价和误分类代价确定决策树何时停止生长,但是其重点是判断何时停止树 的生长,其选择属性进行测试的准则是使误分类代价和测试代价之和最小。对 于允许误判情况的系统来说,这是一种较好的代价敏感的树生成算法,但是对 于通讯设备系统来说,误判的代价是十分严重的。在此种情况下,由于只考虑 了属性的测试代价,而没有考虑选择该属性后由故障发生的分布情况决定的数 据信息量的收益情况,因此生成的故障定位树并不能使故障定位过程中的测试 代价较小。现有技术公开了 一种基于故障树分析的系统故障定位方法及装置,该方法 通过对系统进行故障模式影响分析,生成相应的故障模式库,再根据该故障模 式库进行故障树分析并生成相应的故障定位树;所述方法在生成故障定位树时 包括以下步骤步骤A:按照底事件出现的概率和定位的难易程度来排列底事件。将发生 概率较大的底事件、容易定位的底事件放在前面,将发生概率较小、不方便定 位或无法定位的底事件放在后面。步骤B:将中间事件或底事件以及相应的检测手段写在决定框中。检测手 段用括号表示,当检测手段无法由软件自动进行而需要人工确认时,需要在检 测手段的开头加上人工确认,,,以作为提示诊断人员的信息。步骤C:将诊断结果以及解决方案写在故障描述处理框中。解决方案也需要用括号表示,同时开头加上解决方案加以提示。步骤D:将相应的提示信息写入提示信息处理框中。通过上述方法生成的故障定位树为二叉树的模型,各中间判断动作的输出 均应包括是和否两种结果,否则视为不完整的动作节点,要加入提示 信息处理框将其补充完整,其内容可以是正常或是当无法准确判断根故障 时相应的提示信息。当需要进行故障定位时,程序从顶事件出发,经过不同的 决定框最终得到故障描述处理框,并根据其中的诊断结果和解决方案对根故障 进行相应的处理。该方法提出了一个很好的系统故障定位解决方案,但是在实现该方法过程 中,专利技术人发现通过该专利技术方法生成的故障模式库虽然包含了系统的故障表现 和故障原因,却并没有包含针对不同的故障表现的测试代价,因此在基于故障 树生成相应的故障定位树时也就没有考虑测试代价的问题。另一方面,该专利技术方法仅说明了将发生概率大的底事件和容易定位的底事 件放在前面,将发生概率较小和不方便定位或无法定位的底事件放在后面,而 没有提及如果出现发生概率大同时又不方便定位的底事件,或出现发生概率较 小同时又容易定位的底事件时相应的处理方案。另外该专利技术没有对选择中间事 件的方法作进一步说明。综上所述,现有的对系统进行故障定位的方法,存在无法兼顾使测试代价 相对最少和使生成的故障定位树相对最小的缺陷。
技术实现思路
本专利技术的实施例提供一种测试代价敏感的系统故障定位方法及其装置,用 于解决现有技术下,在对系统进行故障定位时,无法关联考虑故障定位树的测 试代价和故障定位树的大小的问题。本专利技术的实施例技术方案如下一种测试代价敏感的系统故障定位方法,包括对系统进行故障模式影响分析并形成相应的故障模式库,该故障模式库包 括故障表现、可能导致故障表现的故障模式、每种故障表现的测试代价和每种 故障模式的发生概率;根据每种故障表现的测试代价和每种故障模式的发生概率获得用于确定 故障定位树的决策树,该决策树使故障定位树的测试代价与故障定位树的信息 量增益之比最小;将所述决策树转换为对应的故障定位树,并通过该故障定位树分析定位系 统故障。一种系统故障诊断装置,包括存储单元,用于存储故障模式库,所述故障模式库包括故障表现、可能导 致故障表现的故障模式、每种故障表现的测试代价和每种故障模式的发生概 率;通信模块,用于实现系统故障定位装置和测试对象之间的信息交互;处理模块,用于对系统进行故障模式影响分析.形成相应的故障模式库, 并根据所述故障模式库中各故障表现的测试代价和各故障模式的发生概率生 成用于确定故障定位树的决策树和对应的故障定位树;故障定位模块,用于根据所述故障定位树对系统进行故障分析和定位,以 及对定位出的故障模式进行处理。本专利技术实施例的有益效果如下本专利技术实施例先根据每种故障表现的测试代价和每种故障模式的发生概 率获得用于确定故障定位树的决策树,然后根据测试方案脚本和解决方案脚本 将所述决策树转换为对应的故障定位树,这样,便使生成的故障定位树的测试 代价与该故障定位树的信息量增益之比最小,从而在减小故障定位树的测试代 价和减少故障定位树的测试步骤数两方面达到了综合平衡。附图说明图1为本专利技术实施例中系统故障诊断装置功能结构图;图2为本专利技术实施例中决策树逻辑结构图;图3为本专利技术实施例中故障定位树结构图;图4为本专利技术实施例中对系统进行故障定位流程图。具体实施方式为了解决现有技术下,在对通信系统进行故障定位时,难以找到使生成的 故障定位树最小和使测试代价最小两方面的最佳结合点,本专利技术实施例通过对 通讯系统进行故障模式影响分析而得到系统的故障描述,并将所述故障描述与 该系统故障历史数据库中相关的信息相结合后形成相应的故障模式库,所述故 障模式库包括故障表现、可能导致故障表现的故障模式、每种故障表现的测试代价和每种故障模式的发生概率;接着,根据每种故障表现的测试代价和本文档来自技高网
...

【技术保护点】
一种测试代价敏感的系统故障定位方法,其特征在于,包括步骤:对系统进行故障模式影响分析并形成相应的故障模式库,该故障模式库包括故障表现、可能导致故障表现的故障模式、每种故障表现的测试代价和每种故障模式的发生概率;根据每种故障表 现的测试代价和每种故障模式的发生概率获得用于确定故障定位树的决策树,该决策树使故障定位树的测试代价与故障定位树的信息量增益之比最小;将所述决策树转换为对应的故障定位树,并通过该故障定位树分析定位系统故障。

【技术特征摘要】
1. 一种测试代价敏感的系统故障定位方法,其特征在于,包括步骤对系统进行故障模式影响分析并形成相应的故障模式库,该故障模式库包括故障表现、可能导致故障表现的故障模式、每种故障表现的测试代价和每种故障模式的发生概率;根据每种故障表现的测试代价和每种故障模式的发生概率获得用于确定故障定位树的决策树,该决策树使故障定位树的测试代价与故障定位树的信息量增益之比最小;将所述决策树转换为对应的故障定位树,并通过该故障定位树分析定位系统故障。2、 如权利要求1所述的方法,其特征在于,所述获得决策树的步骤具体 包括步骤分别以熵、GINI指数和最大分类误差为度量生成相应的三种决策树; 分别计算出所述三种决策树对应的平均需测试故障表现数量与平均测试 代价的乘积;将所述乘积中最小值对应的决策树作为确定故障定位树的决策树。3、 如权利要求2所述的方法,其特征在于,生成所述三种决策树的步骤 具体包括步骤分别以熵、GINI指数和最大分类误差为度量生成相应的三种信息量增益; 根据所述三种信息量增益和所述每种故障表现的测试代价分别生成对应 于熵、GINI指数和最大分类误差的三种决策树。4、 如权利要求2所述的方法,其特征在于,所述三种决策树由测试节点 和叶节点组成,所述测试节点对应于某一特定的故障表现,所述叶节点对应于 某一特定的故障模式。5、 如权利要求4所述的方法,其特征在于,生成所述决策树的测试节点的步骤包括若当前存在使所述测试代价取值为零的故障表现,则根据其中令所述信息量增益最大的故障表现生成决策树当前的测试节点;若当前存在令所述信息量增益取值为零的故障表现,则根据其中令所述测试代价最d 、的故障表现生成决策树当前的测试节点;否则,根据当前令所述测试代价与所述信息量增益的比值最小的故障表现 生成决策树当前的测试节点。6、 如权利要求5所述的方法,其特征在于,生成所述决策树的叶节点的 步骤为进一步根据所述当前的测试节点判断是否能直接推断出相应的故...

【专利技术属性】
技术研发人员:郑秋华钱运涛
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1