一种故障检测方法及装置制造方法及图纸

技术编号:36153288 阅读:11 留言:0更新日期:2022-12-31 19:58
本申请提供一种故障检测方法及装置,该方法可以由计算机设备中的故障检测装置执行,在该方法中,故障检测装置获取组件拓扑图,确定组件拓扑图中,与报错的第一组件具有连接关系的其他组件是否可能发生故障;输出可能发生故障的第二组件,所述第二组件是所述其他组件和所述第一组件的子集。上述方式,可以在检测到计算机设备内的组件报障时,基于组件拓扑图检测该组件的关联组件是否可能发生故障,从而发现可能存在故障的一系列组件,并输出这些可能存在故障的组件,以指导用户进行检修,提高检修效率。修效率。修效率。

【技术实现步骤摘要】
一种故障检测方法及装置


[0001]本申请涉及计算机
,尤其涉及一种故障检测方法及装置。

技术介绍

[0002]随着电子技术的发展,计算机设备中包含的组件越来越多,组件之间的连接关系也越来越复杂。其中有些组件自带有故障传感器,可以在检测到组件可能存在故障时进行报警,然而大部分组件没有故障传感器,并且由于组件之间可能会相互影响,当某个组件出现故障时,还可能引起其他组件故障。
[0003]当前出于成本以及产品实现的角度,无法为每个组件配置故障传感器,当组件出现故障时,要定位到哪些组件可能存在故障的难度也越来越高。

技术实现思路

[0004]本申请提供一种故障检测方法及装置,用于对可能存在故障的组件进行定位,以向用户提供检修指导,提高检修效率。
[0005]第一方面,本申请实施例提供了一种故障检测方法,该方法可以由故障检测装置执行,在该方法可以应用于计算机设备中。在该方法中,故障检测装置获取组件拓扑图,该组件拓扑图用于描述计算机设备中的各个组件,以及各个组件之间的连接关系;确定组件拓扑图中,与报错的第一组件具有连接关系的其他组件是否可能发生故障;输出可能发生故障的第二组件,第二组件是其他组件和第一组件的子集。
[0006]通过上述方法,故障检测装置可以在侦测到第一组件报障后,基于组件拓扑图检测出第一组件的关联组件中可能存在故障的组件,并输出故障检测结果,以向用户提供检修指导。由于第二节点可以具有故障传感器也可以不具有故障传感器,因此本申请技术方案可以在不增加硬件成本的基础上,提高检修效率,适用场景也更广泛。
[0007]在一种可能的实施方式中,组件拓扑图用于描述使用同一通信协议的组件之间的硬件连接关系。
[0008]通过上述方法,使用同一通信协议的组件之间的交互更加频繁,更易发现可能发生故障的组件,能够提高故障检测效率。
[0009]在一种可能的实施方式中,输出第二组件包括:通过图形界面输出第二组件;图形界面显示有组件拓扑图,组件拓扑包括多个节点标识,多个节点标识与计算机设备中的各个组件一一对应;在组件拓扑图中与第二组件对应的节点标识被高亮显示;或图形界面显示计算机设备的各个组件的硬件实物图,硬件实物图包括多个控件,多个控件与计算机设备中的各个组件一一对应,每个控件用于显示一个组件的硬件;在硬件实物图中与第二组件相对应的控件被高亮显示。
[0010]通过上述方法,能够更加直观地为用户展示可能发生故障的组件,进一步,如果通过硬件实物图来展示可能发生故障的组件,则能够更加方便用户快速确定这些可能发生故障的硬件组件的位置,提高用户使用体验。
[0011]在一种可能的实施方式中,第二组件是通过神经网络模型确定的;其中,神经网络模型用于根据报错的组件确定与报错的组件具有连接关系的其他组件是否可能发生故障,以及可能发生故障的组件的排序。这里的神经网络模型可以基于训练数据不断学习基于报障组件得到其他可能发生故障的组件的规则,以及多个可能发生故障的组件之间的排序规则。
[0012]通过上述方法,通过神经网络模型可以适应不同的设备和应用场景,学习到不同的检测规则和排序规则,有利于提高故障检测准确率,适用范围广。
[0013]在一种可能的实施方式中,其他组件包括在组件拓扑图中,第一组件的上游组件以及第一组件的下游组件。
[0014]在一种可能的实施方式中,确定组件拓扑图中,与报错的第一组件具有连接关系的其他组件是否可能发生故障,包括:针对其他组件中的任意一个组件,若组件存在至少一个可能存在故障的下一级组件,则确定组件可能存在故障。
[0015]通过上述方法,基于组件拓扑图确定出于报错的组件具有连接关系的其他组件,可以快速定位故障检测范围,提高故障检测效率。
[0016]在一种可能的实施方式中,第二组件的数量大于1,输出第二组件具体包括:对多个第二组件发生故障的概率进行排序;输出排序后的多个第二组件。
[0017]通过上述方法,通过排序可以将较大可能发生故障的节点排在前面,以此向用户指导检修顺序,提高用户的检修效率。
[0018]在一种可能的实施方式中,针对多个第二组件中的任意一个组件集合,组件集合包括一个父组件,以及父组件的一个或多个子组件;对多个第二组件发生故障的概率进行排序,包括:若父组件不具有传感器,且一个或多个子组件的数量大于1,则确定父组件发生故障的概率大于子组件发生故障的概率。
[0019]在一种可能的实施方式中,针对多个第二组件中的任意一个组件集合,组件集合包括一个父组件,以及父组件的一个或多个子组件;对多个第二组件发生故障的概率进行排序,包括:若父组件不具有传感器,且子组件的数量等于1,则确定父组件发生故障的概率与子组件发生故障的概率相同。
[0020]通过上述方法,可以检测不具有传感器的组件,不需要增加硬件开销。
[0021]在一种可能的实施方式中,针对多个第二组件中的任意一个组件集合,组件集合包括一个父组件,以及父组件的一个或多个子组件;对多个第二组件发生故障的概率进行排序,包括:若父组件具有传感器,且父组件的传感器报错,则父组件发生故障的概率大于子级组件发生故障的概率。
[0022]在一种可能的实施方式中,针对多个第二组件中的任意一个组件集合,组件集合包括一个父组件,以及父组件的一个或多个子组件;对多个第二组件发生故障的概率进行排序,包括:若父组件具有传感器,且父组件的传感器未报错,且子组件的数量大于1,则确定父组件发生故障的概率大于子组件发生故障的概率。
[0023]通过上述方法,不仅依赖传感器进行故障检测,及时发现可能发生故障的节点,避免传感器故障导致的漏检,提高用户的检修效率。
[0024]在一种可能的实施方式中,针对多个第二组件中的任意一个组件集合,组件集合包括一个父组件,以及父组件的一个或多个子组件;对多个第二组件发生故障的概率进行
排序,包括:若父组件具有传感器,且父组件的传感器未报错,且子组件的数量等于1,则确定父组件发生故障的概率小于子组件发生故障的概率。
[0025]在一种可能的实施方式中,输出第二组件包括:通过图形界面输出第二组件;图形界面还包括用于指示第二组件排序的编号,编号位于预设区域内。
[0026]通过上述方法,能够更加直观地为用户展示排序结果,提高用户使用体验。
[0027]在一种可能的实施方式中,第一组件具有传感器;还包括:根据传感器确定第一组件已发生故障。
[0028]第二方面,本申请实施例还提供了一种故障检测装置,该装置具有实现上述第一方面的方法实例中行为的功能,有益效果可以参见第一方面的描述此处不再赘述。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述故障检测装置的结构中包括获取模块、确定模块和输出模块。这些模块可以执行上述第一方面方法示例中的相应功能,具体参见方法示例中的详细描述,此处不做赘述。...

【技术保护点】

【技术特征摘要】
1.一种故障检测方法,其特征在于,所述方法应用于计算机设备中,包括:获取组件拓扑图,所述组件拓扑图用于描述所述计算机设备中的各个组件,以及各个组件之间的连接关系;确定所述组件拓扑图中,与报错的第一组件具有连接关系的其他组件是否可能发生故障;输出可能发生故障的第二组件,所述第二组件是所述其他组件和所述第一组件的子集。2.如权利要求1所述的方法,其特征在于,所述组件拓扑图用于描述使用同一通信协议的组件之间的硬件连接关系。3.如权利要求1或2所述的方法,其特征在于,所述输出所述第二组件包括:通过图形界面输出所述第二组件;所述图形界面显示有所述组件拓扑图,所述组件拓扑包括多个节点标识,所述多个节点标识与所述计算机设备中的各个组件一一对应;在所述组件拓扑图中与所述第二组件对应的节点标识被高亮显示;或所述图形界面显示所述计算机设备的各个组件的硬件实物图,所述硬件实物图包括多个控件,所述多个控件与所述计算机设备中的各个组件一一对应,每个所述控件用于显示一个组件的硬件;在所述硬件实物图中与所述第二组件相对应的控件被高亮显示。4.如权利要求1

3任一项所述的方法,其特征在于,所述第二组件是通过神经网络模型确定的;其中,所述神经网络模型用于根据报错的组件确定与所述报错的组件具有连接关系的其他组件是否可能发生故障,以及可能发生故障的组件的排序。5.如权利要求1

4任一项所述的方法,其特征在于,所述其他组件包括在所述组件拓扑图中,所述第一组件的上游组件以及所述第一组件的下游组件。6.如权利要求1

5任一项所述的方法,其特征在于,确定所述组件拓扑图中,与报错的第一组件具有连接关系的其他组件是否可能发生故障,包括:针对所述其他组件中的任意一个组件,若所述组件存在至少一个可能存在故障的下一级组件,则确定所述组件可能存在故障。7.如权利要求1

6任一项所述的方法,其特征在于,所述第二组件的数量大于1,所述输出所述第二组件具体包括:对多个所述第二组件发生故障的概率进行排序;输出排序后的多个所述第二组件。8.如权利要求7所述的方法,其特征在于,针对多个所述第二组件中的任意一个组件集合,所述组件集合包括一个父组件,以及所述父组件的一个或多个子组件;对多个所述第二组件发生故障的概率进行排序,包括:若所述父组件不具有传感器,且所述一个或多个子组件的数量大于1,则确定所述父组件发生故障的概率大于所述子组件发生故障的概率。9.如权利要求7所述的方法,其特征在于,针对多个所述第二组件中的任意一个组件集合,所述组件集合包括一个父组件,以及所述父组件的一个或多个子组件;对多个所述第二组件发生故障的概率进行排序,包括:若所述父组件不具有传感器,且所述子组件的数量等于1,则确定所述父组件发生故障
的概率与所述子组件发生故障的概率相同。10.如权利要求7所述的方法,其特征在于,针对多个所述第二组件中的任意一个组件集合,所述组件集合包括一个父组件,以及所述父组件的一个或多个子组件;对多个所述第二组件发生故障的概率进行排序,包括:若所述父组件具有传感器,且所述父组件的传感器报错,则确定所述父组件发生故障的概率大于所述子级组件发生故障的概率。11.如权利要求7所述的方法,其特征在于,针对多个所述第二组件中的任意一个组件集合,所述组件集合包括一个父组件,以及所述父组件的一个或多个子组件;对多个所述第二组件发生故障的概率进行排序,包括:若所述父组件具有传感器,且所述父组件的传感器未报错,且所述子组件的数量大于1,则确定所述父组件发生故障的概率大于所述子组件发生故障的概率。12.如权利要求7所述的方法,其特征在于,针对多个所述第二组件中的任意一个组件集合,所述组件集合包括一个父组件,以及所述父组件的一个或多个子组件;对多个所述第二组件发生故障的概率进行排序,包括:若所述父组件具有传感器,且所述父组件的传感器未报错,且所述子组件的数量等于1,则确定所述父组件发生故障的概率小于所述子组件发生故障的概率。13.如权利要求7

12任一项所述的方法,其特征在于,所述输出所述第二组件包括:通过图形界面输出所述第二组件;所述图形界面还包括用于指示所述第二组件排序的编号,所述编号位于预设区域内。14.如权利要求1

13任一项所述的方法,其特征在于,所述第一组件具有传感器;还包括:根据所述传感器确定所述第一组件已发生故障。15.一种故障检测装置,其特征在于,该装置应用于计算机设备中,包括:获取模块,用于获取组件拓扑图,所述组件拓扑图用于描述所述计...

【专利技术属性】
技术研发人员:董凌
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1