一种故障检测方法、装置、设备及可读存储介质制造方法及图纸

技术编号:34097361 阅读:29 留言:0更新日期:2022-07-11 22:37
本申请公开了一种故障检测方法、装置、设备及可读存储介质,该方法包括:获取待检测设备的第一状态信息;根据第一状态信息确定第一故障类型;获取与第一故障类型相关的目标部件的第二状态信息;根据第二状态信息确定故障部件和/或第二故障类型。本申请实施在对待检测设备故障进行检测时,优先考虑第一故障类型,并在确定了在待检测设备中存在第一故障类型时,考虑导致该第一故障类型的目标部件的故障,从而通过进一步对与第一故障类型相关的目标部件的第二状态信息进行综合分析,确定最终的故障部件和/或第二故障类型,不仅可以减少对非必要故障或间接故障的分析,减少待检测设备的故障检测时间,还可以准确地分析出待检测设备的故障点。设备的故障点。设备的故障点。

【技术实现步骤摘要】
一种故障检测方法、装置、设备及可读存储介质


[0001]本申请涉及计算机
,尤其涉及一种故障检测方法、装置、设备及可读存储介质。

技术介绍

[0002]在电子设备的研发过程和使用过程中,有时有必要对电子设备的运行状态进行检测,以便及时发现潜在的设备故障,或者在设备出现故障,系统已经出现不稳定的情况下,能够分析出故障点,从而采取相应的措施。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种故障检测方法、装置、设备及可读存储介质。
[0004]根据本申请第一方面,本申请实施例提供了一种故障检测方法,包括:获取待检测设备的第一状态信息;根据第一状态信息确定第一故障类型;获取与第一故障类型相关的目标部件的第二状态信息;根据第二状态信息确定故障部件和/或第二故障类型。
[0005]可选地,第一故障类型包括CPU内部错误,与第一故障类型相关的目标部件包括CPU的过程控制单元。
[0006]可选地,根据第二状态信息确定故障部件和/或第二故障类型,包括:在根据第二状态信息确定过程控制单元出错的情况下,获取过程控制单元出错的错误码;根据错误码确定故障部件和/或第二故障类型。
[0007]可选地,根据第二状态信息确定故障部件和/或第二故障类型,包括:在根据第二状态信息确定过程控制单元未出错的情况下,获取CPU的第一计时器的第三状态信息;根据第三状态信息确定故障部件和/或第二故障类型。
[0008]可选地,根据第三状态信息确定故障部件和/或第二故障类型,包括:在根据第三状态信息确定第一计时器存在超时错误的情况下,获取CPU的第二计时器的第四状态信息;在根据第四状态信息确定第二计时器存在超时错误的情况下,获取第二计时器超时错误的错误地址;根据错误地址确定故障部件和/或第二故障类型。
[0009]可选地,故障检测方法还包括:若根据第一状态信息确定不存在第一故障类型时,则根据第一状态信息确定第三故障类型;获取与第三故障类型相关的目标部件的第五状态信息;根据第五状态信息确定故障部件和/或第四故障类型。
[0010]可选地,第三故障类型包括机器检查错误,与第三故障类型相关的目标部件包括机器检查错误处理单元,根据第五状态信息确定故障部件和/或第四故障类型,包括:在根据第五状态信息确定多个机器检查错误处理单元出错的情况下,确定出错的机器检查错误处理单元的属性信息;根据属性信息确定故障部件和/或第四故障类型。
[0011]根据本申请第二方面,本申请实施例提供了一种故障检测装置,包括:第一获取单元,用于获取待检测设备的第一状态信息;第一确定单元,用于根据第一状态信息确定第一故障类型;第二获取单元,用于获取与第一故障类型相关的目标部件的第二状态信息;第二
确定单元,用于根据第二状态信息确定故障部件和/或第二故障类型。
[0012]根据本申请第三方面,本申请实施例提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行如第一方面或第一方面任意实施方式中的故障检测方法。
[0013]根据本申请第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行如第一方面或第一方面任意实施方式中的故障检测方法。
[0014]本申请实施例提供的故障检测方法、装置、设备及可读存储介质,通过获取待检测设备的第一状态信息;根据第一状态信息确定第一故障类型;获取与第一故障类型相关的目标部件的第二状态信息;根据第二状态信息确定故障部件和/或第二故障类型;从而在对待检测设备故障进行检测时,优先考虑第一故障类型,并在确定了在待检测设备中存在第一故障类型时,考虑导致该第一故障类型的目标部件的故障,从而通过进一步对与第一故障类型相关的目标部件的第二状态信息进行综合分析,确定最终的故障部件和/或第二故障类型,不仅可以减少对非必要故障或间接故障的分析,减少待检测设备的故障检测时间,还可以准确地分析出待检测设备的故障点。
[0015]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0016]图1为本申请实施例中一种电子设备的硬件结构示意图;
[0017]图2为本申请实施例中另一电子设备的硬件结构示意图;
[0018]图3为本申请实施例中电子设备的触摸屏对故障部件和/或第二故障类型进行显示的示意图;
[0019]图4为本申请实施例中一种故障检测方法的流程示意图;
[0020]图5为本申请实施例中步骤S104的流程示意图;
[0021]图6为本申请实施例中一种故障检测装置的结构示意图。
具体实施方式
[0022]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]目前,服务器的运行状态信息可以通过服务器各个部件对应的寄存器记录下来。但是服务器的各个部件对应的寄存器中记录了故障信息,并不代表相应的部件就出了问题,例如,CPU的驱动控制单元(Drive Control Unit,DCU)对应的MCA(machine check architecture)寄存器记录了一个故障,如SRAR类型的故障,而内存对应的内存寄存器记录到了SRAO类型的故障,但并不能说明CPU的DCU和内存都出现了故障,还要结合其他的寄存
器的记录做综合的分析,这两个故障的最终来源可能是某个内存,而不是CPU和内存都出错了,因此,单单依靠寄存器中记录的故障,并不能准确定位电子设备的故障部件和/或故障类型。为此,本申请实施例提供一种故障检测方法、装置、设备及可读存储介质,通过对服务器各个部件对应的寄存器中记录的状态信息进行综合分析,可以确定具体的故障部件和/或故障类型。
[0024]本申请实施例提供了一种电子设备,下面说明本申请实施例提供的电子设备的示例性应用,本申请实施例提供的电子设备可以实施为电子设备,电子设备可以是服务器或终端设备。
[0025]服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做限制。
[0026]参见图1,图1是本申请实施例提供的电子设备的结构示意图,图1所示的电子设备400本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障检测方法,包括:获取待检测设备的第一状态信息;根据所述第一状态信息确定第一故障类型;获取与所述第一故障类型相关的目标部件的第二状态信息;根据所述第二状态信息确定故障部件和/或第二故障类型。2.根据权利要求1所述的故障检测方法,所述第一故障类型包括CPU内部错误,与所述第一故障类型相关的目标部件包括CPU的过程控制单元。3.根据权利要求2所述的故障检测方法,所述根据所述第二状态信息确定故障部件和/或第二故障类型,包括:在根据所述第二状态信息确定所述过程控制单元出错的情况下,获取所述过程控制单元出错的错误码;根据所述错误码确定故障部件和/或第二故障类型。4.根据权利要求2所述的故障检测方法,所述根据所述第二状态信息确定故障部件和/或第二故障类型,包括:在根据所述第二状态信息确定所述过程控制单元未出错的情况下,获取CPU的第一计时器的第三状态信息;根据所述第三状态信息确定故障部件和/或第二故障类型。5.根据权利要求4所述的故障检测方法,所述根据所述第三状态信息确定故障部件和/或第二故障类型,包括:在根据所述第三状态信息确定所述第一计时器存在超时错误的情况下,获取CPU的第二计时器的第四状态信息;在根据所述第四状态信息确定所述第二计时器存在超时错误的情况下,获取所述第二计时器超时错误的错误地址;根据所述错误地址确定故障部件和/或第二故障类型。6.根据权利要求1所述的故障检测方法,还包括:若根据所述第一状态信息确定不存在第一故障类型时,则...

【专利技术属性】
技术研发人员:郭章平
申请(专利权)人:联想北京信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1