故障检测方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:31848137 阅读:13 留言:0更新日期:2022-01-12 13:29
本发明专利技术实施例提供了一种故障检测方法、装置、设备及计算机可读存储介质。该故障检测方法包括获取服务器设备在当前时间点的第一运行数据;获取第一运行数据中位于目标置信区间外的第二运行数据,目标置信区间包括根据当前时间点对应的历史时间点的历史运行数据确定的置信区间;将第二运行数据输入至训练完成的异常检测模型,通过异常检测模型检测第二运行数据中是否为异常数据,得到检测结果;在检测结果指示第二运行数据为异常数据的情况下,确定异常数据是否满足预设的故障条件;在异常数据满足预设的故障条件的情况下,确定服务器设备发生故障。根据本申请实施例,能够提高服务器设备检测的准确性。器设备检测的准确性。器设备检测的准确性。

【技术实现步骤摘要】
故障检测方法、装置、设备及计算机可读存储介质


[0001]本专利技术属于智能运维领域,尤其涉及一种故障检测方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着互联网的普及,应用互联网产生的数据越来越多,为了对这些数据进行存储和处理,大型数据中心应运而生。
[0003]在大型数据中心中,服务器是对数据进行存储和处理的重要单元。所以对服务器设备的故障检测就变得极为重要。
[0004]当前对服务器故障的检测主要是采用设定固定的故障基线的方法,在获取的服务器设备的运行数据超出故障基线的情况下,判定获取的运行数据为故障数据,进一步的,确定产生故障数据的服务器设备发生故障。但是由于设定的故障基线通常都是根据经验确定的,所以使得设定的故障基线并不准确,从而使得故障数据的判定并不准确,服务器设备的故障检测并不准确。

技术实现思路

[0005]本专利技术实施例提供一种故障检测方法、装置、设备及计算机可读存储介质,能够提高服务器设备检测的准确性。
[0006]第一方面,本专利技术实施例提供一种故障检测方法,方法包括:获取服务器设备在当前时间点的第一运行数据;获取第一运行数据中位于目标置信区间外的第二运行数据,目标置信区间包括根据当前时间点对应的历史时间点的历史运行数据确定的置信区间;将第二运行数据输入至训练完成的异常检测模型,通过异常检测模型检测第二运行数据中是否为异常数据,得到检测结果;在检测结果指示第二运行数据为异常数据的情况下,确定异常数据是否满足预设的故障条件;在异常数据满足预设的故障条件的情况下,确定服务器设备发生故障。
[0007]在一些实施方式中,在获取第一运行数据中位于置信区间外的第二运行数据之前,方法还包括:获取当前时间点对应的多个历史时间点的历史运行数据;当前时间点与历史时间点为位于不同周期的相同位置的时间点;将历史运行数据在概率分布下的置信区间确定为目标置信区间。
[0008]在一些实施方式中,确定异常数据是否满足预设的故障条件,具体包括:在异常数据与基准值的差值满足第一预设阈值的情况下,记录异常数据;在记录的异常数据数量满足第二预设阈值的情况下,确定异常数据满足预设的故障条件。
[0009]在一些实施方式中,在获取服务器设备在当前时间点的第一运行数据之后,故障检测方法还包括:获取第一运行数据中位于目标置信区间内的第三运行数据;在第三运行数据对应的服务器设备为故障的状态下,将故障状态修改为正常状态。
[0010]在一些实施方式中,在确定服务器设备发生故障之后,故障检测方法还包括:将发生故障的服务器设备标识以及故障信息发送至目标系统,以使目标系统根据故障的服务器设备标识以及故障信息生成告警信息。
[0011]第二方面,本专利技术实施例提供了一种故障检测装置,装置包括:第一获取模块,用于获取服务器设备在当前时间点的第一运行数据;第二获取模块,用于获取第一运行数据中位于目标置信区间外的第二运行数据,目标置信区间包括根据当前时间点对应的历史时间点的历史运行数据确定的置信区间;输入模块,用于将第二运行数据输入至训练完成的异常检测模型,通过异常检测模型检测第二运行数据中是否为异常数据,得到检测结果;第一确定模块,用于在检测结果指示第二运行数据为异常数据的情况下,确定异常数据是否满足预设的故障条件;第二确定模块,用于在异常数据满足预设的故障条件的情况下,确定服务器设备发生故障。
[0012]在一些实施方式中,故障检测装置还包括:第三获取模块,在获取第一运行数据中位于置信区间外的第二运行数据之前,用于获取当前时间点对应的多个历史时间点的历史运行数据;当前时间点与历史时间点为位于不同周期的相同位置的时间点;第三确定模块,用于将历史运行数据在概率分布下的置信区间确定为目标置信区间。
[0013]在一些实施方式中,第二确定模块包括:记录单元,用于在异常数据与基准值的差值满足第一预设阈值的情况下,记录异常数据;确定单元,用于在记录的异常数据数量满足第二预设阈值的情况下,确定异常数据满足预设的故障条件。
[0014]在一些实施方式中,故障检测装置还包括:第三获取模块,用于在获取服务器设备在当前时间点的第一运行数据之后,获取第一运行数据中位于目标置信区间内的第三运行数据;修改模块,用于在第三运行数据对应的服务器设备为故障的状态下,将故障状态修改为正常状态。
[0015]在一些实施方式中,故障检测装置还包括:发送模块,用于在确定服务器设备发生故障之后,将发生故障的服务器设备标识以及故障信息发送至目标系统,以使目标系统根据故障的服务器设备标识以及故障信息生成告警信息。
[0016]第三方面,本专利技术实施例提供了一种电子设备,该电子设备包括:处理器以及存储
有计算机程序指令的存储器;处理器执行计算机程序指令时实现如第一方面的任一项实施例中的故障检测方法的步骤。
[0017]第四方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的任一项实施例中的故障检测方法的步骤。
[0018]第五方面,本专利技术实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面任一项实施例中的故障检测方法。
[0019]本专利技术实施例的故障检测方法、装置、设备及计算机可读存储介质,通过获取与当前时间点对应的历史时间点的历史运行数据,然后通过获取的历史运行数据确定历史运行数据对应的置信区间,然后将位于置信区间外的第一运行数据中的第二运行数据输入至训练完成的异常检测模型中,在异常检测模型确定第二运行数据为异常数据的情况下,确定异常数据是否满足故障条件,进而确定服务器设备是否发生故障。如此,由于是首先通过置信区间对第一运行数据中的第二运行数据进行筛选,所以避免了将所有收集的第一运行数据输入异常检测模型造成的异常检测模型运算量过大的问题,由于是通过异常检测模型对第二运行数据是否为异常数据进行判定,所以能够使得对异常数据的判定更加准确,进一步的,提高了服务器设备故障检测的效率和准确率。
附图说明
[0020]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术实施例提供的故障检测方法的一实施例的流程示意图;图2是本专利技术实施例提供的故障检测装置的一实施例的结构示意图;图3是本专利技术实施例提供的电子设备的一实施例的结构示意图。
具体实施方式
[0022]下面将详细描述本专利技术的各个方面的特征和示例性实施例,为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本专利技术进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本专利技术,而不是限定本专利技术。对于本领域技术人员来说,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种故障检测方法,其特征在于,所述方法包括:获取服务器设备在当前时间点的第一运行数据;获取第一运行数据中位于目标置信区间外的第二运行数据,所述目标置信区间包括根据当前时间点对应的历史时间点的历史运行数据确定的置信区间;将所述第二运行数据输入至训练完成的异常检测模型,通过所述异常检测模型检测所述第二运行数据中是否为异常数据,得到检测结果;在所述检测结果指示所述第二运行数据为异常数据的情况下,确定所述异常数据是否满足预设的故障条件;在所述异常数据满足所述预设的故障条件的情况下,确定所述服务器设备发生故障。2.根据权利要求1所述的方法,其特征在于,在所述获取第一运行数据中位于置信区间外的第二运行数据之前,所述方法还包括:获取所述当前时间点对应的多个历史时间点的历史运行数据;所述当前时间点与所述历史时间点为位于不同周期的相同位置的时间点;将所述历史运行数据在概率分布下的置信区间确定为目标置信区间。3.根据权利要求1所述的方法,其特征在于,所述确定所述异常数据是否满足预设的故障条件,具体包括:在所述异常数据与基准值的差值满足第一预设阈值的情况下,记录所述异常数据;在所述记录的异常数据数量满足第二预设阈值的情况下,确定所述异常数据满足预设的故障条件。4.根据权利要求1所述的方法,其特征在于,在所述获取服务器设备在当前时间点的第一运行数据之后,所述方法还包括:获取第一运行数据中位于所述目标置信区间内的第三运行数据;在所述第三运行数据对应的服务器设备为故障的状态下,将故障状态修改为正常状态。5.根据权利要求1所述的方法,其特征在于,在所述确定所述服务器设备发生故障之后,所述方法还包括:将所述发生故障的服务器设备标识以及故障信息发送至目标系统,以使所述目标系统根据所述故障的服务器设备标识以及故障信息生成告警信...

【专利技术属性】
技术研发人员:杨平李奇
申请(专利权)人:湖南天云软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1