一种磁盘故障预测方法、装置、设备及介质制造方法及图纸

技术编号:33769869 阅读:31 留言:0更新日期:2022-06-12 14:21
本申请公开了一种磁盘故障预测方法、装置、设备及介质,包括:确定目标待预测磁盘的观测值,确定与观测值对应的标签;将观测值输入至预测网络得到预测概率,基于预测概率确定用于表示目标待预测磁盘当前健康状态的判定结果,根据标签与判定结果确定相应的奖励值,确定预测样本序列;基于预测样本序列计算预测网络的损失函数,在对基于损失函数确定的预测网络的参数进行迭代更新后,重新跳转至确定出目标待预测磁盘的观测值的步骤,直至达到预设迭代次数或预测网络模型收敛,可见,本申请通过控制参与磁盘故障预测的健康盘与故障盘的数量达到均衡,解决了小样本问题,并基于一种弹性奖励机制加大了对磁盘误报的惩罚力度,解决了误报率高的问题。了误报率高的问题。了误报率高的问题。

【技术实现步骤摘要】
一种磁盘故障预测方法、装置、设备及介质


[0001]本专利技术涉及智能运维
,特别涉及一种磁盘故障预测方法、装置、设备及介质。

技术介绍

[0002]在AIOPS(Artificial Intelligence for IT Operations,智能运维)
中,当前的磁盘故障预测方法有以下几种:基于阈值、基于机器学习、基于深度学习等,其中,基于阈值进行磁盘故障预测的方法较为保守,准确率低;基于机器学习和深度学习的模型需要大量的数据进行训练,受限于好盘多,坏盘少,即小样本问题,准确率较低。此外,由于磁盘误报带来的检测成本或者换盘成本很高,因此,误报率需要得到有效控制。
[0003]为此,如何解决磁盘故障预测中的小样本问题,以及降低误报率是本领域亟待解决的问题。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种磁盘故障预测方法、装置、设备及介质,能够解决磁盘故障预测中的小样本问题,以及降低误报率,其具体方案如下:
[0005]第一方面,本申请公开了一种磁盘故障预测方法,包括:
[0006]确定出目标待预测磁盘的观测值,然后确定出与所述观测值对应的标签,其中,所述标签用于表示所述待预测磁盘的原始健康状态;
[0007]将所述观测值输入至预先构建的预测网络,得到预测概率,并基于所述预测概率确定用于表示所述目标待预测磁盘当前健康状态的判定结果,根据所述标签与所述判定结果确定出相应的奖励值,然后确定相应的预测样本序列;
[0008]基于所述预测样本序列计算所述预测网络的损失函数,并在利用梯度下降算法对基于所述损失函数确定的所述预测网络的参数进行迭代更新后,重新跳转至所述确定出目标待预测磁盘的观测值的步骤,直至达到预设迭代次数或预测网络模型收敛。
[0009]可选的,所述确定出目标待预测磁盘的观测值,然后确定出与所述观测值对应的标签,包括:
[0010]确定目标待预测磁盘的滑动窗口长度,并确定所述待预测磁盘在所述滑动窗口长度内的预设特征值;
[0011]基于所述预设特征值与预设特征数量确定出预设特征矩阵,并将所述预设特征矩阵确定为所述目标待预测磁盘的观测值,然后将所述滑动窗口长度中目标窗口对应的所述待预测磁盘的健康状态确定为与所述观测值对应的标签。
[0012]可选的,所述基于所述预测概率确定用于表示所述待预测磁盘当前健康状态的判定结果,包括:
[0013]当所述预测概率大于预设判定值,则所述判定结果对应的健康状态为故障;
[0014]当所述预测概率小于所述预设判定值,则所述判定结果对应的健康状态为健康。
[0015]可选的,所述根据所述标签与所述判定结果确定出相应的奖励值,包括:
[0016]若所述标签对应的原始健康状态为健康,并且所述判定结果对应的当前健康状态为健康,则给予第一正向奖励;
[0017]若所述标签对应的原始健康状态为健康,并且所述判定结果对应的当前健康状态为故障,则给予第一负向奖励;
[0018]若所述标签对应的原始健康状态为故障,并且所述判定结果对应的当前健康状态为健康,则给予第二负向奖励;
[0019]若所述标签对应的原始健康状态为故障,并且所述判定结果对应的当前健康状态为故障,则给予第二正向奖励;
[0020]其中,所述第一正向奖励和所述第二负向奖励的绝对值相同,并且,所述第一负向奖励、所述第二正向奖励和所述第一正向奖励的绝对值依次递减。
[0021]可选的,所述确定相应的预测样本序列,包括:
[0022]确定预测样本数量,然后生成由所述预测样本数量个预测样本构成的预测样本序列,其中,所述预测样本由所述观测值、所述标签、所述预测概率、所述判定结果以及所述奖励值确定生成。
[0023]可选的,所述确定预测样本数量,包括:
[0024]确定所述目标待预测磁盘的生命周期,根据所述目标待预测磁盘的生命周期以及所述目标待预测磁盘的滑动窗口长度确定出预测样本数量。
[0025]可选的,所述确定出目标待预测磁盘的观测值,然后确定出与所述观测值对应的标签,其中,所述标签用于表示所述待预测磁盘的原始健康状态之前,还包括:
[0026]利用最大最小值归一化的方法,对所有所述待预测磁盘的预设特征值进行归一化处理。
[0027]第二方面,本申请公开了一种磁盘故障预测装置,包括:
[0028]观测值与标签确定模块,用于确定出目标待预测磁盘的观测值,然后确定出与所述观测值对应的标签,其中,所述标签用于表示所述待预测磁盘的原始健康状态;
[0029]预测样本序列确定模块,用于将所述观测值输入至预先构建的预测网络,得到预测概率,并基于所述预测概率确定用于表示所述目标待预测磁盘当前健康状态的判定结果,根据所述标签与所述判定结果确定出相应的奖励值,然后确定相应的预测样本序列;
[0030]更新模块,用于基于所述预测样本序列计算所述预测网络的损失函数,并在利用梯度下降算法对基于所述损失函数确定的所述预测网络的参数进行迭代更新后,重新跳转至所述确定出目标待预测磁盘的观测值的步骤,直至达到预设迭代次数或预测网络模型收敛。
[0031]第三方面,本申请公开了一种电子设备,包括:
[0032]存储器,用于保存计算机程序;
[0033]处理器,用于执行所述计算机程序,以实现前述公开的磁盘故障预测方法。
[0034]第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的磁盘故障预测方法。
[0035]可见,本申请公开了一种磁盘故障预测方法,包括:确定出目标待预测磁盘的观测值,然后确定出与所述观测值对应的标签,其中,所述标签用于表示所述待预测磁盘的原始
健康状态;将所述观测值输入至预先构建的预测网络,得到预测概率,并基于所述预测概率确定用于表示所述目标待预测磁盘当前健康状态的判定结果,根据所述标签与所述判定结果确定出相应的奖励值,然后确定相应的预测样本序列;基于所述预测样本序列计算所述预测网络的损失函数,并在利用梯度下降算法对基于所述损失函数确定的所述预测网络的参数进行迭代更新后,重新跳转至所述确定出目标待预测磁盘的观测值的步骤,直至达到预设迭代次数或预测网络模型收敛,如此一来,本申请通过控制参与磁盘故障预测的健康盘与故障盘的数量达到均衡,解决了小样本问题,并基于一种弹性奖励机制加大了对磁盘误报的惩罚力度,解决了误报率高的问题。
附图说明
[0036]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0037]图1为本申请公开的一种磁盘故障预测方法流程图;
[0038]图2为本申请公开的一种具体的磁本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种磁盘故障预测方法,其特征在于,包括:确定出目标待预测磁盘的观测值,然后确定出与所述观测值对应的标签,其中,所述标签用于表示所述待预测磁盘的原始健康状态;将所述观测值输入至预先构建的预测网络,得到预测概率,并基于所述预测概率确定用于表示所述目标待预测磁盘当前健康状态的判定结果,根据所述标签与所述判定结果确定出相应的奖励值,然后确定相应的预测样本序列;基于所述预测样本序列计算所述预测网络的损失函数,并在利用梯度下降算法对基于所述损失函数确定的所述预测网络的参数进行迭代更新后,重新跳转至所述确定出目标待预测磁盘的观测值的步骤,直至达到预设迭代次数或预测网络模型收敛。2.根据权利要求1所述的磁盘故障预测方法,其特征在于,所述确定出目标待预测磁盘的观测值,然后确定出与所述观测值对应的标签,包括:确定目标待预测磁盘的滑动窗口长度,并确定所述待预测磁盘在所述滑动窗口长度内的预设特征值;基于所述预设特征值与预设特征数量确定出预设特征矩阵,并将所述预设特征矩阵确定为所述目标待预测磁盘的观测值,然后将所述滑动窗口长度中目标窗口对应的所述待预测磁盘的健康状态确定为与所述观测值对应的标签。3.根据权利要求1所述的磁盘故障预测方法,其特征在于,所述基于所述预测概率确定用于表示所述待预测磁盘当前健康状态的判定结果,包括:当所述预测概率大于预设判定值,则所述判定结果对应的健康状态为故障;当所述预测概率小于所述预设判定值,则所述判定结果对应的健康状态为健康。4.根据权利要求1所述的磁盘故障预测方法,其特征在于,所述根据所述标签与所述判定结果确定出相应的奖励值,包括:若所述标签对应的原始健康状态为健康,并且所述判定结果对应的当前健康状态为健康,则给予第一正向奖励;若所述标签对应的原始健康状态为健康,并且所述判定结果对应的当前健康状态为故障,则给予第一负向奖励;若所述标签对应的原始健康状态为故障,并且所述判定结果对应的当前健康状态为健康,则给予第二负向奖励;若所述标签对应的原始健康状态为故障,并且所述判定结果对应的当前健康状态为故障,则给予第二正向奖励;其中,所述第一正向奖励和所述第二...

【专利技术属性】
技术研发人员:王团结曹琪李强
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1