硬盘故障预测方法、计算设备及存储介质技术

技术编号:36809596 阅读:32 留言:0更新日期:2023-03-09 00:36
本申请实施例公开了一种硬盘故障预测方法、计算设备及存储介质,该方法包括:获取第一HDD的工作参数,该工作参数为在该第一HDD响应IO请求的过程中该第一HDD的内部硬件反映的参数;若该工作参数与该工作参数的标准值之间的关系满足对应预设条件,则对该第一HDD内的数据进行重构。通过在该工作参数和该标准值之间的关系满足对应预设条件时,确定该第一HDD即将达到发生故障的临界点,然后对该第一HDD内的数据进行重构,从而可以避免第一HDD内部硬件的故障带来的短时间内的频繁报错,保障计算设备的数据安全和业务开展。设备的数据安全和业务开展。设备的数据安全和业务开展。

【技术实现步骤摘要】
硬盘故障预测方法、计算设备及存储介质


[0001]本申请涉及硬盘检测
,具体涉及一种硬盘故障预测方法、计算设备及存储介质。

技术介绍

[0002]自我监测分析与报告技术(self

monitoring analysis and reporting technology,SMART)作为一种自动监控机械硬盘(Hard Disk Drive,HDD)驱动器完好状况和报告潜在问题的技术标准,是HDD普遍采用的数据安全技术。通过对HDD的硬件如磁头、盘片、马达、电路的运行情况进行监控、记录并与厂商所设定的预设安全值进行比较,若监控情况将或已超出预设安全值的安全范围,就可以通过主机的监控硬件或软件自动向用户做出警告并进行轻微的自动修复,以提前保障硬盘数据的安全。
[0003]当前的硬盘故障预测方法中,通常采用SMART参数中的报错参数作为故障预测或故障判断的依据,该报错参数也即是由硬盘的输入/输出(input/output,IO)错误引起数值变化的参数。
[0004]HDD内部存在纠错机制,通常在纠错能力范围内HDD可以正常响应IO请求,此时SMART参数还未达到预设安全值。然而,当HDD的健康状况进一步恶化,造成故障的报错参数超过HDD纠错能力,也即达到预设安全值时,可能会导致HDD在短时间集中出现多个IO错误,从而影响计算设备的业务开展。

技术实现思路

[0005]本申请提供一种硬盘故障预测方法及相关设备,用于在硬盘的内部硬件达到发生故障的临界点前尽可能地预测故障并处理,避免内部硬件的故障带来的短时间内的频繁报错,保障计算设备的业务开展。
[0006]第一方面,本申请提供了一种硬盘故障预测方法,应用于计算设备,该方法包括:
[0007]获取第一HDD的工作参数,该工作参数为在该第一HDD响应IO请求的过程中该第一HDD的内部硬件反映的参数;
[0008]若该工作参数与该工作参数的标准值之间的关系满足对应预设条件,则对该第一HDD内的数据进行重构。
[0009]本申请中,通过获取HDD内部硬件在第一HDD响应IO请求时反映的工作参数,并根据该工作参数、对应的标准值和对应预设条件确定第一HDD的工作状态;当该工作参数和该标准值之间的关系满足对应预设条件时,计算设备可以确定该第一HDD即将达到发生故障的临界点,然后对该第一HDD内的数据进行重构,从而可以避免第一HDD内部硬件的故障带来的短时间内的频繁报错,保障计算设备的数据安全和业务开展。
[0010]在一种可能的实现中,该标准值为该第一HDD出厂时的该工作参数。
[0011]本申请中,通过以出厂时的工作参数作为标准值,在第一HDD工作时可以检测实时的工作参数与出厂时的工作参数之间的偏差是否超过容忍阈值,从而判断第一HDD是否处
于即将发生故障的状态,以及是否需要重构数据,能够准确地判断第一HDD的状态。
[0012]在一种可能的实现中,该标准值为多个与该第一HDD相同型号的第二HDD在无故障状态下的对应该工作参数的平均值。
[0013]本申请中,通过以多个无故障状态下的相同型号的第二HDD的工作参数的平均值作为标准值,可以参考该多个第二HDD的工作环境、持续工作时间以及工作负载等因素,避免这些因素影响对当前第一HDD的状态的判断,使得判断结果更准确。
[0014]在一种可能的实现中,该工作参数包括该第一HDD的磁头的飞行高度,该飞行高度的标准值为标准飞行高度;该若该工作参数与该工作参数的标准值之间的关系满足对应预设条件,则对该第一HDD内的数据进行重构,包括:若在过去的第一预设时间段内,该磁头偏离该标准飞行高度的偏离时间和该第一预设时间段的比例大于等于第一比例,则对该第一HDD内的数据进行重构;其中,该磁头偏离该标准飞行高度是指该飞行高度与该标准飞行高度的差的绝对值大于第一阈值。
[0015]本申请中,通过监控磁头飞行的偏离时间与该第一预设时间段的比例,可以有效防止磁头的飞行高度突然过高或过低导致IO读写发生连续错误,影响业务开展的情况。
[0016]在一种可能的实现中,该若在过去的第一预设时间段内,该磁头偏离该标准飞行高度的偏离时间和该第一预设时间段的比例大于等于第一比例,则对该第一HDD内的数据进行重构,包括:若在该第一预设时间段内,该偏离时间和该第一预设时间段的比例大于等于该第一比例,且在过去的第二预设时间段内,该偏离时间和该第二预设时间段的比例大于等于第二比例,则对该第一HDD内的数据进行重构;其中该第二预设时间段短于该第一预设时间段,该第二比例大于该第一比例。
[0017]本申请中,通过约束在过去第二预设时间段内的偏离时间大于等于第二比例时才执行对第一HDD中数据的重构,能够准确地判定磁头飞行高度偏离标准飞行高度的现象未被修复或解决,避免误判导致不必要的数据重构。
[0018]在一种可能的实现中,该若在过去的第一预设时间段内,该磁头偏离该标准飞行高度的偏离时间和该第一预设时间段的比例大于等于第一比例,则对该第一HDD内的数据进行重构,包括:若在该第一预设时间段内,该偏离时间和该第一预设时间段的比例等于1,则对该第一HDD内的数据进行重构。
[0019]本申请中,通过在磁头偏离所述标准飞行高度的偏离时间和第一预设时间段的比例等于1时对该第一HDD内的数据进行重构,能够提高计算设备对第一HDD的状态判断的准确性,减少误判导致不必要的数据重构。
[0020]在一种可能的实现中,该工作参数包括该第一HDD的磁头的磁阻,该磁阻的标准值为标准磁阻;该若该工作参数与该工作参数的标准值之间的关系满足对应预设条件,则对该第一HDD内的数据进行重构,包括:若该磁阻与该标准磁阻的差的绝对值大于第二阈值,则对该第一HDD内的数据进行重构。
[0021]其中,磁头的磁阻是指当前磁头的初始电阻与出厂时的初始电阻之间的相对变化数值,可以以百分比表示;初始电阻是指磁头在没有磁场影响下的电阻。
[0022]本申请中,通过监控磁头磁阻可以有效防止磁头的初始电阻变化过大,在同一磁信号强度下读取到不同的信号,导致IO读写发生连续错误,影响业务开展的情况。
[0023]在一种可能的实现中,该工作参数包括该第一HDD的输入输出IO平均时延,该IO平
均时延的标准值为标准时延;该若该工作参数与该工作参数的标准值之间的关系满足对应预设条件,则对该第一HDD内的数据进行重构,包括:若该IO平均时延大于第三阈值,则对该第一HDD内的数据进行重构。
[0024]本申请中,通过监控第一HDD的IO平均时延,在该IO平均时延过高时重构数据,可以有效防止第一HDD的内部硬件磨损或故障导致IO平均时延过高损害业务性能,影响业务开展。
[0025]在一种可能的实现中,每个工作参数对应的预设条件包括第一条件和第二条件;若一个工作参数与该工作参数的标准值之间的关系满足对应第一条件,则计算设备可以对该第一HDD的数据进行重构;若至少两个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种硬盘故障预测方法,其特征在于,所述方法包括:获取第一机械硬盘HDD的工作参数,所述工作参数为在所述第一HDD响应IO请求的过程中所述第一HDD的内部硬件反映的参数;若所述工作参数与所述工作参数的标准值之间的关系满足对应预设条件,则对所述第一HDD内的数据进行重构。2.根据权利要求1所述的方法,其特征在于,所述标准值为所述第一HDD出厂时的所述工作参数。3.根据权利要求1所述的方法,其特征在于,所述标准值为多个与所述第一HDD相同型号的第二HDD在无故障状态下的对应所述工作参数的平均值。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述工作参数包括所述第一HDD的磁头的飞行高度,所述飞行高度的标准值为标准飞行高度;所述若所述工作参数与所述工作参数的标准值之间的关系满足对应预设条件,则对所述第一HDD内的数据进行重构,包括:若在过去的第一预设时间段内,所述磁头偏离所述标准飞行高度的偏离时间和所述第一预设时间段的比例大于等于第一比例,则对所述第一HDD内的数据进行重构;其中,所述磁头偏离所述标准飞行高度是指所述飞行高度与所述标准飞行高度的差的绝对值大于第一阈值。5.根据权利要求4所述的方法,其特征在于,所述若在过去的第一预设时间段内,所述磁头偏离所述标准飞行高度的偏离时间和所述第一预设时间段的比例大于等于第一比例,则对所述第一HDD内的数据进行重构,包括:若在所述第一预设时间段内,所述偏离时间和所述第一预设时间段的比例大于等于所述第一比例,且在过去的第二预设时间段内,所述偏离时间和所述第二预设时间段的比例大于等于第二比例,则对所述第一HDD内的数据进行重构;其中所述第二预设时间段短于所述第一预设时间段,所述第二比例大于所述第一比例。6.根据权利要求4所述的方法,其特征在于,所述若在过去的第一预设时间段内,所述磁头偏离所述标准飞行高度的偏离时间和所述第一预设时间段的比例大于等于第一比例,则对所述第一HDD内的数据进行重构,包括:若在所述第一预设时间段内,所述偏离时间和所述第一预设时间段的比例等于1,则...

【专利技术属性】
技术研发人员:王振华
申请(专利权)人:超聚变数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1