System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种硬盘故障预测方法及系统技术方案_技高网

一种硬盘故障预测方法及系统技术方案

技术编号:41322347 阅读:6 留言:0更新日期:2024-05-13 15:01
本发明专利技术公开了一种硬盘故障预测方法及系统,涉及硬盘预测的技术领域。首先获取若干个硬盘的SMART数据,对所述SMART数据进行预处理,然后对预处理后的SMART数据进行赋值,将得到的SMART数据对应的赋值划分为若干个阈值,根据划分的若干个阈值对硬盘进行若干个健康等级划分,进而构建硬盘故障预测模型,将预处理后的SMART数据划分为训练集与测试集,利用训练集与测试集对硬盘故障预测模型进行故障预测训练与测试,利用训练好的硬盘故障预测模型对待预测的硬盘进行故障预测并将预测结果按健康等级进行分类输出。有效地提高硬盘故障预测的召回率并降低误检测率,从而减轻了硬盘故障预测的工作量。

【技术实现步骤摘要】

本专利技术涉及硬盘预测的,尤其涉及一种硬盘故障预测方法及系统


技术介绍

1、硬盘是目前数据中心使用的主要存储方式之一。然而,硬盘故障是导致数据中心故障的主要原因。硬盘故障不仅会导致数据丢失,还会导致数据中心崩溃,给用户和企业造成不可估量的损失。有效预测硬盘的剩余使用寿命(rul)是数据中心健康管理中的关键因素。管理员可以制定有效的维护计划,确保硬盘能够正常工作,避免系统崩溃。

2、目前,应用于大数据的机器和深度学习算法越来越受欢迎,特别是基于自我监测、分析和报告技术(smart)的模型。在硬盘故障预测中,smart数据是连续的,具有时间依赖性。因此,使用长短期记忆网络(lstm)的深度学习方法来分析这些数据是一种自然的选择,并且可以在预测rul方面获得很好的结果。然而,利用lstm网络的方法仅根据最后一步学习到的特征进行分类,分类较为单一,导致硬盘故障预测准确率较差,从而硬盘使用成本增加。

3、此外,现有硬盘预测技术的计算量较大,在计算能力有限的情况下,导致硬盘故障预测效率较低,且现有的硬盘故障预测技术中的召回率较高,导致误检测率较高,从而硬盘故障预测的工作量增大。现有技术中提出了一种硬盘故障预测方法,首先获取各个硬盘的smart值,将smart值输入训练过的深度信念网络dbn模型,得到各个硬盘的故障预警时间,根据故障预警时间,设置各个硬盘的故障告警级别,解决了硬盘故障预测的准确度低的缺陷,但该方案仍存在计算能力有限,导致硬盘故障预测效率较低,以及召回率较低,导致误检测率较高,从而硬盘故障预测的工作量增大的问题。


技术实现思路

1、为解决现有硬盘预测技术中存在硬盘故障预测效率较低和计算能力有限,导致误检测率较高,从而硬盘故障预测工作量增大的问题,本专利技术提出一种硬盘故障预测方法及系统,有效解决提高了计算能力、硬盘故障预测效率以及召回率,并降低了误检测率,从而减轻了硬盘故障预测的工作量。

2、为实现本专利技术的目的,本专利技术采用如下技术方案实现:

3、一种硬盘故障预测方法,包括以下步骤:

4、s1:获取若干个硬盘的smart数据,对所述smart数据进行预处理;

5、s2:对预处理后的smart数据进行赋值,将得到的smart数据对应的赋值划分为若干个阈值,根据划分的若干个阈值对硬盘进行若干个健康等级划分;

6、s3:构建硬盘故障预测模型,所述硬盘故障预测模型包括:lstm网络层、注意力机制层、额外特征提取层、全连接层以及融合与分类层,将预处理后的smart数据划分为训练集与测试集,利用训练集对硬盘故障预测模型进行故障预测训练,利用测试集对完成每轮次训练的硬盘故障预测模型进行测试,得到训练好的硬盘故障预测模型;

7、s4:利用训练好的硬盘故障预测模型对待预测的硬盘进行故障预测,以步骤s2中每一个健康等级对应的阈值为标准,将硬盘故障预测模型的预测结果按健康等级进行分类输出;

8、s5:根据硬盘故障预测模型输出的健康等级预测结果,对所述硬盘故障预测模型进行评估。

9、在上述技术方案中,对获取的smart数据进行预处理,能够提高所述smart数据在使用过程中的可靠性;然后对预处理后的smart数据进行赋值,能够从数据上直观的了解到不同硬盘的smart数据的区别,根据预处理后的smart数据对硬盘进行若干个健康等级划分,能够有效地将不同使用程度的硬盘进行区分,提升每个硬盘的使用时间,进而减小经济损失;然后利用预处理后的smart数据对构建的硬盘故障预测模型进行训练与测试,得到训练完成的硬盘故障预测模型能够有效地对待预测的硬盘进行故障预测,并以每一个健康等级对应的阈值为标准,将硬盘故障预测模型的预测结果按健康等级进行分类输出,有效地提高了模型的计算能力与硬盘故障预测效率,最后,根据硬盘故障预测模型的预测结果,对硬盘故障预测模型进行评估,保证硬盘故障预测模型的有效性,进而提高硬盘故障预测的召回率,降低误检测率,从而减轻了硬盘故障预测的工作量。

10、进一步地,步骤s1所述的对所述smart数据进行预处理的具体过程为:

11、s11:获取若干个健康硬盘与故障硬盘的smart数据,剔除所述smart数据中的空值点,采用随机森林算法对剔除空值点后的smart数据进行特征筛选,得到若干个特征;

12、s12:对若干个特征对应的smart数据进行正负样本平衡处理。

13、进一步地,步骤s12所述的对若干个特征对应的smart数据进行正负样本平衡处理的过程为:

14、对健康硬盘的smart数据进行欠采样,对故障硬盘的smart数据进行过采样,平衡健康硬盘与故障硬盘的smart数据比例。

15、根据上述技术方案,剔除所述smart数据中的空值点,能够减少零点数据的使用,从而减少计算时间;采用随机森林算法对剔除空值点后的smart数据进行特征筛选,能够避免过拟合,减少训练时间和测试时间,从而得到与硬盘故障数据最相关的若干个特征,进而得到若干个特征对应的smart数据;然后对若干个特征对应的smart数据进行正负样本平衡处理,能够减少smart数据不平衡对硬盘故障预测模型训练过程中的影响。

16、进一步地,步骤s2所述的根据划分的若干个阈值对硬盘进行若干个健康等级划分的具体过程为:

17、采用回归树算法对预处理后的smart数据进行赋值,得到smart数据对应的赋值,将所述smart数据对应的赋值划分为第一阈值、第二阈值、第三阈值以及第四阈值,根据划分的第一阈值、第二阈值、第三阈值以及第四阈值对硬盘进行健康等级划分,处于第一阈值内的硬盘健康等级为健康,处于第二阈值内的硬盘健康等级为良好,处于第三阈值内的硬盘健康等级为警告,处于第四阈值内的硬盘健康等级为报警。

18、根据上述技术方案,对预处理后的smart数据进行赋值,并将smart数据的赋值划分为第一阈值、第二阈值、第三阈值以及第四阈值,能够从数据上直观的了解到不同硬盘的smart数据的区别,根据第一阈值、第二阈值、第三阈值以及第四阈值将硬盘划分为健康、良好、警告以及报警等四个健康等级,能够有效地将不同使用程度的硬盘进行区分,提升每个硬盘的使用时间,进而减小经济损失。

19、进一步地,在步骤s3构建的硬盘故障预测模型中:

20、lstm网络层,用于提取smart数据的时间步长特征,将提取的时间步长特征传输至注意力机制层;

21、注意力机制层,用于根据时间步长特征进行时间步长的重要性度特征提取,并将提取的重要性特征与时间步长特征进行融合,将融合后得到的特征传输至全连接层;

22、额外特征提取层,用于提取smart数据的额外特征,将提取的额外特征传输至全连接层;

23、全连接层,用于分别对融合后的特征与额外特征进行高级特征提取,将提取的高级特征传输至融合与分类层;

24、融合与分类层,用于将高级特征进行融合,本文档来自技高网...

【技术保护点】

1.一种硬盘故障预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的硬盘故障预测方法,其特征在于,步骤S1所述的对所述SMART数据进行预处理的具体过程为:

3.根据权利要求2所述的硬盘故障预测方法,其特征在于,步骤S12所述的对若干个特征对应的SMART数据进行正负样本平衡处理的过程为:

4.根据权利要求3所述的硬盘故障预测方法,其特征在于,步骤S2所述的根据划分的若干个阈值对硬盘进行若干个健康等级划分的具体过程为:

5.根据权利要求4所述的硬盘故障预测方法,其特征在于,在步骤S3构建的硬盘故障预测模型中:

6.根据权利要求5所述的硬盘故障预测方法,其特征在于,步骤S3所述的利用训练集对硬盘故障预测模型进行故障预测训练的具体过程为:

7.根据权利要求6所述的硬盘故障预测方法,其特征在于,利用训练集T1对所述硬盘故障预测模型进行故障预测训练时,采用自适应优化器Adam。

8.根据权利要求7所述的硬盘故障预测方法,其特征在于,步骤S4所述的利用训练好的硬盘故障预测模型对待预测的硬盘进行故障预测的具体过程为:

9.根据权利要求8所述的硬盘故障预测方法,其特征在于,步骤S5所述的对所述硬盘故障预测模型进行评估的过程为:

10.一种硬盘故障预测系统,其特征在于,包括:

...

【技术特征摘要】

1.一种硬盘故障预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的硬盘故障预测方法,其特征在于,步骤s1所述的对所述smart数据进行预处理的具体过程为:

3.根据权利要求2所述的硬盘故障预测方法,其特征在于,步骤s12所述的对若干个特征对应的smart数据进行正负样本平衡处理的过程为:

4.根据权利要求3所述的硬盘故障预测方法,其特征在于,步骤s2所述的根据划分的若干个阈值对硬盘进行若干个健康等级划分的具体过程为:

5.根据权利要求4所述的硬盘故障预测方法,其特征在于,在步骤s3构建的硬盘故障预测模型中:

6.根据权利...

【专利技术属性】
技术研发人员:韩国军张双旺海勤达王勇亮
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1