System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种预测硬盘异常状态的系统技术方案_技高网

一种预测硬盘异常状态的系统技术方案

技术编号:40328380 阅读:11 留言:0更新日期:2024-02-09 14:21
本发明专利技术为一种预测硬盘异常状态的系统,涉及数据处理技术领域,包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标硬盘数据列表集,对目标硬盘数据集进行特征筛选,获取第一硬盘数据列表和第二硬盘数据列表,第一硬盘数据列表输入至第一模块中,获取第三硬盘数据列表,将第二硬盘数据列表和第三硬盘数据列表输入至第二模块,获取目标硬盘对应的标签数据,本发明专利技术能够捕获硬盘异常状态之前的异常信息,使得正负样本数据更加平衡;在获取到硬盘对应的SMART数据进行特征筛选使得获取到的硬盘数据更加有效,提高了预测硬盘异常状态模型的准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别是涉及一种预测硬盘异常状态的系统


技术介绍

1、作为经济社会数字化转型的存储保障设施,云存储系统通过硬盘来提供数据存储服务,考虑到预期寿命和成本等因素,机械硬盘为当前主要的存储媒介,硬盘在运行过程中出现异常状态即出现故障是不可避免的,但硬盘在运行周期内大多处于正常状态,异常状态发生概率较小,造成了正负样本即异常状态数据和非异常状态数据不平衡问题,从而对预测硬盘异常状态产生影响。

2、现有技术中,预测硬盘异常状态的方法为:首先构建第一分类器训练、识别恶化窗口,并标记开始显示故障迹象的时间序列窗口,利用gan生成故障硬盘数据,然后构建第二分类器预测硬盘故障。

3、综上,预测硬盘异常状态的方法存在的问题为:smart数据仅异常状态当天被标记为异常状态,无法捕获异常状态之前的异常状态信息,易造成异常状态数据的缺失,造成正负样本数据的不平衡问题;在获取到硬盘对应的smart数据后未进行特征筛选容易额外引入噪音,降低预测硬盘异常状态模型的准确性。


技术实现思路

1、针对上述技术问题,本专利技术采用的技术方案为:一种预测硬盘异常状态的系统,系统包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:

2、一种预测硬盘异常状态的系统,系统包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:

3、s100,获取目标硬盘对应的目标硬盘数据列表集,其中,所述目标硬盘为待检测硬盘,所述目标硬盘数据列表集包括若干个目标硬盘数据列表,所述目标硬盘数据列表包括若干个目标硬盘数据,所述目标硬盘数据为基于初始硬盘运行特征获取到的目标硬盘对应的smart数据,其中,所述初始硬盘运行特征为硬盘在运行时表征出的特征。

4、s200,根据目标硬盘数据列表集,获取第一硬盘数据列表和第二硬盘数据列表,其中,所述第一硬盘数据列表包括若干个第一硬盘数据,所述第一硬盘数据为从目标硬盘数据列表中获取到的仅包括目标硬盘运行特征且处于异常状态的smart数据,所述第二硬盘数据列表包括若干个第二硬盘数据,所述第二硬盘数据为从目标硬盘数据列表中获取到的仅包括目标硬盘运行特征且除第一硬盘数据之外的smart数据,其中,在s200中通过如下步骤获取目标硬盘运行特征。

5、s201,获取关键硬盘数据列表集a={a1,……,ai,……,an},ai={ai1,……,aij,……,aim},其中,aij为第i个关键硬盘对应的第j个关键硬盘数据列表,所述关键硬盘数据列表包括若干个关键硬盘数据,所述关键硬盘数据为基于初始硬盘运行特征获取到的关键硬盘对应的smart数据,j=1……m,m为初始硬盘运行特征的数量,i=1……n,n为关键硬盘的数量,所述关键硬盘为存在异常状态的用于训练获取目标硬盘运行特征的硬盘。

6、s203,根据a,获取a对应的候选得分列表集b={b1,……,bi,……,bn},bi={bi1,……,bir,……,bis},bir={bir1,……,birj,……,birm},birj为ai对应的第r类候选得分列表中的第j个候选得分,r=1……s,s为候选得分类型的数量,其中,所述候选得分为基于a利用不同的特征重要性获取算法获取到的每个初始硬盘运行特征对应的得分。

7、s205,根据a和b,获取候选优先级列表d0={d01,……,d0j,……,d0m},d0j为第j个初始硬盘运行特征对应的候选优先级,其中,d0j符合如下条件:

8、,ωirj为birj对应的数值中小数部分从小数第一位开始到第一个非零的数所包括的数字的数量,ɛirj为将bir中的候选得分按照从大到小的顺序进行排序后birj所在位置对应的序号。

9、s207,根据d0,获取目标优先级列表d={d1,……,di,……,dn},di为第i个初始硬盘运行特征对应的目标优先级,其中,di符合如下条件:

10、di=(d0i-d1)/(d2-d1),其中,d1为d0中最小的候选优先级,d2为d0中最大的候选优先级。

11、s209,当di≥fd时,获取对应的初始硬盘运行特征为目标硬盘运行特征,其中,fd为预设的优先级阈值。

12、s300,将第一硬盘数据列表输入至第一模块中,获取第三硬盘数据列表,其中,所述第三硬盘数据列表包括若干个第三硬盘数据,所述第三硬盘数据为对第一硬盘数据进行数据增强获取到的数据,所述第一模块为进行数据增强的模块。

13、s400,将第二硬盘数据列表和第三硬盘数据列表输入至第二模块,获取目标硬盘对应的标签数据以实现对目标硬盘异常状态的预测,其中,所述第二模块为获取目标硬盘标签数据的模块。

14、本专利技术与现有技术相比具有明显的有益效果,借由上述技术方案,本专利技术提供的一种预测硬盘异常状态的系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:

15、本专利技术为一种预测硬盘异常状态的系统,包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标硬盘对应的目标硬盘数据列表集,根据目标硬盘数据列表集,获取第一硬盘数据列表和第二硬盘数据列表,其中,所述第一硬盘数据为从目标硬盘数据列表中获取到的仅包括目标硬盘运行特征且处于异常状态的smart数据,所述获取目标硬盘运行特征的获取方式为:获取关键硬盘数据列表集,根据关键硬盘数据列表集,获取关键硬盘数据列表集对应的候选得分列表集,根据关键硬盘数据列表集和候选得分列表集,获取候选候选优先级列表,根据候选优先级列表获取目标优先级列表,根据目标优先级列表,获取到目标硬盘运行特征,将第一硬盘数据列表输入至第一模块中,获取第三硬盘数据列表,将第二硬盘数据列表和第三硬盘数据列表输入至第二模块,获取目标硬盘对应的标签数据以实现对目标硬盘异常状态的预测,本专利技术能够捕获到硬盘异常状态之前的异常状态信息,不易造成异常状态数据的缺失,从而在数据增强过程中保留了硬盘异常状态之前的异常状态信息,使得正负样本数据更加平衡;在获取到硬盘对应的smart数据进行特征筛选使得获取到的硬盘数据更加有效,提高了预测硬盘异常状态模型的准确性。

16、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。

本文档来自技高网...

【技术保护点】

1.一种预测硬盘异常状态的系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,ɛirj的取值范围为1到m。

3.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,FD的取值范围为0.05~0.1。

4.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,s=5,其中,当r=1时,Bi1j为第i个关键硬盘基于第j个初始硬盘运行特征对应的数据与关键硬盘对应的标签数据之间关系强度获取到的得分,当r=2时,Bi2j为第i个关键硬盘基于第j个初始硬盘运行特征对应的数据与关键硬盘对应的标签数据之间相关方向获取到的得分,当r=3时,Bi3j为基于随机森林模型获取到的第i个关键硬盘在第j个初始硬盘运行特征对应的数据中加入噪声数据后分类精度降低的程度,当r=4时,Bi4j为基于XGBoot模型获取到的第i个关键硬盘对应的第j个初始硬盘运行特征对应的得分,当r=5时,Bi5j为基于Relief特征选择算法获取到的第i个关键硬盘对应的第j个初始硬盘运行特征对应的得分。

5.根据权利要求4所述的预测硬盘异常状态的系统,其特征在于,当硬盘处于异常状态时,标签数据为“1”;当硬盘处于正常状态时,标签数据为“0”。

6.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,在S300中通过如下步骤获取第一模块:

7.根据权利要求6所述的预测硬盘异常状态的系统,其特征在于,所述编码函数和解码函数通过LSTM模型实现。

...

【技术特征摘要】

1.一种预测硬盘异常状态的系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,ɛirj的取值范围为1到m。

3.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,fd的取值范围为0.05~0.1。

4.根据权利要求1所述的预测硬盘异常状态的系统,其特征在于,s=5,其中,当r=1时,bi1j为第i个关键硬盘基于第j个初始硬盘运行特征对应的数据与关键硬盘对应的标签数据之间关系强度获取到的得分,当r=2时,bi2j为第i个关键硬盘基于第j个初始硬盘运行特征对应的数据与关键硬盘对应的标签数据之间相关方向获取到的得分,当r=3时,bi3j为基于...

【专利技术属性】
技术研发人员:李国侯雪雪李静
申请(专利权)人:中国民航大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1