磁盘故障的预测方法及装置制造方法及图纸

技术编号:23084821 阅读:28 留言:0更新日期:2020-01-11 01:03
本发明专利技术提供了一种磁盘故障的预测方法及装置,其方法包括:对获取到的数据集进行预处理,得到样本特征集;根据所述样本特征集,生成时间序列样本集;对所述时间序列样本集中的每一个单位时间内的样本特征进行小波变换,得到每一个单位时间内的样本特征对应的细节系数;将所述细节系数与时间序列样本中的最后一个单位时间的样本特征进行组合,获得故障预测样本集;选择所述故障预测样本集中的测试样本集输入至磁盘故障预测模型中,得到预测值;其中,所述磁盘故障预测模型为一种改进的梯度提升树算法。通过小波变换具有的时‑频多分辨功能的特点,达到当时间序列为非平稳或非线性的时间序列时,提高对磁盘故障预测的准确率的目的。

Prediction method and device of disk failure

【技术实现步骤摘要】
磁盘故障的预测方法及装置
本专利技术涉及数据存储
,特别涉及一种磁盘故障的预测方法及装置。
技术介绍
随着互联网的发展,云计算和大数据越来越受到大众的重视,而存储系统是大数据集群的重要组成部分,一般情况下存储系统由一个或多个磁盘组成,而磁盘很容易受到软硬件故障的影响。一旦磁盘发生故障,将可能导致用户数据丢失或损坏,给用户和服务供应商,造成巨大的损失。目前,大部分的磁盘在对故障进行预测时,一般采用的故障预测算法都是基于磁盘的硬盘保护技术(Self-MonitoringAnalysisandReportingTechnology,SMART)中选择部分属性进行分析,而采用SMART进行预测时,由于机器学习在分类问题上的突出表现,所以使用机器学习来预测磁盘故障为目前主流的方法。但是,由于磁盘SMART属性数据集是一种时间序列,具有非平稳性和非线性特点,导致在采用机器学习来预测磁盘故障的过程中,对磁盘故障预测的准确率较低。
技术实现思路
有鉴于此,本专利技术实施例提供一种磁盘故障的预测方法及装置,用于当时间序列为非平稳本文档来自技高网...

【技术保护点】
1.一种磁盘故障的预测方法,其特征在于,包括:/n对获取到的数据集进行预处理,得到样本特征集;/n根据所述样本特征集,生成时间序列样本集;其中,所述时间序列样本集中包括所述样本特征集中处于预设时间段内的样本特征;/n对所述时间序列样本集中的每一个单位时间内的样本特征进行小波变换,得到每一个单位时间内的样本特征对应的细节系数;/n将所述细节系数与时间序列样本中的最后一个单位时间的样本特征进行组合,获得故障预测样本集;/n选择所述故障预测样本集中的测试样本集输入至磁盘故障预测模型中,得到预测值;其中,所述磁盘故障预测模型为一种改进的梯度提升树算法。/n

【技术特征摘要】
1.一种磁盘故障的预测方法,其特征在于,包括:
对获取到的数据集进行预处理,得到样本特征集;
根据所述样本特征集,生成时间序列样本集;其中,所述时间序列样本集中包括所述样本特征集中处于预设时间段内的样本特征;
对所述时间序列样本集中的每一个单位时间内的样本特征进行小波变换,得到每一个单位时间内的样本特征对应的细节系数;
将所述细节系数与时间序列样本中的最后一个单位时间的样本特征进行组合,获得故障预测样本集;
选择所述故障预测样本集中的测试样本集输入至磁盘故障预测模型中,得到预测值;其中,所述磁盘故障预测模型为一种改进的梯度提升树算法。


2.根据权利要求1所述的方法,其特征在于,所述对数据集进行预处理,得到样本特征集,包括:
根据磁盘的时间顺序对获取到的数据集进行升序排列,得到待处理数据集;
将所述待处理数据集输入至预设的树形分类器,由所述树形分类器从所述待处理数据集中的多个属性数据中选择权重最高的预设个数的属性数据作为样本特征集。


3.根据权利要求2所述的方法,其特征在于,所述得到待处理数据集之前,还包括:
判断磁盘中的数据是否出现空值;
若判断出所述磁盘中的数据出现空值,则采用零值填充;
若判断出所述磁盘中的数据没有出现空值,则判断所述磁盘中的数据记录次数是否低于预设记录次数;
若判断出所述磁盘中的数据记录次数低于预设记录次数,则删除所述数据记录次数低于预设记录次数的磁盘。


4.根据权利要求1所述的方法,其特征在于,所述磁盘故障预测模型的训练方法,包括:
根据预设的初始样本参数,建立初始预测模型,并将所述初始预测模型确定为当前预测模型;
将所述故障预测样本集中的训练样本集中的数据输入至所述当前预测模型中,得到当前预测值;
比较所述当前预测模型输出的当前预测值和所述训练样本集中对应的真实值,得到比较结果;
根据所述比较结果,判断所述当前预测模型的预测准确率是否满足准确率要求;
若判断出所述当前预测模型的准确率不能满足所述准确率要求,则更新当前预测模型中的样本参数,得到更新后的预测模型;
将所述更新后的预测模型作为当前预测模型,返回执行所述将所述训练样本集中的数据输入至所述当前预测模型中,得到当前预测值;
若判断出所述当前预测模型的准确率满足所述准确率要求,则将所述当前预测模型确定为所述磁盘故障预测模型。


5.根据权利要求4所述的方法,其特征在于,所述将所述细节系数与时间序列样本中的最后一个单位时间的样本特征进行组合,获得故障预测样本集之后,还包括:
对所述故障预测样本集进行归一化处理,得到归一化的故障预测样本集;
将所述归一化的故障预测样本集按照预设的比例划分,得到所述测试样本集和所述训练样本集。


6.一种磁盘故障的预测装置,其特征在于,包括:
预处理单元,用于对获取到的数据集进行预处理,得到样本特...

【专利技术属性】
技术研发人员:来炜国王磊
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1