The invention discloses a hard disk damage prediction method and device based on SMART information and in-depth learning. The method comprises: collecting SMART information of different hard disks at different time periods as original sample data, and selecting two kinds of training sample data, static data and time series data, and filtering training sample data. To extract the effective parameter set related to the hard disk fault and label the training data, at least one neural network model is constructed to study the labeled static data and the labeled time series data in depth, and the corresponding neural network model is obtained. The storage is obtained according to the timing strategy. The SMART information data of the hard disk in the system are extracted and input into the neural network model to predict whether the hard disk will be damaged or not. The invention can accurately detect the mechanical hard disk before it is about to be damaged, so as to replace the hard disk in time before it fails, and can greatly improve the high availability and data security of the data center.
【技术实现步骤摘要】
基于SMART信息和深度学习的硬盘损坏预测方法及装置
本专利技术涉及存储安全
,特别是涉及一种基于硬盘SMART信息和深度学习的硬盘即将损坏的预测方法及装置。
技术介绍
磁盘阵列或存储系统使用大量的机械硬盘,而机械硬盘(下面统称为硬盘)在整个存储系统中属于最容易受损的部件,尽管RAID技术可以有效应对硬盘损坏,但硬盘损坏仍然对系统的可靠性和高可用性带来巨大的影响。硬盘的故障一般分为两种:可预测的(predictable)和不可预测的(unpredictable)。后者偶而会发生,也没有办法去预防它,例如芯片突然失效,机械撞击等。但像电机轴承磨损、盘片磁介质性能下降等都属于可预测的情况,可以在几天甚至几星期前就发现这种不正常的现象。如何能准确预测硬盘损坏,对存储系统的维护和安全起到关键性作用。SMART,全称为“Self-MonitoringAnalysisandReportingTechnology”,即“自我监测、分析及报告技术”,是一种自动的硬盘状态检测与预警系统和规范。通过在硬盘硬件内的检测指令对硬盘的硬件如磁头、盘片、马达、电路的运行情况进行监控、记录并与厂商所设定的预设安全值进行比较,若监控情况将或已超出预设安全值的安全范围,就可以通过主机的监控硬件或软件自动向用户作出警告。SMART信号涉及硬盘工作及磨损状态数十种(超过30)参数,磁盘阵列厂家通常针对每个参数设定一个门阀值进行预警,这种方法虽然简单,但不能准确反映硬盘全局的健康状态,容易导致误报或不报,对磁盘阵列或存储系统的安全无法起到保护作用。随着人工智能在计算机应用领域的发展,深度学 ...
【技术保护点】
1.一种基于SMART信息和深度学习的硬盘损坏预测方法,其特征在于,包括如下步骤:(1)收集不同硬盘在不同时间段的SMART信息数据作为原始样本数据,并从中选取两类训练样本数据,包括静态数据和时间序列数据;所述静态数据包括不同硬盘分别在健康状态下和即将损坏状态下的不同采集时间点的SMART信息数据,所述时间序列数据包括不同硬盘分别在健康状态下和即将损坏状态下的不同采集时间段内的SMART信息数据序列;所述健康状态为距离损坏时间点的时间大于设定的即将损坏天数阈值,即将损坏状态为距离损坏时间点的时间小于设定的即将损坏天数阈值;(2)对训练样本数据进行筛选,从SMART信息数据中提取与硬盘故障相关的有效参数集,并进行健康和即将损坏类别标注得到标注训练数据;(3)分别构建至少一个神经网络模型对标注静态数据和标注时间序列数据进行深度学习,得到相应的优化模型参数的神经网络模型;(4)根据设定的定时策略获取存储系统中硬盘的SMART信息数据,得到静态预测数据和时间序列预测数据,并提取出有效参数集作为步骤(3)得到的相应神经网络模型的输入,根据神经网络模型的输出结果进行综合判断,得到相应硬盘是否即将损 ...
【技术特征摘要】
1.一种基于SMART信息和深度学习的硬盘损坏预测方法,其特征在于,包括如下步骤:(1)收集不同硬盘在不同时间段的SMART信息数据作为原始样本数据,并从中选取两类训练样本数据,包括静态数据和时间序列数据;所述静态数据包括不同硬盘分别在健康状态下和即将损坏状态下的不同采集时间点的SMART信息数据,所述时间序列数据包括不同硬盘分别在健康状态下和即将损坏状态下的不同采集时间段内的SMART信息数据序列;所述健康状态为距离损坏时间点的时间大于设定的即将损坏天数阈值,即将损坏状态为距离损坏时间点的时间小于设定的即将损坏天数阈值;(2)对训练样本数据进行筛选,从SMART信息数据中提取与硬盘故障相关的有效参数集,并进行健康和即将损坏类别标注得到标注训练数据;(3)分别构建至少一个神经网络模型对标注静态数据和标注时间序列数据进行深度学习,得到相应的优化模型参数的神经网络模型;(4)根据设定的定时策略获取存储系统中硬盘的SMART信息数据,得到静态预测数据和时间序列预测数据,并提取出有效参数集作为步骤(3)得到的相应神经网络模型的输入,根据神经网络模型的输出结果进行综合判断,得到相应硬盘是否即将损坏的预测结果。2.根据权利要求1所述的基于SMART信息和深度学习的硬盘损坏预测方法,其特征在于,步骤(2)中提取的与硬盘故障相关的有效参数集包括硬盘基本信息、寻道信息、计数信息和错误信息。3.根据权利要求1所述的基于SMART信息和深度学习的硬盘损坏预测方法,其特征在于,步骤(3)中分别构建一个神经网络模型对标注静态数据进行深度学习,构建两个不同神经网络模型对标注时间序列数据进行深度学习;所构建的神经网络模型类型包括卷积神经网络模型CNN、循环神经网络模型RNN和长短期记忆网络模型LSTM中的一种或多种。4.根据权利要求1所述的基于SMART信息和深度学习的...
【专利技术属性】
技术研发人员:田海蓉,胡晓宇,
申请(专利权)人:南京道熵信息技术有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。