【技术实现步骤摘要】
存储装置的故障预测方法和装置
[0001]本申请涉及一种存储
,更具体地,涉及一种存储装置的故障预测方法和装置。
技术介绍
[0002]随着存储技术的发展,大量的存储装置被广泛使用。如果存储装置出现故障,则可能会给用户带来巨大损失。例如,基于闪存的固态硬盘(SSD)作为一种高性能存储介质,已经替代了传统的机械硬盘被广泛的应用于大规模数据中心,不幸的是,近年来闪存密度的增加也使得SSD可靠性降低,例如,数据中心的SSD的故障可导致停机,甚至是数据丢失。因此,如果对SSD故障提前进行预测并进行相应处理,则可以保证数据中心的稳定性,从而降低用户的损失。SMART数据是指硬盘内部管理器通过对硬盘自身进行监测和分析而生成的状态报告,该状态报告可包括硬盘健康度和硬盘异常信息,因此可以通过分析SMART数据对SSD故障进行预测。相关技术的基于SMART数据对SSD进故障预测的方法通常不适用于SSD,需要供应商根据专业领域的先验知识提供的SMART属性值的正常范围,并且目前存在训练正负样本不均衡以及预测模型老化的问题,限制了故障预测准 ...
【技术保护点】
【技术特征摘要】
1.一种存储装置的故障预测方法,包括:将实时采集的所述存储装置的SMART数据输入到多个基分类模型中的每个基分类模型,以获取每个基分类模型输出的针对实时采集的所述存储装置的SMART数据的分类结果,其中,每个基分类模型利用多个存储装置的历史SMART数据和/或在线采集的所述多个存储装置的SMART数据训练而获得;基于多个基分类模型的分类结果确定实时采集的所述存储装置的SMART数据是健康数据还是故障数据;基于预定时间窗口内采集到的所述存储装置的SMART数据被确定为健康数据的SMART数据的数量和被确定为故障数据的SMART数据的数量来预测所述存储装置是否将出现故障。2.如权利要求1所述的方法,其中,每个基分类模型为利用所述多个存储装置的历史SMART数据中的所有故障数据以及所述历史SMART数据中的健康数据的与每个基分类模型相应的第一子集训练而获得的初始基分类模型,其中,所述历史SMART数据中的健康数据被划分为多个第一子集,其中,所述多个第一子集彼此之间无交叉。3.如权利要求2所述的方法,其中,每个基分类模型是通过利用在线获取的所述多个存储装置的SMART数据对所述初始基分类模型进行训练更新而获得更新的基分类模型,其中,获得每个更新的分类模型利用的训练数据为:在当前时刻之前最近获取的针对所述多个存储装置中的处于健康状态的存储装置的SMART数据队列中的最早采集到的SMART数据的与每个更新的基分类模型相应的第二子集,以及在当前时刻之前最近获取的针对所述多个存储装置中的处于故障状态的存储装置的SMART数据队列中的SMART数据,其中,所述SMART数据队列具有预定大小,其中,在当前时刻之前最近获取的针对所述多个存储装置中的处于健康状态的存储装置的SMART数据队列中的最早采集到的SMART数据被划分为多个第二子集,所述多个第二子集彼此不交叉。4.如权利要求1所述的方法,其中,每个基分类模型为长短记忆网络LSTM模型。5.如权利要求2或3所述的方法,还包括:通过训练获得每个基分类模型或者从外部设备接收训练好的每个基分类模型。6.如权利要求1所述的方法,其中,所述预测所述存储装置是否将出现故障的步骤包括:当被确定为故障数据的SMART数据的数量大于被确定为健康数据的SMART数据的数量时,确定所述存储装置将出现故障;和/或,当被确定为故障数据的SMART数据的数量不大于被确定为健康数据的SMART数据的数量时,确定所述存储装置将不出现故障。7.一种存储装置的故障预测装置,包括:分类单元,被配置为将实时采集的所述存储装置的SMART数据输入到多个基分类模型中的每个基分类模型,以获取每个基分类模型输出的针对实时采集的所述存储装置的SMART数据的分类结果,其中,每个基分类模型利用多个存储装置的历史...
【专利技术属性】
技术研发人员:郝雯雯,权勇雄,刘娜,罗寅,高灿奎,斗李宁,王璐,沈荣燮,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。