一种预测非易失性存储介质发生故障的方法及装置制造方法及图纸

技术编号:21453694 阅读:26 留言:0更新日期:2019-06-26 04:42
本发明专利技术涉及计算机技术领域,公开了一种预测非易失性存储介质发生故障的方法及装置:针对数据中心的至少两个非易失性存储介质中的任意一非易失性存储介质,分别执行:计算任意一非易失性存储介质的状况值,状况值用于表征任意一非易失性存储介质的运行状况;确定状况值小于与任意一非易失性存储介质对应的初始预设故障门限值时,预测任意一非易失性存储介质将发生故障;状况值不同的任意两个非易失性存储介质分别对应的初始预设故障门限值不同,在该方案中,状况值不同的非易失性存储介质分别对应不同的初始预设故障门限值,即状况值不同的非易失性存储介质分别对应不同的报警门槛,因此,提高了预测出的发生故障的非易失性存储介质的准确度。

【技术实现步骤摘要】
一种预测非易失性存储介质发生故障的方法及装置
本专利技术涉及计算机
,特别涉及一种预测非易失性存储介质发生故障的方法及装置。
技术介绍
数据存储越来越重要,保证数据可靠性也有非常重要的意义。硬盘仍然是储存数据最常用的存储介质,广泛应用于各类数据中心中,因此,硬盘故障的预测成为现今保证数据可靠性的重要手段,其已经慢慢成为数据中心管理软件中的重要组成部分。数据中心通过检测各个硬盘的运行状况,当硬盘失效或即将失效时启用硬盘报警并隔离,然后开始数据重构。目前的DFP(DiskFailurePrediction,硬盘故障预测)技术是判断硬盘的某些指标是否达到预设门限值,若不达标,则发出报警,认为硬盘将要故障。而硬盘厂商为了减少返修率,一般设置的报警门槛非常低,导致硬盘整体的故障预测率极低,但是,若参考硬盘厂商的报警门槛的话,预测出的硬盘发生故障的准确度较低。为了提高预测硬盘故障的准确度,使用硬盘的数据中心会重新设定报警门槛,从而提高预测硬盘发生故障的准确度。上述方法中数据中心的所有硬盘的报警门槛都相同,但是,数据中心的硬盘的状况是不同的,有些硬盘使用时间较长,有些硬盘使用时间较短,因此,上述方法仍然存在准确度较低的缺陷。
技术实现思路
本专利技术实施例提供一种预测非易失性存储介质发生故障的方法及装置,用以解决现有技术中存在的预测硬盘发生故障的准确度较低的缺陷。本专利技术实施例提供的具体技术方案如下:第一方面,提供一种预测非易失性存储介质发生故障的方法,包括:针对数据中心的至少两个非易失性存储介质中的任意一非易失性存储介质,分别执行:计算所述任意一非易失性存储介质的状况值,所述状况值用于表征所述任意一非易失性存储介质的运行状况;确定所述状况值小于与所述任意一非易失性存储介质对应的初始预设故障门限值时,预测所述任意一非易失性存储介质将发生故障;状况值不同的任意两个非易失性存储介质分别对应的初始预设故障门限值不同。结合第一方面,在第一种可能的实现方式中,预测所述任意一非易失性存储介质将发生故障之后,还包括:确定预测出的将发生故障的所有非易失性存储介质的总数目;判定确定的所述所有非易失性存储介质的总数目小于或者等于所述数据中心的热备非易失性存储介质的数目时,使用所述热备非易失性存储介质中的热备非易失性存储介质接替所述预测出的将发生故障的所有非易失性存储介质的工作;接替所述预测出的将发生故障的所有非易失性存储介质工作的热备非易失性存储介质的数目与所述所有非易失性存储介质的总数目相同。结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,确定预测出的将发生故障的所有非易失性存储介质的总数目之后,还包括:判定确定的所述所有非易失性存储介质的总数目大于所述数据中心的热备非易失性存储介质的数目时,针对所述任意一非易失性存储介质,分别执行:降低所述任意一非易失性存储介质对应的初始预设故障门限值,得到第一预设故障门限值,并确定所述任意一非易失性存储介质的状况值小于所述任意一非易失性存储介质对应的第一预设故障门限值时,进一步预测所述任意一非易失性存储介质将发生故障;当判断出分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质的总数目等于或者小于所述数据中心的热备非易失性存储介质的数目时,使用所述热备非易失性存储介质接替分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质。结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,针对所述数据中心的所有非易失性存储介质中的任意两个非易失性存储介质,对所述任意两个非易失性存储介质分别对应的初始预设故障门限值降低的幅度值相同。结合第一方面的第二种或者第三种可能的实现方式,在第四种可能的实现方式中,使用所述热备非易失性存储介质接替分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质之后,还包括:补充预设数量的热备非易失性存储介质;提高所述数据中心的每一个降低了初始预设故障门限值后的非易失性存储介质分别对应的第一预设故障门限值,得到第二预设故障门限值;针对提高了第一预设故障门限值的任意一非易失性存储介质,在任意一非易失性存储介质的状况值小于任意一非易失性存储介质对应的第二预设故障门限值时,预测所述任意一非易失性存储介质将发生故障;当判断出分别根据对应的第二预设故障门限值预测出的将发生故障的所有非易失性存储介质的总数目,小于或者等于补充的所述预设数量的热备非易失性存储介质的数目时,使用补充的所述预设数量的所述热备非易失性存储介质接替分别根据对应第二预设故障门限值预测出的将发生故障的所有非易失性存储介质;其中,针对每一个对应第二预设故障门限值的非易失性存储介质,第二预设故障门限值小于或者等于对应非易失性存储介质的初始预设故障门限值。第二方面,提供一种预测非易失性存储介质发生故障的装置,包括:计算单元,用于针对数据中心的至少两个非易失性存储介质中的任意一非易失性存储介质,分别执行:计算所述任意一非易失性存储介质的状况值,所述状况值用于表征所述任意一非易失性存储介质的运行状况;预测单元,用于确定所述状况值小于与所述任意一非易失性存储介质对应的初始预设故障门限值时,预测所述任意一非易失性存储介质将发生故障;状况值不同的任意两个非易失性存储介质分别对应的初始预设故障门限值不同。结合第二方面,在第一种可能的实现方式中,还包括确定单元、判断单元和接替单元:所述确定单元用于确定预测出的将发生故障的所有非易失性存储介质的总数目;所述判断单元用于判定确定的所述所有非易失性存储介质的总数目小于或者等于所述数据中心的热备非易失性存储介质的数目;所述接替单元用于在所述判断单元判定确定的所述所有非易失性存储介质的总数目小于或者等于所述数据中心的热备非易失性存储介质的数目时,使用所述热备非易失性存储介质中的热备非易失性存储介质接替所述预测出的将发生故障的所有非易失性存储介质的工作;接替所述预测出的将发生故障的所有非易失性存储介质工作的热备非易失性存储介质的数目与所述所有非易失性存储介质的总数目相同。结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述确定单元还用于:判定确定的所述所有非易失性存储介质的总数目大于所述数据中心的热备非易失性存储介质的数目时,针对所述任意一非易失性存储介质,分别执行:降低所述任意一非易失性存储介质对应的初始预设故障门限值,得到第一预设故障门限值;所述预测单元用于确定所述任意一非易失性存储介质的状况值小于所述任意一非易失性存储介质对应的第一预设故障门限值时,进一步预测所述任意一非易失性存储介质将发生故障;所述接替单元当判断出分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质的总数目等于或者小于所述数据中心的热备非易失性存储介质的数目时,使用所述热备非易失性存储介质接替分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质。结合第二方面的第二种可能的实现方式,在第三种可能的实现方式中,针对所述数据中心的所有非易失性存储介质中的任意两个非易失性存储介质,对所述任意两个非易失性存储介质分别对应的初始预设故障门限值降低的幅度值相同。结合第二方面的第二种或者第三种可能的实现方式,在第本文档来自技高网...

【技术保护点】
1.一种预测非易失性存储介质发生故障的方法,其特征在于,数据中心中包括至少两个非易失性存储介质,每个非易失性存储介质对应有初始预设故障门限值,每个非易失性存储介质的初始预设故障门限值与本非易失性存储介质的上电时间相关,上电时间不同的任意两个非易失性存储介质的初始预设故障门限值不同;所述方法包括:计算第一非易失性存储介质的状况值,所述状况值用于表征所述第一非易失性存储介质的运行状况,所述第一非易失性存储介质为所述至少两个非易失性存储介质中的任意一个;确定所述状况值小于与所述第一非易失性存储介质对应的初始预设故障门限值时,预测所述第一非易失性存储介质将发生故障。

【技术特征摘要】
1.一种预测非易失性存储介质发生故障的方法,其特征在于,数据中心中包括至少两个非易失性存储介质,每个非易失性存储介质对应有初始预设故障门限值,每个非易失性存储介质的初始预设故障门限值与本非易失性存储介质的上电时间相关,上电时间不同的任意两个非易失性存储介质的初始预设故障门限值不同;所述方法包括:计算第一非易失性存储介质的状况值,所述状况值用于表征所述第一非易失性存储介质的运行状况,所述第一非易失性存储介质为所述至少两个非易失性存储介质中的任意一个;确定所述状况值小于与所述第一非易失性存储介质对应的初始预设故障门限值时,预测所述第一非易失性存储介质将发生故障。2.如权利要求1所述的方法,其特征在于,所述方法还包括:计算每个非易失性存储介质的状况值;确定预测出的将发生故障的所有非易失性存储介质的总数目;判定所述预测出的将发生故障的所有非易失性存储介质的总数目小于或者等于所述数据中心的热备非易失性存储介质的数目时,使用所述热备非易失性存储介质中的热备非易失性存储介质接替所述预测出的将发生故障的所有非易失性存储介质的工作;接替所述预测出的将发生故障的所有非易失性存储介质工作的热备非易失性存储介质的数目与所述预测出的将发生故障的所有非易失性存储介质的总数目相同。3.如权利要求2所述的方法,其特征在于,确定预测出的将发生故障的所有非易失性存储介质的总数目之后,还包括:判定确定的所述预测出的将发生故障的所有非易失性存储介质的总数目大于所述数据中心的热备非易失性存储介质的数目时,针对所述任意一非易失性存储介质,分别执行:降低所述任意一非易失性存储介质对应的初始预设故障门限值,得到第一预设故障门限值,并确定所述任意一非易失性存储介质的状况值小于所述任意一非易失性存储介质对应的第一预设故障门限值时,进一步预测所述任意一非易失性存储介质将发生故障;当判断出分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质的总数目等于或者小于所述数据中心的热备非易失性存储介质的数目时,使用所述热备非易失性存储介质接替分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质。4.如权利要求3所述的方法,其特征在于,所述至少两个非易失性存储介质中的任意两个非易失存储介质对应的初始预设故障门限值降低的幅度值相同。5.如权利要求3或4所述的方法,其特征在于,使用所述热备非易失性存储介质接替分别根据对应的第一预设故障门限值预测出的将发生故障的所有非易失性存储介质之后,还包括:补充预设数量的热备非易失性存储介质;提高所述数据中心的每一个降低了初始预设故障门限值后的非易失性存储介质分别对应的第一预设故障门限值,得到第二预设故障门限值;针对提高了第一预设故障门限值的任意一非易失性存储介质,在任意一非易失性存储介质的状况值小于任意一非易失性存储介质对应的第二预设故障门限值时,预测所述任意一非易失性存储介质将发生故障;当判断出分别根据对应的第二预设故障门限值预测出的将发生故障的所有非易失性存储介质的总数目,小于或者等于补充的所述预设数量的热备非易失性存储介质的数目时,使用补充的所述预设数量的所述热备非易失性存储介质接替分别根据对应第二预设故障门限值预测出的将发生故障的所有非易失性存储介质;其中,针对每一个对应第二预设故障门限值的非易失性存储介质,第二预设故障门限值小于或者等于对应非易失性存储介质的初始预设故障门限值。6.一种预测非易失性存储介质发生故障的装置,其特征在于,数据中心中包括至少两个非易失性存储介质,每个非易失性存储介质对应有初始预设故障门限值,每个非易失性存储介质的初始预设故障...

【专利技术属性】
技术研发人员:孔伟康李定李强
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1