一种硬盘故障的处理方法及装置制造方法及图纸

技术编号:11234606 阅读:83 留言:0更新日期:2015-04-01 08:29
本发明专利技术实施例提供一种硬盘故障的处理方法及装置,涉及存储技术领域,能够解决现有技术中由于硬盘上报故障有延迟,不能及时对硬盘故障进行处理而导致的硬盘数据丢失,使得存储系统可靠性差的问题。具体方案为:接收硬盘上报的故障信息,故障信息包括产生坏道的扇区的地址信息,并记录扇区的地址信息,在扇区修复成功后,根据地址信息周期性地对扇区进行扫描,确定扇区在修复成功后是否再次产生坏道,若扇区产生坏道的次数达到次数阈值,则对扇区所在的数据块进行数据重构。本发明专利技术实施例用于处理硬盘故障。

【技术实现步骤摘要】
【专利摘要】本专利技术实施例提供一种硬盘故障的处理方法及装置,涉及存储
,能够解决现有技术中由于硬盘上报故障有延迟,不能及时对硬盘故障进行处理而导致的硬盘数据丢失,使得存储系统可靠性差的问题。具体方案为:接收硬盘上报的故障信息,故障信息包括产生坏道的扇区的地址信息,并记录扇区的地址信息,在扇区修复成功后,根据地址信息周期性地对扇区进行扫描,确定扇区在修复成功后是否再次产生坏道,若扇区产生坏道的次数达到次数阈值,则对扇区所在的数据块进行数据重构。本专利技术实施例用于处理硬盘故障。【专利说明】一种硬盘故障的处理方法及装置
本专利技术涉及存储
,尤其涉及一种硬盘故障的处理方法及装置。
技术介绍
独立磁盘冗余阵列(RedundantArray of Independent Disks,RAID),是一种把多块独立的磁盘或硬盘组合起来形成的一个磁盘组或硬盘组,也可以称为逻辑硬盘,是一种高端存储阵列。随着高端存储系统对存储阵列中硬盘的可靠性要求越来越高,高端存储阵列通过在多个硬盘上同时写入和读取数据,来提高存储系统的数据吞吐量,增加平均故障间隔时间,并通过存储镜像备份或校验数据等相关冗余数据来增加容错功能,例如当存储阵列中某一硬盘故障时,可以根据其它硬盘中的冗余数据恢复故障硬盘中的数据,避免故障硬盘中数据的丢失,从而提高了存储系统的可靠性。 目前,高端存储阵列中的硬盘大多还是机械硬盘,而由于电压不稳定,非正常关机,高温,读写时震动等原因,可能导致硬盘中的扇区产生坏道。若硬盘已经存在坏道,则当上层主机业务读取坏道中的数据时,才会触发硬盘通过自身检测机制发现坏道,并将硬盘故障上报给存储阵列中的故障处理装置例如控制器。也就是说,硬盘不会在坏道出现后立即上报硬件故障,直至上层主机业务读取该坏道时才会上报硬盘故障,即硬盘上报故障有延迟。由于在硬盘上报故障后存储阵列中的控制器等才能对硬盘故障进行相应处理,且硬盘上报故障存在延迟,因而控制器不能及时对硬盘故障进行处理。若在硬盘产生坏道之后,上报硬盘故障之前,存储阵列中存储该坏道中相关冗余数据所在的其它硬盘也发生故障,则无法根据冗余数据对该坏道进行修复,无法恢复坏道中的数据,从而会造成故障硬盘中的数据丢失,降低了存储系统的可靠性。
技术实现思路
本专利技术实施例提供一种硬盘故障的处理方法及装置,能够解决现有技术中由于硬盘上报故障有延迟,不能及时对硬盘故障进行处理而导致的硬盘数据丢失,使得存储系统可靠性差的问题。 为达到上述目的,本专利技术采用如下技术方案: 第一方面,提供一种硬盘故障的处理方法,包括: 接收硬盘上报的故障信息,所述故障信息包括产生坏道的扇区的地址信息,并记录所述扇区的地址信息; 在所述扇区修复成功后,根据所述地址信息周期性地对所述扇区进行扫描,确定所述扇区在修复成功后是否再次产生坏道; 若所述扇区产生坏道的次数达到次数阈值,则对所述扇区所在的数据块进行数据重构。 结合第一方面,在第一方面的第一种可能实现的方式中,所述对所述扇区所在的数据块进行数据重构包括: 将所述坏道所在的数据块迀移至本硬盘的空闲区域或除所述硬盘以外的其它硬盘的空闲区域,并隔离所述硬盘中所述数据块。 结合第一方面或第一方面的第一种可能的实现方式,在第一方面的第二种可能实现的方式中,所述对所述扇区所在的数据块进行数据重构包括: 若所述扇区产生坏道的次数达到所述次数阈值,则对所述扇区继续进行修复; 若对所述扇区继续修复成功,则对所述扇区进行校验; 若校验失败,则将当前所述硬盘单位时间内校验失败的次数与预设阈值进行比较,以在所述次数小于或等于所述预设阈值时对所述扇区所在的数据块进行数据重构。 结合第一方面的第一种可能的实现方式,在第一方面的第三种可能实现的方式中,所述方法还包括: 确定当前所述硬盘隔离的数据块的数量是否大于预设隔离数量; 若大于,则迀移所述硬盘的整盘数据至所述其它硬盘的空闲区域,并将所述硬盘置为失效。 结合第一方面的第二种可能的实现方式,在第一方面的第四种可能实现的方式中,所述方法还包括: 若所述硬盘单位时间内校验失败的次数大于所述预设阈值,则迀移所述硬盘的整盘数据至所述其它硬盘的空闲区域,并将所述硬盘置为失效。 第二方面,提供一种硬盘故障的处理装置,包括: 接收单元,用于接收硬盘上报的故障信息,所述故障信息包括产生坏道的扇区的地址信息; 记录单元,用于记录所述扇区的地址信息; 第一确定单元,用于在所述扇区修复成功后,根据所述记录单元记录的地址信息周期性地对所述扇区进行扫描,确定所述扇区在修复成功后是否再次产生坏道; 重构单元,若所述第一确定单元确定所述扇区产生坏道的次数达到次数阈值,则对所述扇区所在的数据块进行数据重构。 结合第二方面,在第二方面的第一种可能实现的方式中,所述重构单元具体用于: 将所述坏道所在的数据块迀移至本硬盘的空闲区域或除所述硬盘以外的其它硬盘的空闲区域,并隔离所述硬盘中所述数据块。 结合第二方面或第二方面的第一种可能的实现方式,在第二方面的第二种可能实现的方式中,还包括: 修复单元,用于若所述第一确定单元确定所述扇区产生坏道的次数达到次数阈值,则对所述扇区继续进行修复; 校验单元,用于若所述修复单元对所述扇区继续修复成功,则对所述扇区进行校验; 第二确定单元,用于若所述校验单元校验失败,则将当前所述硬盘单位时间内校验失败的次数与预设阈值进行比较,以确定所述次数是否小于或等于所述预设阈值; 所述重构单元具体用于,若所述第二确定单元确定是,则对所述扇区所在的数据块进行数据重构。 结合第二方面的第一种可能的实现方式,在第二方面的第三种可能实现的方式中,还包括: 第三确定单元,用于确定当前所述硬盘隔离的数据块的数量是否大于预设隔离数量; 第一处理单元,用于若所述第三确定单元确定是,则迀移所述硬盘的整盘数据至所述其它硬盘的空闲区域,并将所述硬盘置为失效。 结合第二方面的第二种可能的实现方式,在第二方面的第四种可能实现的方式中,还包括: 第四确定单元,用于确定所述硬盘单位时间内校验失败的次数是否大于所述预设阈值; 第二处理单元,用于若所述第四确定单元确定是,则迀移所述硬盘的整盘数据至所述其它硬盘的空闲区域,并将所述硬盘置为失效。 本专利技术实施例提供一种硬盘故障的处理方法及装置,通过周期性地对产生坏道并修复成功的扇区进行扫描,确定该扇区是否再次产生坏道,可以及时发现坏道,避免了现有技术中硬盘需要等待上层主机业务读取该坏道时才能进行自身检测,从而导致上报故障存在延迟的问题;而后通过对产生坏道的次数达到次数阈值的扇区所在的数据块进行数据重构,可以及时恢复当前扇区及数据块中存在潜在坏道的扇区中的数据,避免了现有技术中由于当前硬盘上报故障有延迟,若在上报故障之前存储当前坏道或当前数据块的坏道中相关冗余数据的其它硬盘也发生故障,则本硬盘坏道中的数据无法恢复的问题,即可以解决现有技术中由于硬盘上报故障有延迟,不能及时对硬盘故障进行处理而导致的硬盘数据丢失,使得存储系统可靠性差的问题。 【专利附图】【附图说明】 为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中本文档来自技高网
...

【技术保护点】
一种硬盘故障的处理方法,其特征在于,包括:接收硬盘上报的故障信息,所述故障信息包括产生坏道的扇区的地址信息,并记录所述扇区的地址信息;在所述扇区修复成功后,根据所述地址信息周期性地对所述扇区进行扫描,确定所述扇区在修复成功后是否再次产生坏道;若所述扇区产生坏道的次数达到次数阈值,则对所述扇区所在的数据块进行数据重构。

【技术特征摘要】

【专利技术属性】
技术研发人员:王键
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1