一种磁盘数据保护方法技术

技术编号:6066940 阅读:219 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种磁盘数据保护方法。本发明专利技术所述方法包括接收磁盘操作请求,统计请求扇区的访问热度;当请求扇区的访问热度达到热点要求、不存在副本且磁盘空闲空间大于预先设定的空闲空间阈值时生成请求扇区的副本;在进行读写操作时请求扇区和请求扇区的副本的数据一致时选择其中一个扇区进行操作,优选离磁头当前位置最近的扇区进行操作,不一致时选择两者中数据最新的扇区进行操作。在热点扇区或者其副本出现故障时,用其镜像扇区的数据恢复失效扇区。本发明专利技术通过减少对热点扇区的读写次数来减少该扇区出现故障的概率,本发明专利技术保障了热点扇区数据的可靠性,同时在响应应用系统请求时,返回离磁头更近的数据,提供了更高的读写性能。

Disk data protection method

The invention discloses a disk data protection method. The method of the invention includes receiving a disk operation request, request the statistics sector access heat; when requesting access to the hot sector heat requirements, does not exist to generate requests for copies of copies of the sector and disk free space free space is greater than a pre-determined threshold value; consistent data in read and write operation request and request copies of the sector sector the choice of one sector to operate, preferably from the current position of the sector head operation. When the selected sector the latest data both in operation. When a hot sector or its copy fails, the failure sector is restored with data from its mirrored sector. The present invention by the number of write to reduce the probability of failure of the sector to reduce the hot sector read, the invention ensures the reliability of the hot sector data, at the same time in response to application request, return from the head more recent data, provides more reading and writing performance.

【技术实现步骤摘要】

本专利技术属于计算机存储
,具体涉及一种为防止由磁盘或磁盘阵列中扇区 失效导致数据丢失而提供的磁盘数据保护方法
技术介绍
随着硬盘价格的不断下滑,2TB的大容量硬盘已经日渐普及。然而,大容量的硬盘 的使用会带来可靠性方面问题,因为由于工艺原因,每个硬盘都存在一定的误码率,当误码 率为固定值的情况下,单盘容量加大时,硬盘发生潜在扇区失效的概率也会增加。在采用磁 盘阵列RAID技术的存储系统中出现磁盘故障时,RAID的重建线程被调用。但是当重建过程 中出现扇区失效或者潜在数据腐化故障时,某些数据块不能成功恢复,因此发生数据丢失。为了防止这种情况的出现,研究者们提出了磁盘扫描技术来探测扇区失效,提 出了磁盘内冗余技术来恢复由于扇区失效导致的数据丢失(具体参见A. Dholakia et al. Analysis of a New Intra-Disk Redundancy Scheme forHigh-Rellability RAID Storage Systems in the Presence of Unrecoverable Errors. IBM Research Report RZ 3652, March 16,2006).磁盘扫描技术利用介质扫描和数据扫描来检测存储系统中的潜在 扇区错误和无征兆数据腐化等磁盘错误。而磁盘内冗余技术则把RAID中的每个条带单元 分成几个段,每个段中一部分空间用于存储正常的数据,另外一部分空间存储用于奇偶校 验的冗余数据。当发生扇区失效时,即可利用冗余数据来进行恢复。该方案大大提高了存储系统的可靠性。但是这种方法也存在局限性。一是性能问 题,类似于RAID5中的小写问题,在磁盘内冗余方案中,对每个条带单元的数据进行写操作 都需要计算并修改校验信息,因此,磁盘内冗余方案虽然能获得很高的可靠性,但是它不可 避免的给存储系统的性能带来了影响。二是可靠性问题。首先,磁盘扇区错误的发生具有 相关性。当一个扇区发生故障时,邻近的扇区发生故障的可能性也非常高。如果采用磁盘 内冗余的方案时,有可能数据和其临近的奇偶校验位信息会同时发生故障。因此,磁盘内冗 余方案并不能完全解决由扇区错误产生的数据丢失。其次,潜在扇区失效率与其上的负载 有关。对某块数据读写次数越多,那么,该数据块失效的可能性越大。因此,在磁盘内冗余 方案中,如果写操作比较多,存放校验信息的扇区失效的可能性就大大增加,从而也会导致 该扇区附近的扇区失效的可能性的增加。
技术实现思路
本专利技术的目的在于提供,该方法通过减少对热点扇区的读 写次数来减少热点扇区出现故障的概率,在提高热点数据可靠性的同时,还提高了热点数 据的访问性能。本专利技术提供的,该方法包含以下步骤(1)接收磁盘操作请求,统计请求扇区的访问热度;(2)判断请求扇区的访问热度是否达到热点要求,是,则进入步骤(3);否,则转入步骤(6);(3)判断请求扇区是否存在副本,是,则转入步骤(5);否,则进入步骤⑷;(4)判断磁盘空闲空间是否大于预先设定的空闲空间阈值,是,则生成请求扇区的 副本,进入步骤(5);否,则转入步骤(6); (5)判断请求扇区和请求扇区的副本这两个扇区的数据是否一致,是,则选择两个 扇区中的任意一个扇区进行操作,然后转入步骤(7);否,则选择两个扇区中数据最新的扇 区进行操作,然后转入步骤(7);(6)操作请求扇区;(7)本次磁盘操作结束;(8)重复执行步骤(1)-(7),直至磁盘停止运行。该方法进一步包括步骤(5)中当请求扇区和请求扇区的副本这两个扇区的数据 一致时,选择两个扇区中离磁头当前位置最近的扇区进行操作。该方法进一步包括按照下述步骤选择两个扇区中离磁头当前位置最近的扇区(a)计算当前磁头访问其中一个扇区的访问延时;(b)计算当前磁头访问另一个扇区的访问延时;(c)比较当前磁头访问其中一个扇区的访问延时和访问另一个扇区的访问延时, 访问延时最小的扇区即为离磁头当前位置最近的扇区。该方法进一步包括当磁盘空闲时,判断磁盘中是否存在任意一个扇区和扇区副 本的数据不一致,是,则进行数据同步;否,则不做处理。该方法进一步包括当磁盘任意一个扇区失效时,判断失效扇区是否存在镜像扇 区,是,则将镜像扇区数据写入一个空闲新扇区;否,则不做处理;其中扇区与扇区副本互 为镜像扇区。该方法进一步包括当磁盘空闲空间小于预先设定的空闲空间阈值时,在存在副 本的扇区中选择热度最低的扇区,删除所述热度最低的扇区的副本,直至磁盘空闲空间大 于预先设定的空闲空间阈值。本专利技术基于一个普遍存在的现象,即磁盘中被频繁访问的扇区出现扇区失效的可 能性越大。与磁盘内冗余方案不同,本专利技术将扇区失效的可能性进行区别,动态跟踪应用系 统访问扇区的热点和位置,从而判断哪些数据和区域是重要区域及高失效率区域,然后对 重要的热点扇区提供更高级别的保护措施;即生成磁盘上热点扇区的副本,通过减少对热 点扇区的读写次数以减少该扇区出现故障的概率。在热点扇区或者其副本出现故障时,用 其镜像扇区的数据恢复失效扇区,从而保障了热点扇区数据的可靠性。在响应操作请求时, 利用磁头定位技术,返回离磁头当前位置最近的扇区,从而提供了更高的读写性能。另外, 本专利技术不需要对磁盘进行任何改动,也不改变磁盘上的原始数据布局,因此可以很方便的 用来优化存储系统,适用于构造具有高性能、高可靠性的基于磁盘阵列的存储系统。附图说明图1为本专利技术所述的磁盘数据保护方法的流程图;图2为本专利技术的一次数据同步过程的流程图;图3为本专利技术的一次失效扇区检查和恢复过程的流程图4为本专利技术的一次空闲空间监控过程的流程图;图5为本专利技术所述的访问延时的计算方法流程图。具体实施例方式下面结合附图和具体实施方式对本专利技术作进一步详细描述。本专利技术所述的磁盘数据保护方法涉及到如下数据表热度区链表该表记录扇区的地址和访问热度,每条记录由4个数据项构成,各数 据项依次为扇区地址、访问热度、上一条记录的地址、下一条记录的地址;若应用系统对某 个扇区进行首次访问,则在热度区链表中添加一条该扇区的记录,并置该扇区的访问热度 为1 ;若非首次访问,则进行记录更新,将该扇区的访问热度加1。其中访问热度指该扇区在 某个时间段内被访问的次数,该时间段长短由系统管理员来设置,可以为一天、一星期、一 月甚至无限长时间。一致性维护列表该表主要记录热点扇区及热点扇区副本的地址和同步标识,每 条记录由6个数据项构成,各数据项依次为扇区地址、扇区副本地址、扇区大小、访问热度、 扇区同步标识、扇区副本同步标识。同步标识标记扇区是否被修改,如果被修改,则值为1, 否则为0 ;其中,热点扇区指访问热度达到热点要求的扇区,热点要求指访问热度大于预先 设定的热度阈值,该热度阈值的取值方法为假设热度区链表有N条记录,且按访问热度值 降序排列,那么热度阈值为热度区链表中第Lax#」(a XN的结果向下取整)个元素的热 度值,α由系统管理员设定,它是一个大于0小于1的数。寻道时间表该表记录磁盘中磁头从任意一个起始磁道移动到任意一个目标磁道 的访问时间,每条记录由3个数据项构成,各数据项依次为起始磁道号、目标磁道号、寻道 时间。在磁盘首次运行时创建以上三个数据表的空表。本专利技术所述的磁盘数据保本文档来自技高网
...

【技术保护点】
一种磁盘数据保护方法,其特征在于,该方法包含以下步骤:(1)接收磁盘操作请求,统计请求扇区的访问热度;(2)判断请求扇区的访问热度是否达到热点要求,是,则进入步骤(3);否,则转入步骤(6);(3)判断请求扇区是否存在副本,是,则转入步骤(5);否,则进入步骤(4);(4)判断磁盘空闲空间是否大于预先设定的空闲空间阈值,是,则生成请求扇区的副本,进入步骤(5);否,则转入步骤(6);(5)判断请求扇区和请求扇区的副本这两个扇区的数据是否一致,是,则选择两个扇区中的任意一个扇区进行操作,然后转入步骤(7);否,则选择两个扇区中数据最新的扇区进行操作,然后转入步骤(7);(6)操作请求扇区;(7)本次磁盘操作结束;(8)重复执行步骤(1)-(7),直至磁盘停止运行。

【技术特征摘要】

【专利技术属性】
技术研发人员:周可刘军平庞丽萍雷栋梁刘进
申请(专利权)人:华中科技大学
类型:发明
国别省市:83

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1