适用于RAID系统的自动修复方法以及RAID系统技术方案

技术编号:4272290 阅读:263 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种适用于独立冗余磁盘阵列(RAID)系统的自动修复方法,在由多个磁盘组成的RAID系统中,在每个磁盘槽位接口上提供控制磁盘实现单独下、上电的电路,该方法包括如下步骤:A、当所述RAID系统中作为成员盘的第一磁盘无法响应IO操作时,通过所述电路对所述第一磁盘进行单独下电处理,再对所述第一磁盘进行单独上电处理;B、判断所述第一磁盘是否能够响应IO操作,若是,则完成对RAID系统的自动修复,否则,启动热备盘来重建所述RAID系统。本发明专利技术还公开了一种RAID系统。本发明专利技术方案可以在多数情况下避免使用热备盘进行重建操作,提高了RAID系统性能和可靠性,并节省了磁盘。

【技术实现步骤摘要】

本专利技术涉及计算机存储
,特别涉及独立冗余磁盘阵列(Redundant Array of Independent Disks, RAID)技术,尤其涉及一种适用于RAID系统的自动修复方法以及 RAID系统。
技术介绍
作为网络存储系统的基础和关键部件,RAID以其快速、海量和高可靠性的特点而 著称。RAID技术出现后,在工业、军事、教育等各个领域的应用需求十分广泛,对RAID技术 的研究也一直是行业热点。热备盘是指在正常情况下作为备份用的磁盘,不用于数据存储;只有当RAID系统 中发生磁盘损坏导致RAID成员盘失效时,热备盘自动取代失效的RAID成员盘用于存储数 据。热备盘取代RAID成员盘的过程又称为RAID系统重建。热备盘的使用,提高了 RAID系 统的数据安全性,从而实现安全冗余。热备盘的类型主要有如下三种1)分布式热备盘(Distributed Spare)适用范围部分冗余RAID组;特点某RAID组专有;分配时就占用实际的物理磁盘空间;其冗余空间平均分布 在该阵列所有磁盘上;2)专用热备盘(Dedicated Spare)适用范围所有冗余RAID组;特点某RAID组专有;仅在使用时才占用实际的物理磁盘空间;其冗余空间分布 在指定的磁盘上;3)全局热备盘(Global Spare)适用范围所有冗余RAID组;特点所有RAID组共有;仅在使用时才占用实际的物理磁盘空间;其冗余空间分 布在指定的磁盘上。通过加入热备盘恢复失效的成员盘上的数据,RAID系统重建能够从头到尾恢复失 效盘的数据,重建完成之后热备盘就会成为正式的成员盘取代原来的失效的成员盘。这样, 通过RAID系统的重建功能,可以提高其可靠性。现有技术中,当上层的输入输出(10)请求不能被RAID系统的某个成员盘响应时, 一般都会认为该成员盘已经失效,RAID系统会自动启动重建过程。RAID系统的重建操作开 销大、周期长,影响正常的数据10的性能,并且一般在重建期间,如果有另外的磁盘失效, RAID系统会直接崩溃,进而让RAID系统非常脆弱,因此应当尽量避免启动重建操作。绝大多数情况下,上层的10请求不能被RAID系统的某个成员盘响应,并非作为该 成员盘的磁盘真正失效了。据磁盘制作商Seagate公司统计,磁盘不能响应10请求时,95% 的情况是因为固件、校验之类的软件错误导致的,这些情况可以通过简单修复操作使磁盘 仍然有效;只有5%的情况下,是由于磁盘真正失效。因此,如果在磁盘并没有真正失效的情况下,就对RAID系统启动重建过程,会极大提高RAID系统的使用和维护成本。
技术实现思路
有鉴于此,本专利技术的目的在于,提出一种适用于RAID系统的自动修复方法以及 RAID系统,可以避免不必要的重建过程,从而降低RAID系统的使用和维护成本。本专利技术实施例提出的一种适用于RAID系统的自动修复方法,在由多个磁盘组成 的RAID系统中,在每个磁盘槽位接口上提供控制磁盘实现单独下、上电的电路,该方法包 括如下步骤A、当所述RAID系统中作为成员盘的第一磁盘无法响应10操作时,通过所述电路 对所述第一磁盘进行单独下电处理,再对所述第一磁盘进行单独上电处理;B、判断所述第一磁盘是否能够响应10操作,若是,则完成对RAID系统的自动修 复,否则,启动热备盘来重建所述RAID系统。较佳地,所述步骤A包括A1、当RAID系统收到10操作请求时,判断RAID系统中的磁盘是否能够响应10操 作,若是,则退出本流程,否则当RAID系统中的第一磁盘无法响应10操作,则对第一磁盘进 行单独下电处理,并启动预先设定的时间间隔定时器;A2、所述时间间隔定时器超时,则对第一磁盘进行上电处理。较佳地,所述通过所述电路对所述第一磁盘进行单独下电处理,再对所述第一磁 盘进行单独上电处理的同时,进一步包括如下步骤判断是否对RAID系统的磁盘进行写操 作,若是,则记录执行写操作的条带序号;以及,步骤B所述判断所述第一磁盘是否能够响应10操作的结果为是,进一步包 括根据所记录的执行写操作的条带序号,将执行了写操作的条带上存储的内容恢复到第 一磁盘下电处理之前的状态。预先设置条带写记录数组,所述条带写记录数组中的每一个元素对应RAID系统 的一个条带;所述记录执行写操作的条带序号包括根据写命令的地址和数据长度,计算该写命令对应到RAID系统的至少一个条带 号,并将所述至少一个条带号记录到所述条带写记录数组的元素中。所述预先设置条带写记录数组的步骤包括将所述条带写记录数组中的元素初值 设置为-1。所述根据所记录的执行写操作的条带序号,将执行了写操作的条带上存储的内容 恢复到第一磁盘无法响应10操作之前的状态包括读取条带写记录数组中的元素值X,根据所述RAID系统中除第一磁盘之外的其他 磁盘的序号为x的条带上的内容,重构第一磁盘的序号为x的条带上的内容。本专利技术实施例还提出一种RAID系统,所述RAID系统包含多个磁盘,所述多个磁盘 包括至少一个热备盘以及多个成员盘,所述RAID系统还包括在每个磁盘槽位接口上提供控制磁盘实现单独下、上电的电路;第一判断模块,用于判断作为成员盘的磁盘是否能够响应10操作,若第一磁盘无 法响应10操作,则通过所述电路对所述第一磁盘进行单独下电处理,再对所述第一磁盘进行单独上电处理;第二判断模块,用于判断所述第一磁盘在上电处理之后,是否能够响应10操作, 若否,激活重建模块;重建模块,用于在被激活后,启动热备盘并执行对RAID系统的重建。较佳地,所述第一判断模块进一步包括时间间隔定时器;所述第一判断模块对所述第一磁盘进行单独下电处理时,启动所述时间间隔定时 器,当所述时间间隔定时器超时时,对所述第一磁盘进行单独上电处理。较佳地,所述RAID系统进一步包括写操作记录模块,用于在对所述第一磁盘进行单独下电处理,到对所述第一磁盘 进行单独上电处理的时间间隔内,判断是否对RAID系统的磁盘进行写操作,若是,则记录 执行写操作的条带序号;以及,内容恢复模块,用于在第二判断模块判断所述第一磁盘在上电处理之后能够响应 10操作后,根据所述写操作记录模块所记录的执行写操作的条带序号,将执行了写操作的 条带上存储的内容恢复到第一磁盘下电处理之前的状态。从以上技术方案可以看出,当磁盘无法响应10操作时,首先通过下电、上电处理 对该磁盘进行修复,如果上述处理后磁盘能够响应10操作,则无需进行RAID系统重建。更 进一步地,记录磁盘下电下电、上电过程中进行写操作的条带,在磁盘能够响应10操作后, 将RAID系统进行写操作的条带恢复到下电之前的状态。本专利技术方案针对RAID系统的某个磁盘无法响应上层10请求而设计。当10请求无 法响应时,会对相应的磁盘做下电处理,并记录自下电以来RAID系统的哪些条带发生过写 操作,当再次上电时,如果该磁盘能响应10请求,则重构相应条带其它磁盘上的数据到该 磁盘上。本专利技术方案避免了不分情况如何,即武断地使用热备盘进行重建操作,提高了 RAID 系统性能和可靠性,并节省了磁盘。附图说明图1为本专利技术实施例的条带写记录数组中记录的内容示意图;图2为本专利技术实施例的从磁盘无法响应10请求至上电成功期间,写操作发生时相 应条带记录过程的流程示意图;图3为本文档来自技高网
...

【技术保护点】
一种适用于独立冗余磁盘阵列RAID系统的自动修复方法,其特征在于,在由多个磁盘组成的RAID系统中,在每个磁盘槽位接口上提供控制磁盘实现单独下、上电的电路,该方法包括如下步骤:A、当所述RAID系统中作为成员盘的第一磁盘无法响应IO操作时,通过所述电路对所述第一磁盘进行单独下电处理,再对所述第一磁盘进行单独上电处理;B、判断所述第一磁盘是否能够响应IO操作,若是,则完成对RAID系统的自动修复,否则,启动热备盘来重建所述RAID系统。

【技术特征摘要】
一种适用于独立冗余磁盘阵列RAID系统的自动修复方法,其特征在于,在由多个磁盘组成的RAID系统中,在每个磁盘槽位接口上提供控制磁盘实现单独下、上电的电路,该方法包括如下步骤A、当所述RAID系统中作为成员盘的第一磁盘无法响应IO操作时,通过所述电路对所述第一磁盘进行单独下电处理,再对所述第一磁盘进行单独上电处理;B、判断所述第一磁盘是否能够响应IO操作,若是,则完成对RAID系统的自动修复,否则,启动热备盘来重建所述RAID系统。2.根据权利要求1所述的方法,其特征在于,所述步骤A包括Al、当RAID系统收到IO操作请求时,判断RAID系统中的磁盘是否能够响应IO操作, 若是,则退出本流程,否则当RAID系统中的第一磁盘无法响应IO操作,则对第一磁盘进行 单独下电处理,并启动预先设定的时间间隔定时器;A2、所述时间间隔定时器超时,则对第一磁盘进行上电处理。3.根据权利要求1所述的方法,其特征在于,所述通过所述电路对所述第一磁盘进行 单独下电处理,再对所述第一磁盘进行单独上电处理的同时,进一步包括如下步骤判断是 否对RAID系统的磁盘进行写操作,若是,则记录执行写操作的条带序号;以及,步骤B所述判断所述第一磁盘是否能够响应IO操作的结果为是,进一步包括根 据所记录的执行写操作的条带序号,将执行了写操作的条带上存储的内容恢复到第一磁盘 下电处理之前的状态。4.根据权利要求3所述的方法,其特征在于,预先设置条带写记录数组,所述条带写记 录数组中的每一个元素对应RAID系统的一个条带;所述记录执行写操作的条带序号包括根据写命令的地址和数据长度,计算该写命令对应到RAID系统的至少一个条带号,并 将所述至少一个条带号记录到所述条带写记录数组的元素中。5.根据权利要求4所述的方法,其特征在于,所述预先设置条带写记录数组的步骤包 括将所述条带写记...

【专利技术属性】
技术研发人员:鲍清平饶国林
申请(专利权)人:创新科存储技术有限公司创新科软件技术深圳有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1