一种数据重组方法技术

技术编号:2859609 阅读:177 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种数据重组方法,在原独立冗余磁盘阵列(RAID)系统高地址侧尾部预留一块磁盘空间作为重组区域,将该预留重组区域的高地址作为写入数据的起始地址,并将原RAID系统中存有数据的高地址作为重组数据的起始高地址;数据重组完之前重复执行以下步骤:确定当前要重组数据的低地址,并将当前要重组数据高地址到低地址之间的数据重组为新RAID类型数据;将重组后的数据从写入数据的起始地址向低地址方向,顺序写入新RAID系统中;当前要重组数据低地址的邻接低地址作为下次要重组数据的高地址,当前写入数据低地址的邻接低地址作为下次写入数据的起始地址。用户使用本发明专利技术可保证数据重组过程中的安全性,并且重组过程的简便性也提高了数据重组效率。

【技术实现步骤摘要】

本专利技术涉及一种数据处理方法,具体涉及一种独立冗余磁盘阵列(RAID)的数据重组方法
技术介绍
随着科学技术的飞速发展与计算机技术的普遍应用,人们对存储设备的性能要求越来越高,RAID技术已作为一项成熟的技术广泛的应用于磁盘阵列中。简单地说,RAID是把多块独立的物理硬盘按不同方式组合起来形成一个逻辑硬盘组,从而提供了比单个硬盘更高的存储性能和提供数据冗余的技术。数据冗余技术是指在用户数据一旦发生损坏后,利用冗余信息可以使损坏数据得以恢复,从而保障了用户数据的安全。磁盘阵列因其组成方式不同形成了不同的RAID级别,现在的RAID包括从RAID0到RAID6的七种不同基本级别。另外,还有一些基本RAID级别的组合形式,如RAID0+1为RAID0与RAID1的组合,RAID0+5为RAID0与RAID5的组合。不同RAID级别代表不同的存储性能、数据安全性和存储成本。比如RAID0将数据分成许多块,然后并行地将它们写到磁盘阵列中的各个硬盘上;读出数据时,RAID控制器从各个硬盘上读取数据,把这些数据恢复为原来顺序后传给主机。这种方法的优点是采用数据分块、并行传送方式,能够提高主机读写速度,并且磁盘阵列中存储空间没有冗余。但它对系统的可靠性没有任何提高,任一个硬盘介质出现故障时,系统无法恢复。为了保证数据重组过程的安全性,现今的数据重组一般采用双控制器共同工作的方式,即其中一个控制器为正在重组控制器,对数据的重组进程及主机读写请求等进行控制;另一个控制器则为正在重组控制器的备份,当正在重组控制器出现错误或失效时,此备份控制器可立即接替其工作。RAID1把磁盘阵列中的硬盘分成相同的两组,互为镜像,当任一磁盘介质出现故障时,可以利用其镜像上的数据恢复,从而提高系统的容错能力。它对数据仍采用分块后并行传输的方式,不仅提高了读写速度,也加强了系统的可靠性,但对硬盘的利用率低,冗余度为50%。RAID3同RAID0一样,也采用数据分块并行传送的方法,不同的是它在数据分块之后计算分块数据的奇偶校验和,然后把分块数据和奇偶校验信息一并写到硬盘阵列中。该方法对数据的存取速度和可靠性都有所改善,可利用未损坏数据盘和奇偶校验盘上的信息重构被损坏的数据。RAID3的硬盘利用率比RAID1要高,例如由5个硬盘组成的阵列,冗余度只有20%。不过,由于RAID3的奇偶校验信息固定存储在一个硬盘上,使该硬盘负担较重,从而产生新的瓶颈。RAID5与RAID3所采用的数据处理方法相似,所不同的是它把奇偶校验信息交叉写到阵列中的每个硬盘上,从而克服了RAID3中的瓶颈问题。所以对一个RAID来说,它将源于主机的读写请求分散到各个组成该RAID的成员磁盘上,以提高主机的读写性能,并且利用RAID中的校验数据或镜像数据提高系统的冗余性,以便在组成RAID的一个或多个成员磁盘失效后,能通过校验数据或镜像数据,恢复失效成员磁盘上的数据。同时一个RAID的读写性能及有效存储大小,与其RAID类型及组成该RAID的成员磁盘数量也有关。比如RAID5的写性能比RAID0+1差,这是因为RAID5写数据时,需要异或重新生成校验数据,而RAID0+1只需写镜像数据。又如RAID 3D+1P和RAID 7D+1P,其中D代表磁盘,D前的数字代表磁盘数量;P为校验数据,P前的数字为每分条的校验数据量,由于后者读写请求被分散到了更多的RAID成员磁盘上,提高了读写的并行性,RAID 7D+1P的读写性能相比RAID 3D+1P更好。但是,随着RAID的性能提高,其成本也随之增加。比如RAID 7D+1P相比RAID 3D+1P的性能有所提高,但其成员磁盘数量则由RAID 3D+1P的4个增加到了8个。因此,配置何种RAID类型取决于用户的应用场合、性能及成本要求。并且,在使用过程中,用户时常根据需求的变更来动态调整原有的RAID类型。比如随着用户存储信息的增加,原有的RAID 3D+1P已无法满足用户的需求,用户可增加一个或多个磁盘到原有的3D+1P系统中,即3D+1P将变成(3+r)D+1P,其中r为新增的磁盘数量。这样,既动态增加了RAID系统的容量,同时也提高了系统的性能。这种操作改变了RAID的级别,与此同时,就需要将原来磁盘阵列上的数据重新整理到作为一个整体的新的磁盘阵列上,而这种对数据进行重新整理的过程就叫做数据重组。一般情况下,在动态扩展或修改RAID类型时,需要重点考虑两个问题一个是要高效地将原RAID类型的数据重组成新RAID类型。另一个就是要保证在数据重组过程中,数据始终能保持一致性及安全性。在现有技术中,有很多专利涉及动态扩展RAID类型时的数据重组问题,其中一个有代表性的就是日立公司的专利EP0654736A2,如图1所示。其数据重组的方向为从低地址向高地址逐区域进行。重组过程中,先将原类型数据以原类型模式读到高速缓冲存储器(Cache)中,然后根据扩展后的模式重新生成新校验数据,最后将重组后的数据按新模式写入磁盘阵列。具体而言,该方法将所有数据按存储地址分成三个区域和两个点,其中区域6040为尚未重组区域,该区域仍为原RAID类型,对其访问必须按照原RAID类型进行;区域6020则为已完成重组区域,该区域已为新RAID类型,对其访问必须按照新RAID类型进行;而区域6030则为正在重组区域,该区域RAID类型混乱,对其访问必须在Cache中进行。两个点则为6011与6012,其中6011为尚未重组起始点,即尚未重组区域6040的逻辑起始地址;6012为已完成重组结束点,即已完成重组区域6020的逻辑结束地址。重组过程中,这两个点在Cache中保存并动态更新。于是,当主机需要读写阵列时,对已完成重组部分6020、尚未重组部分6040,分别按照扩展前与扩展后的模式访问阵列即可,但对正在重组的部分6030,则在Cache中完成读写请求。这种方法重组效率较高,也能通过重构恢复失效磁盘数据的方法,解决重组过程中磁盘失效问题。但是,对数据重组操作正在执行的区域而言,如果正按照新RAID类型重组数据时RAID控制器突然出现故障,由于原RAID类型区域中的数据已被覆盖,而该区域中新RAID类型数据的重组操作尚未完成,则该区域内的数据将失去原来的完整性与一致性。另一个同样具有代表性的数据重组技术就是MYLEX公司的专利WO98/15895。为了防止出现重组过程中原RAID类型数据被覆盖,新RAID类型数据尚未完全写入而造成数据无法恢复的问题,原RAID类型中需要重组的数据将被先拷贝到RAID系统的空闲空间,之后再开始重组。图2说明了其重组思路,图2中,D1至D3为原RAID类型磁盘阵列,D4为新增磁盘,图2a至2d分别为数据重组过程中不同存储状态的示意图。首先,在原RAID类型磁盘中确定一个区域,一般称之为破坏区(Destructive Zone),Destructive Zone的大小=N×M=2×3=6,即原RAID类型从0至5的区域,如图2a所示。然后,根据Destructive Zone大小,将D3最后6块分条数据单元(DB)DB1至DB6中的数据从下向上拷贝到新增磁盘D4的对应位置中,以便在D3中空出一个与Destructi本文档来自技高网...

【技术保护点】
一种独立冗余磁盘阵列中的数据重组方法,其特征在于,在原独立冗余磁盘阵列系统高地址侧尾部预留一块磁盘空间作为重组区域,将该预留重组区域的高地址作为写入数据的起始地址,并将原独立冗余磁盘阵列系统中存有数据的高地址作为重组数据的起始高地址,该数据重组方法还包含以下步骤:a.确定当前要重组数据的低地址,并将当前要重组数据高地址到低地址之间的数据重组为新独立冗余磁盘阵列类型数据;b.将重组后的数据从写入数据的起始地址向低地址方向,顺序写入新独立冗余磁盘阵列系统中;   c.判断是否还有数据需要重组,如果有,则将当前要重组数据低地址的邻接低地址作为下次要重组数据的高地址,当前写入数据低地址的邻接低地址作为下次写入数据的起始地址,返回步骤a;否则结束当前重组流程。

【技术特征摘要】
1.一种独立冗余磁盘阵列中的数据重组方法,其特征在于,在原独立冗余磁盘阵列系统高地址侧尾部预留一块磁盘空间作为重组区域,将该预留重组区域的高地址作为写入数据的起始地址,并将原独立冗余磁盘阵列系统中存有数据的高地址作为重组数据的起始高地址,该数据重组方法还包含以下步骤a.确定当前要重组数据的低地址,并将当前要重组数据高地址到低地址之间的数据重组为新独立冗余磁盘阵列类型数据;b.将重组后的数据从写入数据的起始地址向低地址方向,顺序写入新独立冗余磁盘阵列系统中;c.判断是否还有数据需要重组,如果有,则将当前要重组数据低地址的邻接低地址作为下次要重组数据的高地址,当前写入数据低地址的邻接低地址作为下次写入数据的起始地址,返回步骤a;否则结束当前重组流程。2.如权利要求1所述的数据重组方法,其特征在于,所述预留重组区域包括至少一块大小为新独立冗余磁盘阵列系统的成员磁盘数量与原独立冗余磁盘阵列系统的成员磁盘数量的比值向上取整的区域。3.如权利要求1所述的数据重组方法,其特征在于,每次进行重组的数据区域的...

【专利技术属性】
技术研发人员:张巍黄玉环张国彬张粤
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利