可移动存储介质冗余数据保护方法技术

技术编号:2874278 阅读:230 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种可移动存储介质冗余数据保护方法,包括:将带库中的n盘磁带的数据逐盘按位异或运算,生成n盘磁带的校验数据,以作为备份纠错,然后写入单独磁带中,形成纠错磁带。借助该纠错磁带恢复数据磁带中损坏的数据。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种存储数据的保护方法,特别是一种。目前,负责海量数据存储管理的“数据归档、恢复系统”多数是国外厂商的软件产品,存在价格高、与用户需求差距较大、本地支持力度差等缺点。基于这些因素,我公司自行开发了用于海量数据存储管理的“数据归档、恢复管理系统”——M2ars(Multi-channel Multi-layer Archive & RestoreSystem)。M2ars具有许多同类产品不具备的优点,其中,磁带库中数据流磁带的冗余纠错算法就是M2ars所独有的。目前,海量计算机数据的存储管理在硬件结构上,流行的方式是采用以SAN为核心的存储架构,采用在线硬盘阵列、近线机械手磁带库、远线人工磁带架相结合的多级存储结构,常用的数据存储在硬盘阵列上,使用频度较低的数据由硬盘迁移存储到机械手数据流磁带库中,最不常用的数据再由磁带库中吐出,归档到远线人工磁带架上,只有采用这种方式,才能合理的保存、利用海量的计算机数据。其中,在近线磁带库存储这一环节中,存放在带库中的数据流磁带在频繁使用和长期保存后是有可能损坏的,从而导致存储在上面的数据的丢失。为了避免数据丢失,管理软件——M2ars就必须能够对保存在数据流磁带上的数据进行冗余纠错处理,以备在磁带损坏后,可以对保存在上面的数据进行恢复,防止数据丢失。M2ars在数据流磁带冗余纠错方法上,采用了独特的n+1冗余纠错算法,这种纠错算法与目前同类竞争产品的算法不同,是M2ars系统独有的。作为大型的数据归档存储系统,数据的安全是第一位的,数据的安全直接关系到用户的利益。存放在数据磁带中的数据经过一段时间后可能会出现问题,这是用户很关心的,为了解决这种问题,就需要对磁带中保存的数据进行纠错处理。目前,有2种方式可用来进行数据磁带可靠性的提高。对于磁带的冗余纠错,现在的两种方法是磁带内冗余和整盘磁带冗余。磁带内冗余是指,在一盘磁带内部,在写完一段数据后,就加入一个校验位对其进行纠错,这样,在整盘数据磁带中,必然会加入许多厂商自身的校验数据。这样,磁带的数据记录格式会是厂商自己的,换句话说,使用其它的磁带恢复软件,就不能正确的读取本盘磁带中的数据。本专利技术的,包括以下步骤A)逐盘读出数据磁带的数据;B)将读出的数据磁带数据逐一按位相关处理,得到可逆处理的所有数据磁带的总冗余数据;C)将总冗余数据写入一个备用磁带中,形成纠错磁带。其中,所述相关处理包括B1)首先将其中两盘数据磁带的数据按位相关处理,得到一组冗余数据;B2)用该组冗余数据与下一盘数据磁带的数据按位相关处理,得到另一组冗余数据;B3)对其余数据磁带的数据分别重复与步骤B2类似的相关处理,直至得到全部数据磁带的总冗余数据。其中,所述相关处理是异或处理。其中,所述相关处理是加法处理。其中,所述冗余数据是校验数据。其中,所述相关处理步骤包括将第1数据磁带的数据与第2数据磁带的数据分别按位异或,得到第1组冗余数据;将第1组校验数据与第3数据磁带的数据分别按位异或,得到第2组冗余数据,直至将第n-2组冗余数据与第n数据磁带的数据分别按位异或,得到第n-1组冗余数据;把所述第n-1组冗余数据作为n个数据磁带的总校验数据。其中,当进行异或的两盘数据长度不一致时,将不足方补零,然后按位异或。此外,还包括一个恢复数据磁带的步骤,包括当一个磁带的数据损坏时,从校验磁带中取出校验数据,通过与形成纠错磁带相反的顺序逐一对各磁带数据按位异或运算,恢复损坏磁带的数据。其中,所述相关处理步骤包括将n盘数据磁带的所有数据分别按位相加,得到一组冗余数据;把该组冗余数据作为n个数据磁带的总校验数据。其中,在所述按位相加步骤中,去掉相加的溢出位,以得到冗余数据。这里需要特别说明的是,本专利技术所述的“相关处理”是指对两组或者多组磁带数据进行处理,以得到与这些组磁带数据关联的一组校验数据(即,冗余数据),该校验数据作为逆向处理以恢复磁带数据的基础。下面结合附图以具体实例对本专利技术进行详细说明。在实际使用中M2ars采用了如下技术用户可以事先指定一个存储池,其中的所有磁带用来进行冗余存储。所有的磁带在近线存储设备中的时候,磁带中数据的安全性应该由存储设备的厂商进行保护,只有在磁带在迁移策略起作用触发数据从近线存储设备向远线存储设备进行迁移时,系统会按照特定的冗余算法,根据用户的设定使用n盘数据带加1盘冗余纠错带的方法进行数据冗余计算和归档,而且这个纠错机制的实施即使只有一个数据磁带驱动器也可以正常完成,完成后n+1盘磁带会一起迁移到远线存储系统中。这种冗余纠错机制的具体实现方法如下(第一实施例)将带库中的n盘磁带(n值可以根据实际需要自由设定)进行按位异或运算(这里的异或运算指标准逻辑中的异或运算)。也就是,先将两盘数据流磁带内数据进行按位异或计算(磁带内数据本身即为数字化数据,通过磁带操作标准函数读出即可,所谓按位异或,即两盘磁带对应数据逐位按位异或运算,当两盘磁带数据长度不一致时,不足方补零即可对齐,举例说明,磁带A数据为01001,磁带B数据为1011,后者数据少一位,补零后为10110,异或运算后结果为11111,当磁带A数据丢失时,取出磁带B数据1011,再取出冗余后数据11111,把前者数据补0后为10110,逐位异议或后为01001,即为磁带A数据),得出的结果再与下一盘磁带内数据进行按位异或计算,以次类推,将n盘磁带内数据全部进行按位异或计算后生成的冗余数据作为备份纠错,写入单独的纠错磁带。这样,当这n盘磁带中有任何一盘磁带损坏的话,利用冗余数据对其它盘磁带进行逆向按位异或处理,将损坏的磁带恢复(稍后将进行详细说明)。并且如果这n盘磁带中有不止一盘磁带存在部分损坏,甚至每盘磁带都有不同程度的损坏,只要每盘磁带损坏的位置不互相重迭的话,仍然可以通过冗余数据对每盘磁带损坏部分进行恢复。上述过程如附图说明图1所示。在图1所示的处理中,数据磁带1至n被划分成6个数据段,即数据段1至数据段6,通过数据磁带1的各数据段与数据磁带2相对应的各数据段的数据分别按位异或运算,得到第一组检验数据。然后将第1组校验数据的各数据段与数据磁带3的各对应数据段分别按位异或运算,得到第2组检验数据。最后,将第n-2组校验数据的各数据段与数据磁带n的各对应数据段分别按位异或运算,得到第n-1组校验数据。将第n-1组校验数据写入单独的纠错磁带,从而形成图1的校验磁带,即纠错磁带。图2示出了损坏磁带的纠错恢复的处理过程。该纠错恢复处理过程是校验磁带形成过程的逆向处理过程。如果数据磁带1损坏,则恢复处理过程为校验磁带的校验数据与数据磁带n的数据分别按位异或运算得到第n-2组校验数据,依此类推,得到第1组校验数据,然后用第1组校验数据与数据磁带2的数据分别按位异或运算,得到数据磁带1的数据。例如,假定磁带1的数据为01001,磁带2的数据为10110,第1组校验数据(冗余数据)为11111,当磁带1数据丢失时,取出校验磁带的校验数据与数据磁带n的数据,分别按位异或运算得到第n-2组校验数据,依此类推,得到第1组校验数据,即11111,然后取出磁带2的数据10110,与第1组校验数据11111按位异或,得到数据01001,该数据即为磁带1的本文档来自技高网...

【技术保护点】
一种可移动存储介质冗余数据保护方法,包括以下步骤: A)逐盘读出数据磁带的数据; B)将读出的数据磁带数据逐一按位相关处理,得到可逆处理的所有数据磁带的总冗余数据; C)将总冗余数据写入一个备用磁带中,形成一盘纠错磁带。

【技术特征摘要】

【专利技术属性】
技术研发人员:龚平黄疆郭竞远刘峰刘江杨军李峻巍史瑛
申请(专利权)人:北京亚细亚智业科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1