数据存储系统中的自主奇偶交换技术方案

技术编号:19396765 阅读:22 留言:0更新日期:2018-11-10 05:02
提供了一种用于增加存储系统中的存储元件阵列的故障容限的计算机实现的方法。计算机实现的方法包括配置阵列以在n>1个存储元件集合中包括多个存储元件。该计算机实现的方法还包括配置纠删码,使得所述阵列的至少一列存储元件存储行奇偶校验信息,并且所述阵列的至少一行存储元件存储列奇偶校验信息。此外,计算机实现的方法还包括,存储数据的所述存储元件之一发生故障之后,从所述阵列中选择接收存储元件,通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持包含所述故障存储元件的所述存储元件集合的故障容限。

【技术实现步骤摘要】
【国外来华专利技术】数据存储系统中的自主奇偶交换
技术介绍
本专利技术涉及数据存储系统,并且更具体地,本专利技术涉及配置数据存储系统,使得其容许存储元件故障增加数量。如同最小化购置成本和所有权成本,维护数据访问是云系统中的重要要求。为了确保数据访问,云系统可以使用其中每列是一个集合的二维阵列或者具有共同故障机制的JBOD(简单磁盘捆绑JustaBunchofDisks)来实现存储。此外,可以使用诸如RAID-5或RAID-6之类的独立磁盘冗余阵列(RAID)体系结构来保护这些集合。无论何时阵列中的单个磁盘出现故障,故障磁盘都可以被替换为备用磁盘。然而,当可用的备用磁盘的数量变少时,可能需要服务调用。另外,自主奇偶校验交换是一种通过将奇偶校验磁盘转换为数据磁盘来增加存储系统中的故障容限(failuretolerance)的概念。但是,在云等级(cloud-class)系统中,防止导致全部存储元件集合(例如全部JBOD)丢失(集合丢失)的故障也很重要。尽管一些现有技术的系统可以弥补个别磁盘或整个JBOD甚至这些系统的组合的故障,但是这些系统相对于集合丢失和元件丢失的组合的恢复能力降低了。特别地,阵列的每个集合可以形成故障边界,由此基于单个事件可以使一集合元件不可用或丢失。例如,到集合的网络附件或供电可能发生故障,或者集合可能被无意中删除,错误配置等。当发生这样的事件时,大量元件将被脱机或丢失,但是还处在特定物理配置中。然而,当使用奇偶校验交换时,随着时间的推移,阵列的逻辑配置将偏离阵列的初始物理配置。相应地,阵列的物理故障边界将不同于阵列的逻辑故障边界。
技术实现思路
在一个一般实施例中,提供了一种用于增加存储系统中的存储元件阵列的故障容限的计算机实现的方法。计算机实现的方法包括配置阵列以在n>1个存储元件集合中包括多个存储元件。该计算机实现的方法还包括配置纠删(erasure-correcting)码,所述纠删码防止所述阵列的所述存储元件中的至少一个存储元件的丢失以及所述阵列的所述存储元件集合中的一个集合的丢失。纠删码被配置为使得所述阵列的至少一列存储元件存储行奇偶校验信息,并且所述阵列的至少一行存储元件存储列奇偶校验信息。此外,计算机实现的方法还包括在存储数据的所述存储元件之一发生故障之后,从所述阵列中选择接收存储元件。另外,计算机实现的方法包括通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持包含所述故障存储元件的所述存储元件集合的故障容限。在另一个一般实施例中,提供一种用于增加存储系统中的存储元件阵列的故障容限的计算机程序产品。所述计算机程序产品包括具有其中嵌入程序指令的计算机可读存储介质,所述程序指令可由处理器执行以使所述处理器将阵列配置以在n>1个存储元件集合中包括多个存储元件。此外,程序指令可由处理器执行以使处理器配置纠删码,所述纠删码防止所述阵列的所述存储元件中的至少一个存储元件的丢失以及所述阵列的所述存储元件集合中的一个集合的丢失。纠删码被配置为使得所述阵列的至少一列存储元件存储行奇偶校验信息,并且所述阵列的至少一行存储元件存储列奇偶校验信息。而且,程序指令可由处理器执行,以使得处理器在存储数据的所述存储元件之一发生故障之后,由所述处理器从所述阵列中选择接收存储元件。此外,程序指令可由处理器执行以使处理器通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持所述故障存储元件的所述存储元件集合的故障容限。从以下详细描述中,本专利技术的其它方面和实施例将变得显而易见,所述详细描述结合附图时,以示例的方式示出了本专利技术的原理。附图说明现在将参照附图仅以举例的方式描述本专利技术的实施例,在附图中:图1示出了根据一个实施例的用于存储阵列的一般物理布局。图2示出了根据一个实施例的用于增加存储阵列的故障容限的方法。图3示出了根据一个实施例的阵列的逻辑布置。图4A-7B示出了根据一个实施例的图3的阵列的存储元件的故障和重建。图8是根据一个实施例的对云系统使用的预计的维护时间的图表。具体实施方式以下描述是为了说明本专利技术的一般原理的目的而做出的,并不意味着限制在此要求保护的专利技术构思。此外,本文描述的特定特征可以与其他在各种可能的组合和排列的每一个中描述的特征组合使用。除非在此另外具体定义,否则将给予所有术语其最宽泛的可能解释,包括从说明书暗示的含义以及本领域技术人员理解和/或如在词典、论文等中定义的含义。还必须注意的是,除非另外指明,否则如说明书和所附权利要求中所使用的、单数形式“一”,“一个”和“该”包括复数指示物。将进一步理解的是,当在本说明书中使用时,术语“包括”和/或“包含”指定所陈述的特征、整体、步骤、操作、元件和/或组件的存在,但不排除一个或多个其他特征、整体、步骤、操作、元件、组件和/或其组合的存在或添加。以下描述公开了用于云系统中的自主奇偶校验交换的系统、方法和计算机程序产品的若干优选实施例。下面描述的实施例提供了可以应用于具有许多不同存储元件的物理配置的系统的阵列配置和故障容限方法。在任何实施例中,诸如云系统之类的存储系统可被配置为提供具有高数据效率的高可用性、以及低购置成本和延期维护能力。在一个一般实施例中,提供了一种用于增加存储系统中的存储元件阵列的故障容限的计算机实现的方法。计算机实现的方法包括配置阵列以在n>1个存储元件集合中包括多个存储元件。该计算机实现的方法还包括配置纠删(erasure-correcting)码,所述纠删码防止所述阵列的所述存储元件中的至少一个存储元件的丢失以及所述阵列的所述存储元件集合中的一个集合的丢失。纠删码被配置为使得所述阵列的至少一列存储元件存储行奇偶校验信息,并且所述阵列的至少一行存储元件存储列奇偶校验信息。此外,计算机实现的方法还包括在存储数据的所述存储元件之一发生故障之后,从所述阵列中选择接收存储元件。另外,计算机实现的方法包括通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持包含所述故障存储元件的所述存储元件集合的故障容限。在另一个一般实施例中,提供一种用于增加存储系统中的存储元件阵列的故障容限的计算机程序产品。所述计算机程序产品包括具有其中嵌入程序指令的计算机可读存储介质,所述程序指令可由处理器执行以使所述处理器将阵列配置以在n>1个存储元件集合中包括多个存储元件。此外,程序指令可由处理器执行以使处理器配置纠删码,所述纠删码防止所述阵列的所述存储元件中的至少一个存储元件的丢失以及所述阵列的所述存储元件集合中的一个集合的丢失。纠删码被配置为使得所述阵列的至少一列存储元件存储行奇偶校验信息,并且所述阵列的至少一行存储元件存储列奇偶校验信息。而且,程序指令可由处理器执行,以使得处理器在存储数据的所述存储元件之一发生故障之后,由所述处理器从所述阵列中选择接收存储元件。此外,程序指令可由处理器执行以使处理器通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持所述故障存储元件的所述存储元件集合的故障容限。在另一个一般实施例中,提供了一种系统,处理器和与处理器集成和/或可由处理器执行的逻辑,所述逻辑被配置为本文档来自技高网...

【技术保护点】
1.一种用于增加存储系统中的存储元件阵列的故障容限的计算机实现的方法,包括:配置阵列以在n>1个存储元件集合中包括多个存储元件;配置纠删码,所述纠删码防止所述阵列的所述存储元件中的至少一个存储元件的丢失以及所述阵列的所述存储元件集合中的一个集合的丢失,其中所述纠删码被配置使得:所述阵列的至少一列存储元件存储行奇偶校验信息;所述阵列的至少一行存储元件存储列奇偶校验信息;在存储数据的所述存储元件之一发生故障之后,从所述阵列中选择接收存储元件;以及通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持包含所述故障存储元件的所述存储元件集合的故障容限。

【技术特征摘要】
【国外来华专利技术】2015.10.30 US 14/929,2191.一种用于增加存储系统中的存储元件阵列的故障容限的计算机实现的方法,包括:配置阵列以在n>1个存储元件集合中包括多个存储元件;配置纠删码,所述纠删码防止所述阵列的所述存储元件中的至少一个存储元件的丢失以及所述阵列的所述存储元件集合中的一个集合的丢失,其中所述纠删码被配置使得:所述阵列的至少一列存储元件存储行奇偶校验信息;所述阵列的至少一行存储元件存储列奇偶校验信息;在存储数据的所述存储元件之一发生故障之后,从所述阵列中选择接收存储元件;以及通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持包含所述故障存储元件的所述存储元件集合的故障容限。2.如权利要求1所述的计算机实现的方法,包括响应于达到n个存储元件故障而发起所述故障存储元件的替换。3.如权利要求1所述的计算机实现的方法,其中所述纠删码被配置为使得所述存储元件中的至少一个存储元件存储全局奇偶校验信息,并且所述纠删码具有到元件故障的汉明距离6。4.根据权利要求1所述的计算机实现的方法,其中所述纠删码被配置为使得所述存储元件中的至少两个存储元件存储全局奇偶校验信息,并且所述纠删码具有到元件故障的汉明距离8。5.根据权利要求1所述的计算机实现的方法,其中所述接收存储元件是从存储列奇偶校验信息的所述至少一行存储元件中选择的,使得在重建所述至少一部分数据到所述接收存储元件之前,所述接收存储元件先前存储列奇偶校验信息。6.如权利要求5所述的计算机实现的方法,其中所述接收存储元件与所述故障存储元件位于所述阵列的同一集合中,使得所述接收存储元件和所述故障存储元件共享故障边界。7.如权利要求6所述的计算机实现的方法,其中所述接收存储元件和所述故障存储元件被包括在相同的简单磁盘捆绑(JBOD)中。8.一种用于增加存储系统中的存储元件阵列的故障容限的计算机程序产品,所述计算机程序产品包括具有其中嵌入程序指令的计算机可读存储介质,所述程序指令可由处理器执行以使所述处理器:由处理器配置阵列以在n>1个存储元件集合中包括多个存储元件;由所述处理器配置纠删码,所述纠删码防止所述阵列的所述存储元件中的至少一个存储元件的丢失以及所述阵列的所述存储元件集合中的一个集合的丢失,其中所述纠删码被配置使得:所述阵列的至少一列存储元件存储行奇偶校验信息;所述阵列的至少一行存储元件存储列奇偶校验信息;在存储数据的所述存储元件之一发生故障之后,由所述处理器从所述阵列中选择接收存储元件;以及由处理器通过执行奇偶校验交换操作来将所述数据的至少一部分重建到所述接收存储元件上,所述奇偶校验交换操作保持所述故障存储元件的所述存储元件集合的故障容限。9.根据权利要求8所述的计算机程序产品,所述程序指...

【专利技术属性】
技术研发人员:M·布劳姆S·R·赫特兹勒尔
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1