存储系统技术方案

技术编号:7168213 阅读:255 留言:0更新日期:2012-04-11 18:40
一种存储系统,包括:分布式存储处理装置,配置为将多个片段数据以分布方式存储到多个存储装置中;数据放置监控装置,配置为监控片段数据的数据放置状态并存储代表数据放置状态的数据放置信息;以及数据重构装置,配置为当存储装置宕机时,基于存储在另一存储装置中的片段数据来重新生成存储在宕机的存储装置中的片段数据。所述存储系统还包括:数据放置返回装置,配置为当宕机的存储装置恢复时,通过使用存储在已经恢复的存储装置中的片段数据来恢复片段数据的数据放置,从而使得数据放置状态变为如由数据放置监控装置所存储的数据放置信息所代表的。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种存储系统,并且特别地涉及一种将数据分布和存储到多个存储设备中的存储系统。
技术介绍
近年来,随着计算机的发展和变得流行,各种类型的信息被转换为数字数据。作为用于存储这种数字数据的设备,存在诸如磁带和磁盘的存储设备。由于要存储的数据已经日益增加并且其数量已经变得巨大,因此需要高容量存储系统。另外,需要在降低存储设备的成本的同时,保持可靠性。此外,要求以后能够容易地获取数据。结果是,希望存在这种存储系统,其能够自动地实现其存储容量和性能的提高,其不需要重复存储从而减少了存储成本,并且其具有高冗余度。在这种情况下,近年来,已经开发了如专利文献1中所示的内容地址存储系统。这一内容地址存储系统将数据分布和存储到多个存储设备中,并且基于与数据的内容相对应地指定的唯一内容地址来指定存储数据的存储位置。具体而言,内容地址存储系统将预定数据拆分为多个片段,向其添加作为冗余数据的片段,并且分别将该多个片段存储到多个存储设备中。之后,通过指定内容地址,可以获取数据,即存储在由该内容地址指定的存储位置中的片段,并且根据该多个片段恢复拆分之前的预定数据。进一步,生成内容地址以便唯一对应于数据的内容。因此,在存在重复数据的情况下,可以参考同一存储位置上的数据来得到具有同一内容的数据。从而,不必单独存储重复数据,而是可以省略重复记录并减小数据容量。另一方面,配备有多个存储设备的存储系统需要具有负载平衡的结构,以便不会对某些节点施加更多负载或增强的负载。这种负载平衡系统的一个示例是专利文献2中所描述的系统。将详细描述负载平衡存储系统。负载平衡存储系统具有在由于在数据存储时添加了冗余数据而出现错误的情况下能够自行执行数据恢复的自修复功能。另外,负载平衡存储系统具有分布式弹性数据功能,该功能在确定组成部分(component)位于什么节点中时通过自治地将每个节点的负载考虑为一个系统而进行分布。在这种存储系统中,首先,将要存储的数据拆分为细小的数据块。更细致地拆分每个数据块,向其添加多片冗余数据,并且将这些数据存储到构成该系统的多个节点中。属于存储系统的节点各自具有称为组成部分的数据存储区域,并且数据块存储在组成部分中。 另外,在该存储系统中,利用组成部分来执行负载平衡,并且利用组成部分来执行节点之间的数据交换。组成部分在相应节点中的定位由该系统自治地执行。在上述系统中,在节点由于节点故障而与系统分离的情况下,在其他节点上重新生成该节点的组成部分。日本未审专利申请公开No.JP-A 2005-235171日本未审专利申请公开No.JP-A 2008-204206然而,如上所述,在存储系统具有通过自治地考虑每个节点的负载而进行分布的功能的情况下,在从节点故障恢复时对数据进行重新定位可能变得效率低下。将考虑图1 中示出的示例。首先,如图IA所示,节点A、B、C和D分别存储组成部分a、b、c和d。当在这一状态下节点A和B中发生了故障时,系统重新生成已经存在于节点A和B上的组成部分a和b,如图IB所示。在临时故障之后节点A和B再次参与系统(如图IC所示)的情况下,希望已经原始存在于节点A和B上的组成部分a和b分别返回到原始节点,但组成部分可能进入其他节点。在组成部分返回到原始节点的情况下,不执行数据的重新生成,这是因为节点保持原始数据。然而,在组成部分进入其他节点的情况下,需要分别重新生成数据。这需要在系统中进行数据重新生成处理。因此,可能执行不必要的数据重新生成或移动,并且在恢复时的数据重新定位变得效率低下,这可能增加系统的负担并导致处理延迟。
技术实现思路
因此,本专利技术的目的是提供一种能够提高数据恢复时的处理效率并防止系统负载和处理延迟的存储系统。为了实现该目的,本专利技术实施方式的存储系统包括多个存储装置和数据处理装置,该数据处理装置被配置为将数据存储到该多个存储装置中并获取存储在存储装置中的数据。该数据处理装置包括分布存储处理装置,配置为将多个片段数据分布并存储到该多个存储装置中,该片段数据包括通过将存储目标数据拆分为多片而获得的拆分数据以及用于恢复存储目标数据的冗余数据;数据位置监控装置,配置为监控相应存储装置中的片段数据的数据位置状态并存储代表数据位置状态的数据位置信息;以及数据恢复装置, 配置为当存储装置中的任何一个宕机时,基于存储在宕机的存储装置以外的存储装置中的片段数据来重新生成已经存储在宕机的存储装置中的片段数据并将其存储到其他存储装置中。数据处理装置还包括数据位置返回装置,配置为当宕机的存储装置复原时,通过使用存储在已经复原的存储装置中的片段数据来返回片段数据的数据位置,从而使得数据位置状态变为如数据位置监控装置所存储的数据位置信息所代表的。进一步,本专利技术另一实施方式的计算机程序是一种包括指令的计算机程序,该指令用于使配备有多个存储装置的信息处理设备实现数据处理装置,该数据处理装置被配置为将数据存储到该多个存储装置中并获取存储在存储装置中的数据,并且还实现分布存储处理装置,配置为将多个片段数据分布并存储到该多个存储装置中,该片段数据包括通过将存储目标数据拆分为多片而获得的拆分数据以及用于恢复存储目标数据的冗余数据; 数据位置监控装置,配置为监控相应存储装置中的片段数据的数据位置状态并存储代表数据位置状态的数据位置信息;数据恢复装置,配置为当存储装置中的任何一个宕机时,基于存储在宕机的存储装置以外的存储装置中的片段数据来重新生成已经存储在宕机的存储装置中的片段数据并将其存储到其他存储装置中;以及数据位置返回装置,配置为当宕机的存储装置复原时,通过使用存储在已经复原的存储装置中的片段数据来返回片段数据的数据位置,从而使得数据位置状态变为如数据位置监控装置所存储的数据位置信息所代表的。进一步,本专利技术另一实施方式的数据处理方法包括在配备有多个存储装置的信息处理设备中将数据存储到该多个存储装置中并获取存储在存储装置中的数据;将多个片段数据分布并存储到该多个存储装置中,该片段数据包括通过将存储目标数据拆分为多片而获得的拆分数据以及用于恢复存储目标数据的冗余数据;监控相应存储装置中的片段数据的数据位置状态并存储代表数据位置状态的数据位置信息;当存储装置中的任何一个宕机时,基于存储在宕机的存储装置以外的存储装置中的片段数据来重新生成已经存储在宕机的存储装置中的片段数据并将其存储到其他存储装置中;以及当宕机的存储装置复原时,通过使用存储在已经复原的存储装置中的片段数据来返回片段数据的数据位置,从而使得数据位置状态变为如已经存储的数据位置信息所代表的。利用上述配置,本专利技术能够实现高效和快速的数据恢复。附图说明图1是示出根据本专利技术的存储系统的操作的视图;图2是示出本专利技术第一示例性实施方式中的整个系统的配置的框图;图3是示出图2中所公开的存储系统的示意性配置的框图;图4是示出图3中所公开的存储系统的配置的功能框图;图5是用于说明图4中所公开的存储系统的操作的说明性视图;图6是用于说明图4中所公开的存储系统的操作的说明性视图;图7A和图7B是分别示出获得并存储在图4中所公开的存储系统中的数据的一个示例的视图;图8A和图8B是分别示出图4中所公开的存储系统的操作的流程图;图9是示出图4中所公开的存储系统的操作的流程图;图10是示出本文档来自技高网
...

【技术保护点】
1.一种存储系统,包括多个存储装置和数据处理装置,所述数据处理装置被配置为将数据存储到所述多个存储装置中并获取存储在所述存储装置中的数据,其中:所述数据处理装置包括:分布存储处理装置,配置为将多个片段数据分布并存储到所述多个存储装置中,其中所述片段数据包括通过将存储目标数据拆分为多片而获得的拆分数据以及用于恢复所述存储目标数据的冗余数据;数据位置监控装置,配置为监控相应存储装置中的片段数据的数据位置状态,并存储代表所述数据位置状态的数据位置信息;以及数据恢复装置,配置为当所述存储装置中的任何一个宕机时,基于存储在所述宕机的存储装置以外的存储装置中的片段数据,来重新生成已经存储在所述宕机的存储装置中的片段数据并将其存储到其他存储装置中;以及所述数据处理装置还包括数据位置返回装置,配置为当所述宕机的存储装置复原时,通过使用存储在已经复原的存储装置中的所述片段数据来返回所述片段数据的数据位置,从而使得所述数据位置状态变为如所述数据位置监控装置所存储的数据位置信息所代表的。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:野田贤治
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1