基于相关的存储设备故障的可能性的数据放置制造技术

技术编号:15570845 阅读:174 留言:0更新日期:2017-06-10 04:09
本发明专利技术涉及基于相关的存储设备故障的可能性的数据放置。存储装置包括接口和处理器。接口被配置成与多个存储设备进行通信。处理器被配置成:估计可能性度量,该可能性度量指示存储设备的相应的子集将并发地出故障的可能性;基于可能性度量,从多个存储设备中选择其上用于储存给定的数据和与给定的数据关联的冗余信息的存储设备组;并且将给定的数据和冗余信息储存在所选择的组中的存储设备上。

Data placement based on the possibility of related storage device failures

The present invention relates to data placement based on the possibility of related storage device failures. A storage device includes an interface and a processor. The interface is configured to communicate with a plurality of storage devices. The processor is configured to estimate the possibility measure, possibility of the possibility of corresponding measurement subset indicating storage equipment will be concurrently out of order; based on possibility measure, from a plurality of storage devices in the selection of the storage device for storing data associated with a given group of redundant information and data of the given; and the data redundancy and given the information storage storage device in the selected group in the.

【技术实现步骤摘要】
相关申请的交叉引用该申请要求享有提交于2015年11月25日的美国临时专利申请62/259,684的权益,其公开内容通过引用并入本文。专利
本专利技术总体涉及数据存储,并且具体来说,涉及用于基于相关的存储设备故障的可能性的数据放置的方法和系统。专利技术背景冗余存储方案被用于各种存储系统。一些冗余存储方案将数据的复制拷贝储存在不同的存储设备上。其他的冗余存储方案计算在数据上的冗余位(诸如,奇偶校验位、校验和位或者纠错编码(ECC)位),并且将冗余位储存在不同的存储设备上。专利技术概述在本文中描述的本专利技术的实施例提供了一种包括接口和处理器的存储装置。接口被配置成与多个存储设备进行通信。处理器被配置成:估计可能性度量,该可能性度量指示存储设备的相应的子集将会并发地出故障的可能性;基于可能性度量,从多个存储设备中选择在其上储存给定的数据和与给定的数据关联的冗余信息的存储设备组;并且将给定的数据和冗余信息储存在所选择组中的存储设备上。在一些实施例中,可能性度量被估计的子集包括成对的存储设备。在一些实施例中,冗余信息包括:给定的数据的拷贝,或者在给定的数据上计算出的一个或多个冗余位。在各个实施例中,处理器被配置成:根据存储设备的子集中的存储设备的相应的序列号或者制造日期、根据该子集中的存储设备的相应的存储介质的类型、根据该子集中的存储设备的相应的存储容量、根据该子集中的存储设备的相应的运行条件和/或根据由该子集中的存储设备报告的相应的自监测参数,对该子集估计可能性度量。在一些实施例中,处理器被配置成:在存储设备的使用期中更新可能性度量中的一个或多个可能性度量。在实施例中,处理器被配置成:基于所更新的可能性度量,更新对组的选择。在另一个实施例中,处理器被配置成:响应于所更新的可能性度量,将给定的数据或者冗余信息移动到不同的存储设备。根据本专利技术的实施例,另外提供了一种用于数据存储的方法,该方法包括估计可能性度量,该可能性度量指示多个存储设备的相应的子集将会并发地出故障的可能性。基于可能性度量,从多个存储设备中选择在其上储存给定的数据和与给定的数据关联的冗余信息的存储设备组。给定的数据和冗余信息被储存在所选择组中的存储设备上。根据本专利技术的实施例,还提供了一种计算机软件产品,该产品包括有形的非暂态计算机可读介质,在非暂态计算机可读介质中存储有程序指令,该指令在由处理器读取的时候,使得处理器与多个存储设备进行通信,以估计可能性度量,可能性度量指示存储设备的相应的子集将会并发地出故障的可能性;基于可能性度量,从多个存储设备中选择在其上储存给定的数据和与给定的数据关联的冗余信息的存储设备组;并且将给定的数据和冗余信息储存在选定组中的存储设备上。结合附图,从本专利技术的实施例的下列详细描述中,本专利技术将被更完全地理解,在附图中:附图简述图1是根据本专利技术的实施例示意性示出存储系统的方框图;以及图2是根据本专利技术的实施例示意性示出用于数据存储的方法的流程图。具体实施方式概述在本文中描述的本专利技术的实施例提供用于冗余数据存储的改善的方法和系统。具体来说,所公开的方法和系统降低了归因于存储设备的同时发生的故障的数据丢失的可能性。在一些实施例中,存储系统包括多个存储设备,例如,硬盘驱动器(HDD)和/或固态硬盘(SSD)。系统中的处理器(例如,存储控制器)在各个存储设备上冗余地储存数据。对于给定的数据,处理器通常产生与给定的数据关联的冗余信息,并且将给定的数据和冗余信息储存在被称为“条带(stripe)”的选定的一组存储设备上。冗余信息可以包括例如给定数据的一个或多个复制拷贝或者在给定的数据上计算出的一个或多个冗余位。在所公开的技术中,处理器估计并且记录在本文中被称为“相关故障的可能性”(LCF)的可能性度量。每个LCF对应于一对存储设备,并且每个LCF指示在这对存储设备中的两个存储设备将会同时出现故障的可能性。以下显示了示例参数,处理器可以通过这些示例参数估计LCF。处理器用LCF指定条带,即,用LCF选择数据及其关联的冗余信息储存于其上的多组存储设备。通常,处理器以使同一条带中的多个存储设备将会同时出现故障的可能性最小的方式将存储设备分配给条带。换句话说,处理器通常有助于将具有小LCF的存储设备分组到同一条带中,并且有助于将具有高LCF的存储设备分配到不同的条带。在一些实施例中,处理器在一段时间中监测存储设备的状态和/或运行条件,并且酌情更新LCF。处理器可以更新存储设备到条带的分配,以反映所更新的LCF。另外地或者可替换地,处理器可以将数据和/或冗余信息从一个存储设备移动到另一个存储设备,以更好地匹配所更新的LCF。通过基于LCF指定条带,所公开的技术降低了归因于相关的存储设备故障的数据丢失的可能性。结果,可以相当大地改善存储可靠性。同样可以将所公开的技术用于降低给定的可靠性水平所需要的冗余的量,由此降低系统成本并且增加存储容量。系统描述图1是根据本专利技术的实施例示意性示出存储系统20的方框图。可以将系统20用在例如数据中心中或者任何其他合适的环境中。在本示例中,系统20包括存储控制器24,存储控制器24将数据储存在多个存储设备28中。存储设备28可以包括例如硬盘驱动器(HDD)和/或固态硬盘(SSD)。在一些实施例中,系统20在存储介质方面是高度不同的,例如,系统20包括不同的供应商、存储介质类型、容量、使用年限以及其他特征的大量(例如,数百个)存储设备28。在图1的实施例中,存储控制器24包括用于与存储设备28进行通信的接口26、执行在本文中描述的方法的处理器32、以及用于储存处理器32使用的相关元数据和其他信息的存储器36。接口26可以包括例如网络接口控制器(NIC)或者任何其他合适的接口。存储器36可以包括例如随机存取存储器(RAM)或者闪存。在一些实施例中,处理器32将两种数据结构-“相关故障的可能性”(LCF)矩阵40和冗余表44储存在存储器36中。如以下将会详细解释的,LCF矩阵40拥有指示多对存储设备28将会同时出现故障的可能性的可能性度量。冗余表44指定了存储设备28到条带的分配以及由处理器32基于LCF而指定的分配。图1中显示的系统配置是示例配置,仅是因为概念清晰的目的被选择的。在可替换的实施例中,可以使用任何其它合适的配置。例如,系统20可以包括由网络互连的多个服务器,并且存储设备28可以驻留在这些服务器中。在这种实施例中,处理器32可以包括专用处理器(例如,在存储控制器中)。可替换地,可以由以上提到的服务器的一个或多个处理器执行处理器32的功能。进一步可替换地,可以将所公开的技术用在涉及多个存储设备上的数据存储的任何其他合适的系统或者环境中。可使用硬件/固件(诸如,在一个或多个专用集成电路(ASIC)或现场可编程门阵列(FPGA)中)实现系统20的各种组件。可替换地,可在软件中,或使用硬件/固件与软件组件的组合,来实现一些系统组件。在一些实施例中,处理器32可以包括通用处理器,该通用处理器以软件方式被编程,以执行在本文中描述的功能。例如,可通过网络以电子形式将软件下载到处理器,或者软件可以可替换地或附加地被提供和/或储存在非暂态有形介质(诸如,磁存储器、光存储器或电子存储器)上。基于相关故障的可能本文档来自技高网...
基于相关的存储设备故障的可能性的数据放置

【技术保护点】
一种存储装置,包括:接口,其被配置成与多个存储设备进行通信;以及处理器,其被配置成:估计可能性度量,所述可能性度量指示所述存储设备的相应的子集将并发地出故障的可能性;基于所述可能性度量,从所述多个存储设备中选择其上用于储存给定的数据和与所述给定的数据关联的冗余信息的存储设备组;以及将所述给定的数据和所述冗余信息储存在所选择的组中的存储设备上。

【技术特征摘要】
2015.11.25 US 62/259,6841.一种存储装置,包括:接口,其被配置成与多个存储设备进行通信;以及处理器,其被配置成:估计可能性度量,所述可能性度量指示所述存储设备的相应的子集将并发地出故障的可能性;基于所述可能性度量,从所述多个存储设备中选择其上用于储存给定的数据和与所述给定的数据关联的冗余信息的存储设备组;以及将所述给定的数据和所述冗余信息储存在所选择的组中的存储设备上。2.根据权利要求1所述的装置,其中,所述可能性度量被估计的所述子集包括成对的所述存储设备。3.根据权利要求1所述的装置,其中,所述冗余信息包括所述给定的数据的拷贝,或者在所述给定的数据上计算出的一个或多个冗余位。4.根据权利要求1所述的装置,其中,所述处理器被配置成:根据所述存储设备的一子集中的存储设备的相应的序列号或者制造日期,对该子集估计可能性度量。5.根据权利要求1所述的装置,其中,所述处理器被配置成:根据所述存储设备的一子集中的存储设备的相应的存储介质的类型,对该子集估计可能性度量。6.根据权利要求1所述的装置,其中,所述处理器被配置成:根据所述存储设备的一子集中的存储设备的相应的存储容量,对该子集估计可能性度量。7.根据权利要求1所述的装置,其中,所述处理器被配置成:根据所述存储设备的一子集中的存储设备的相应的运行条件,对该子集估计可能性度量。8.根据权利要求1所述的装置,其中,所述处理器被配置成:根据所述存储设备的一子集中的存储设备报告的相应的自监测参数,对该子集估计可能性度量。9.根据权利要求1所述的装置,其中,所述处理器被配置成:在所述存储设备的使用期中更新所述可能性度量中的一个或多个可能性度量。10.根据权利要求9所述的装置,其中,所述处理器被配置成:基于所更新的可能性度量,更新对所述组的选择。11.根据权利要求9所述的装置,其中,所述处理器被配置成:响应于所更新的可能性度量,将所述给定的数据或者所述冗余信息移动到不同的存储设备。12.一种用于数据存储的方法,包括:估计可能性度量,所述可能性度量指示多个存储设备的相应的子集将并发地出故障的可能性;基于所述可能性度量,从所述多个存储设备中选...

【专利技术属性】
技术研发人员:阿维谢伊·特雷格穆利·本耶胡达
申请(专利权)人:斯特拉托斯卡莱有限公司
类型:发明
国别省市:以色列;IL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1