使用故障存储设备的重建助手制造技术

技术编号:24949775 阅读:20 留言:0更新日期:2020-07-18 00:01
本发明专利技术公开了用于使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源在存储系统中重组数据并重建故障存储设备的方法、系统和其他方面。例如,一种方法可包括:响应于在存储系统中检测到故障存储设备,在存储系统中的一个或多个正在运行的存储设备中定位数据和冗余信息,以用于重组故障存储设备的数据;向一个或多个正在运行的存储设备发布对等命令,以从一个或多个正在运行的存储设备获得数据和冗余信息;以及基于从一个或多个正在运行的存储设备获得的数据和冗余信息重组故障存储设备的数据,其中故障计算设备的正在运行的计算资源至少部分地执行定位、发布和重组中的一者或多者。

【技术实现步骤摘要】
【国外来华专利技术】使用故障存储设备的重建助手
技术介绍
本公开涉及存储系统。在更具体的示例中,本公开涉及用于使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源在存储系统中重组数据并重建故障存储设备的方法和系统。具有多个存储设备的存储系统通常采用数据冗余技术(例如,独立磁盘冗余阵列(RAID)镜像或奇偶校验、纠删码)来实现数据的重组和故障存储设备的重建。然而,用于故障存储设备的常规数据重组和重建过程可能导致系统性能显著劣化,因为系统中剩余的正在运行的存储设备可能需要用于重组丢失的数据,这可能需要大量的CPU时间以及存储系统互连器的带宽。例如,当RAID阵列中的存储设备已发生故障时,在常规系统中,故障存储设备被推出阵列,并且RAID控制器(独立的或由主机CPU托管)向剩余的正在运行的存储设备发送附加命令以重组故障存储设备的丢失的数据。数据的重组通常由RAID控制器使用异或(XOR)或伽罗瓦域(GF)运算来执行。
技术实现思路
本公开涉及用于使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源在存储系统中重组数据并重建故障存储设备的方法和系统。如上所述,与用于故障存储设备的常规数据重组和重建过程相关联的问题是,这些过程可能导致在数据恢复期间系统性能显著劣化。鉴于此,需要一种用于在存储系统中重组数据并重建故障存储设备的改进的方法。如本文所公开的本公开的各种实施方案可使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源在存储系统中重组数据并且/或者重建故障存储设备。在至少一些实施方案中,故障存储设备本身可通过以对等(P2P)方式与存储系统中的剩余的正在运行的存储设备通信来参与故障存储设备数据重组和/或重建过程。此外,在至少一些实施方案中,在执行设备重建时可考虑故障存储设备的实际故障机制。例如,在故障存储设备表现出仅部分介质故障的情况下,数据重组可限于在介质的仅故障部分上执行。因此,本公开的一个或多个实施方案可提供多个技术特征和优点,包括但不限于以下中的一个或多个:(1)通过使用故障存储设备的正在运行的计算资源和/或存储资源来重组故障存储设备的数据,改善了故障存储设备数据重组和/或重建过程期间的系统性能。(2)在故障存储设备中的数据部分丢失的情况下,通过具体地针对介质的故障部分执行数据重组过程,改善了故障存储设备数据重组和/或重建过程期间的系统性能。在这些情况下,系统性能的劣化可与仅实际数据损失量成比例,而不是与故障存储设备的所有数据成比例。本公开包括但不限于以下方面:根据一个创新方面,一种方法包括:响应于在存储系统中检测到故障存储设备,在存储系统中的一个或多个正在运行的存储设备中定位数据和冗余信息,以用于重组故障存储设备的数据;向所述一个或多个正在运行的存储设备发布一个或多个对等命令,以从所述一个或多个正在运行的存储设备获得所述数据和所述冗余信息;以及基于从该一个或多个正在运行的存储设备获得的数据和冗余信息重组故障存储设备的数据,其中故障计算设备的正在运行的计算资源至少部分地执行定位、发布和重组中的一者或多者。根据另一个创新方面,一种装置包括:一个或多个处理器;以及逻辑部件,该逻辑部件可由该一个或多个处理器执行,该逻辑部件被配置为执行操作,这些操作包括:响应于在存储系统中检测到故障存储设备,在存储系统中的一个或多个正在运行的存储设备中定位数据和冗余信息,以用于重组故障存储设备的数据;向所述一个或多个正在运行的存储设备发布一个或多个对等命令,以从所述一个或多个正在运行的存储设备获得所述数据和所述冗余信息;以及基于从该一个或多个正在运行的存储设备获得的数据和冗余信息重组故障存储设备的数据,其中故障计算设备的正在运行的计算资源至少部分地执行定位、发布和重组中的一者或多者。根据又一个创新方面,一种装置包括:具有一个或多个处理器的控制器;以及耦接到控制器的存储阵列,该存储阵列包括多个存储设备,其中控制器和存储阵列被配置为执行操作,这些操作包括:由控制器检测存储阵列中的故障存储设备;由所述故障存储设备在所述存储阵列中的一个或多个正在运行的存储设备中定位数据和冗余信息,以用于重组所述故障存储设备的数据;由所述故障存储设备向所述一个或多个正在运行的存储设备发布一个或多个对等命令,以从所述一个或多个正在运行的存储设备获得所述数据和所述冗余信息;由所述故障存储设备基于从所述一个或多个正在运行的存储设备获得的所述数据和所述冗余信息重组所述故障存储设备的所述数据;以及由控制器将故障存储设备的重组数据写入到存储阵列中的一个或多个可用位置。这些和其他具体实施可各自任选地包括以下特征中的一个或多个:该方法或操作还包括将故障存储设备的重组数据写入到存储系统中的一个或多个可用位置;故障存储设备的正在运行的计算资源为设备控制器;该一个或多个对等命令包括由故障存储设备发布和执行的读取命令;方法还包括在存储系统中限定条带,条带与故障存储设备的数据以及该一个或多个正在运行的存储设备中的数据和冗余信息相关联;方法或操作还包括识别故障存储设备的包含可恢复数据的介质区段,以及将可恢复数据从故障存储设备的介质区段中的第一位置复制到故障存储设备的介质区段中的第二位置;并且故障存储设备的介质区段为存储器单元。这些方面中的一个或多个的其他实施方式包括对应的系统、装置和计算机程序,其被配置为执行编码在计算机存储设备上的方法的动作。应当理解,本公开中使用的语言主要是出于可读性和指导目的而选择的,并不限制本文公开的主题的范围。附图说明本文介绍的技术通过示例而非限制的方式在附图中示出,在附图中,相同的附图标记用于指相似的元件。图1描绘了根据一个实施方案的包括主机和存储系统的示例性计算系统的框图。图2描绘了根据一个实施方案的用于图1所示的存储系统的示例性系统控制器的框图。图3描绘了根据一个实施方案的用于图1所示的存储系统的示例性设备控制器的框图。图4描绘了根据一个实施方案的用于图1所示的存储系统的示例性方法的流程图,该方法用于使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源经由对等通信重组故障存储设备的数据。图5描绘了根据一个实施方案的用于图1所示的存储系统的示例性方法的流程图,该方法用于使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源经由对等通信重建故障存储设备。图6描绘了根据一个实施方案的用于图1所示的存储系统的示例性存储阵列的框图。图7描绘了根据一个实施方案的用于图6所示的存储阵列的示例性方法的流程图,该方法用于使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源经由对等通信重建故障存储设备。图8描绘了根据一个实施方案的用于图1所示的计算系统的示例性方法的流程图,该方法用于根据分布式全局闪存转换层(FTL)数据管理方案来执行数据管理请求(例如,读取请求)。具体实施方式公开了新型数据处理技术,诸如但不限于用于使用故障存储设备的一个或多个正在运行的计算资源和/或存储资源在存储系统本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,包括:/n响应于在存储系统中检测到故障存储设备,在所述存储系统中的一个或多个正在运行的存储设备中定位数据和冗余信息,以用于重组所述故障存储设备的数据;/n向所述一个或多个正在运行的存储设备发布一个或多个对等命令,以从所述一个或多个正在运行的存储设备获得所述数据和所述冗余信息;以及/n基于从所述一个或多个正在运行的存储设备获得的所述数据和所述冗余信息重组所述故障存储设备的所述数据,/n其中故障计算设备的正在运行的计算资源至少部分地执行所述定位、所述发布和所述重组中的一者或多者。/n

【技术特征摘要】
【国外来华专利技术】20180803 US 16/054,9721.一种计算机实现的方法,包括:
响应于在存储系统中检测到故障存储设备,在所述存储系统中的一个或多个正在运行的存储设备中定位数据和冗余信息,以用于重组所述故障存储设备的数据;
向所述一个或多个正在运行的存储设备发布一个或多个对等命令,以从所述一个或多个正在运行的存储设备获得所述数据和所述冗余信息;以及
基于从所述一个或多个正在运行的存储设备获得的所述数据和所述冗余信息重组所述故障存储设备的所述数据,
其中故障计算设备的正在运行的计算资源至少部分地执行所述定位、所述发布和所述重组中的一者或多者。


2.根据权利要求1所述的计算机实现的方法,还包括:
将所述故障存储设备的所述重组数据写入到所述存储系统中的一个或多个可用位置。


3.根据权利要求1所述的计算机实现的方法,其中所述故障存储设备的所述正在运行的计算资源为设备控制器。


4.根据权利要求1所述的计算机实现的方法,其中所述一个或多个对等命令包括由所述故障存储设备发布和执行的读取命令。


5.根据权利要求1所述的计算机实现的方法,还包括:
在所述存储系统中限定条带,其中所述条带与所述故障存储设备的所述数据以及所述一个或多个正在运行的存储设备中的所述数据和所述冗余信息相关联。


6.根据权利要求1所述的计算机实现的方法,还包括:
识别所述故障存储设备的包含可恢复数据的介质区段;以及
将所述可恢复数据从所述故障存储设备的所述介质区段中的第一位置复制到所述故障存储设备的所述介质区段中的第二位置。


7.根据权利要求6所述的计算机实现的方法,其中所述故障存储设备的所述介质区段为存储器单元。


8.一种装置,包括:
一个或多个处理器;和
逻辑部件,所述逻辑部件能够由所述一个或多个处理器执行,所述逻辑部件被配置为执行操作,所述操作包括:
响应于在存储系统中检测到故障存储设备,在所述存储系统中的一个或多个正在运行的存储设备中定位数据和冗余信息,以用于重组所述故障存储设备的数据;
向所述一个或多个正在运行的存储设备发布一个或多个对等命令,以从所述一个或多个正在运行的存储设备获得所述数据和所述冗余信息;以及
基于从所述一个或多个正在运行的存储设备获得的所述数据和所述冗余信息重组所述故障存储设备的所述数据,
其中所述故障计算设备的正在运行的计算资源至少部分地执行所述定位、所述发布和所述重组中的一者或多者。


9.根据权利要求8所述的装置,其中所述逻辑部件被配置为执行操作,所述操作还包括:
将所述故障存储设备的所述重组数据写入到所述存储系统中的一个或多个可用位置。


10.根据权利要求8所述的装置,其中所述...

【专利技术属性】
技术研发人员:A·库尔卡尼V·保可霍维汀B·W·欧卡拉夫卡S·苏巴拉奥
申请(专利权)人:西部数据技术公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1