当前位置: 首页 > 专利查询>伊姆西公司专利>正文

存储设备中用于故障恢复的方法和装置制造方法及图纸

技术编号:13603806 阅读:59 留言:0更新日期:2016-08-27 23:28
本发明专利技术的各实施方式提供了一种存储设备中用于故障恢复的方法和装置。所述存储设备包括至少一个服务器和存储装置并且在至少一个服务器上运行多个组件,该方法包括:在存储装置中对至少一个服务器上运行的多个组件中的一个或多个组件进行备份;监视至少一个服务器上故障的发生并且定位引起该故障的组件;获取备份在存储装置中的、与引起该故障的组件对应的一个或多个组件;以及利用所获取的一个或多个组件来恢复该故障。

【技术实现步骤摘要】

本公开的各实施例总体上涉及存储领域,并且更具体地涉及存储设备中用于故障恢复的方法和装置
技术介绍
目前的存储设备,特别是作为存储服务器的存储设备都不支持对控制路径数据(control path data)的备份和恢复。例如,对于市场上已有的一些存储设备,诸如EMC中端和高端的存储设备,其中具有不同功能的部分、例如存储处理器SP/控制站服务器CS/数据移动服务器DM上运行的操作系统内核、软件和系统的配置以及运行状态相关数据等都没有备份存在。因此,在配置改变、软件升级等引起软件不可用或系统宕机(system panic)的情况下或者其他原因导致系统宕机的情况下,例如在如下场景中:(1)用户利用存储设备供应商最新发布的软件信息对软件进行了非破坏性(NDU)升级,在该NDU过程中由于对驱动器和软件的改变可能导致系统宕机或者不能够重新启动或者某些软件不可用;(2)用户对某些软件进行新的配置,由此导致系统宕机或软件不可用;(3)随着时间流逝,系统自身累积错误导致系统宕机,如果在这些情况下用户不能够通过重新启动存储设备来解决遇到的问题而只能通过向存储设备供应商来寻求帮助,那么可能会不必要地浪费很多时间,并且由于系统不能及时恢复可能导致商业上的重大损失。另一方面,对于存储设备供应商的技术支持人员或工程师来说,也同样会不必要地耗费宝贵的时间。
技术实现思路
针对上述问题,本公开的各示例性实施例至少提供了一种使得用户能够在存储设备或存储服务器发生故障的情况下自行恢复系统或软件正常运行的方法和装置。本公开的各示例性实施例的其他特征、益处和优势将在结合附图阅读以下描述的具体实施方式时被更清楚地理解。根据本公开的一个方面,提供了一种在存储设备中用于故障恢复的方法,该存储设备包括至少一个服务器和存储装置并且在该至少一个服务器上运行多个组件。该方法包括在所述存储装置中对所述至少一个服务器上运行的多个组件中的一个或多个组件进行备份以及监视至少一个服务器上故障的发生并且定位引起该故障的一个或多个组件。该方法还包括获取备份在所述存储装置中的、与引起故障的一个或多个组件对应的一个或多个组件并且利用所获取的一个或多个组件来恢复该故障。根据本公开的另一方面,提供了一种在存储设备中用于故障恢复的装置,该存储设备包括至少一个服务器和存储装置并且在该至少一个服务器上运行多个组件。该用于故障恢复的装置包括备份模块、监视模块、获取模块和恢复模块。备份模块被配置为在存储装置中对至少一个服务器上运行的多个组件中的一个或多个组件进行备份、监视模块被配置为监视至少一个服务器上故障的发生并且定位引起该故障的一个或多个组件、获取模块被配置为获取备份在存储装置中的、与引起故障的一个或多个组件对应的一个或多个组件并且恢复模块被配置为利用所获取的一个或多个组件来恢复该故障。附图说明结合附图并参考以下详细说明,本专利技术各实施方式的特征、优点及其他方面将变得更加明显,在此以示例性而非限制性的方式示出了本专利技术的若干实施方式。在附图中相同或相近的附图标记指示相同或相近的单元或元素,其中:图1示出了现有的EMC VNX系列存储设备的高层架构的框图;图2示意性地示出了根据本公开实施例的基于逻辑单元搜索表和索引搜索表来获取期望组件备份的示例性检索方法200的流程图;图3示意性地示出了根据本公开实施例的在存储设备中用于故障恢复的方法300的流程图;以及图4示出了根据本公开实施例的在存储设备中用于故障恢复的装置400的示意性结构图。具体实施方式以下将参考附图详细描述本公开的各个示例性实施例。应当理解,给出这些示例性实施例仅仅是为了使本领域技术人员能够更好地理解并进而实现本专利技术,而并非以任何方式限制本公开的范围。在本文中,对“一个实施例”、“另一实施例”或“一个优选实施例”等的引用指示所描述的实施例可以包括特定特征、结构或特性,但每个实施例不一定必须包括该特定特征、结构或特性。而且,这些术语并不一定指相同的实施例。还应理解,在此处使用的各种术语仅用于描述特定实施例的目的,而不旨在于限制本专利技术。如这里使用的单数形式“一”和“该”可以包括复数形式,除非上下文中有明确的相反指示。还应理解,此处使用的术语“包括”、“具有”和“包含”指示所述特征、单元和/或组件等的存在,但不排除一个或多个其他特征、单元、组件和/或其组合的存在。如这里使用的术语“多个”表示“两个或更多”。如这里使用的术语“和/或,,可以包括关联列出的各项中的一项或多项的任何和所有组合。除非特别定义,在本文中使用的各种术语具有本公开所属领域技术人员一般理解的含义。为了更清楚地阐述本专利技术的各实施例,首先参考图1对现有典型中端存储设备的主要架构和操作方式进行简单介绍。图1示出了现有的EMC VNX系列存储设备的高层架构的框图。如图1中所示的VNX存储设备包括多个服务器和后端的存储装置。该多个服务器可以包括:诸如RAID/DEDUP/CACHE等服务在其上运行的存储处理器服务器SP、数据移动服务器DM和用于监视和配置数据移动服务器的控制站服务器CS。后端的存储装置可以包括多个存储盘,其为存储设备操作过程中所使用的各种数据提供物理存储空间或物理存储区域,这些物理存储区域可以映射为多个逻辑单元LUN。具体地如图1所示,在VNX存储设备的后端存储装置中包含了一个“启动分区”和多个通常的逻辑单元LUN。VNX系列存储设备中的SP可以运行不同的操作系统以及存储设备供应商所拥有的内置软件。SP将与其相关的控制路径数据存储在后端存储装置的“启动分区”中,并从中获取这些控制路径数据。本文所使用的“控制路径数据”指在存储设备的各服务器上运行的多个组件(component),这些组件使得服务器及其上运行的软件能够正常操作,其可以包括但不限于:服务器上运行的操作系统内核、驱动器、软件配置文件(包括软件的配置和运行状态信息)、软件二进制文件以及固件。具体而言,与SP相关的控制路径数据包括在SP上运行的多个组件,其使得SP及其上运行的软件能够正常操作。此外,与某个软件相关的控制路径数据包括与该软件运行相关的多个组件,其使得该软件能够正常操作。VNX系列存储设备中的CS可以运行RedHat+操作系统以及存储设备供应商所拥有的内置软件。CS可以具有其自己的存储盘,但是也会将与其相关的控制路径数据的一个副本存储在后端的一些存储逻辑单元LUN中,并且可以对其定期进行同步。VNX系列存储设备中的DM用于将用户的文件级请求转换至块级请求传送至SP并且移动用户数据以对用户请求进行响应。DM运行实时数据访问(Dart),其可以是经修改的伯克利软件套件(BSD)并
且运行存储设备供应商所拥有的内置软件。DM不具有自己的存储盘,而是将与其相关的控制路径数据存储在后端的LUN中并且从该LUN获取这些数据。根据SP运行的操作系统以及内置软件的不同,VNX存储设备可以分为不同的系列,例如VNX1和VNX2系列,其中VNX1系列存储设备的SP可以运行Microsoft2008操作系统;而VNX2系列存储设备可以运行Microsoft2008 R2 SP1。此外,相比于VNX1,VNX2系列中的CS运行更新版本的内置软件并且DM运行具有许多代码修订的Dart等本文档来自技高网
...

【技术保护点】
一种在存储设备中用于故障恢复的方法,所述存储设备包括至少一个服务器和存储装置并且在所述至少一个服务器上运行多个组件,所述方法包括:在所述存储装置中对所述至少一个服务器上运行的所述多个组件中的一个或多个组件进行备份;监视所述至少一个服务器上故障的发生并且定位引起所述故障的一个或多个组件;获取备份在所述存储装置中的、与引起所述故障的所述一个或多个组件对应的一个或多个组件;以及利用所获取的一个或多个组件来恢复所述故障。

【技术特征摘要】
1.一种在存储设备中用于故障恢复的方法,所述存储设备包括至少一个服务器和存储装置并且在所述至少一个服务器上运行多个组件,所述方法包括:在所述存储装置中对所述至少一个服务器上运行的所述多个组件中的一个或多个组件进行备份;监视所述至少一个服务器上故障的发生并且定位引起所述故障的一个或多个组件;获取备份在所述存储装置中的、与引起所述故障的所述一个或多个组件对应的一个或多个组件;以及利用所获取的一个或多个组件来恢复所述故障。2.根据权利要求1所述的方法,进一步包括:在所述存储装置中建立多个逻辑单元,每个逻辑单元包含具有特定地址范围的存储区域并且备份的每个组件被存储在相应的一个逻辑单元中;维护逻辑单元搜索表,其中所述多个组件中的每个组件的名称与该组件被备份在其中的逻辑单元的索引以及该组件被备份在其上的存储区域的起始地址相关联地被存储;以及维护索引搜索表,其中所述多个组件被划分为多个组,每个组所包含的组件共同地由一个符号标识,在所述索引搜索表中与每个组对应的所述符号至少与一个逻辑单元的索引相关联地被存储,其中所述一个逻辑单元的所述索引表示与之对应的所述组中所包含的组件被备份在其中的逻辑单元的范围的边界。3.根据权利要求2所述的方法,其中获取与引起所述故障的所述一个或多个组件对应的一个或多个组件进一步包括,针对引起所述故障的所述一个或多个组件中的每个组件:基于所述索引搜索表来查找与该组件对应的逻辑单元的范围;在所述逻辑单元搜索表中、在所述逻辑单元的范围内查找该组件的名称以及与之对应的存储区域的起始地址;以及基于所述存储区域的起始地址来获取与该组件对应的、备份在所述存储装置中的组件。4.根据权利要求2或3所述的方法,其中在非易失性存储器中维护所述逻辑单元搜索表和所述索引搜索表。5.根据权利要求2或3所述的方法,其中所述多个组件中的每个组件的名称包含该组件被创建时的时间戳。6.根据权利要求5所述的方法,其中获取备份在所述存储装置中的组件包括获取具有最新时间戳的所述组件。7.根据权利要求2或3所述的方法,其中所述多个组件按照每个组件名称的首字母被划分为多个组,并且每个组所包含的组件共同地由该组件的首字母标识。8.根据权利要求2或3所述的方法,其中在所述存储装置中对所述至少一个服务器上运行的所述多个组件中的一个或多个组件进行备份包括以下各项中的至少一项:定期地对所述多个组件中的所述一个或多个组件进行备份;在对所述多个组件中的至少一个组件进行升级之前针对所述至少一个组件进行备份;以及在对所述多个组件中的至少一个组件的配置进行改变之前针对所述至少一个组件的所述配置进行备份。9.根据权利要求2或3所述的方法,其中在所述存储装置中对所述至少一个服务器上运行的所述多个组件中一个或多个组件进行备份进一步包括根据所述备份更新所述逻辑单元搜索表和所述索引搜索表。10.根据权利要求1至3中任一项所述的方法,其中所述多个组件包括以下各项中的一项或多项:操作系统内核、驱动器、软件配置文件、能够被改变的软件二进制文件以及固件。11.一种在存储设备中用于故障恢复的装置,所述存储设备包括至少一个服务器和存储装置并且在所述至少...

【专利技术属性】
技术研发人员:常海华郭文磊陈超陆明刚吴佳玮
申请(专利权)人:伊姆西公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1