已复制数据的故障切换和恢复制造技术

技术编号:7737690 阅读:182 留言:0更新日期:2012-09-09 23:57
在数据库环境中的已复制实例提供自动故障切换和恢复。监控部件可对于实例与主要副本和辅助副本周期性地通信,每个副本能够存在于分开的数据区或地理位置中以提供一定水平的可靠性和可用性。在主要实例上运行的数据库可具有在块级被同步地复制到辅助副本的信息,使得主要副本和辅助副本处于同步中。在监控部件不能与副本之一通信的情况下,监控部件可试图确定那些副本是否具有相同的数据生成版本。根据状态信息,监控部件可自动执行恢复操作,例如故障切换到辅助副本或执行复制副本恢复。

【技术实现步骤摘要】
【国外来华专利技术】已复制数据的故障切换和恢复背景当越来越多数量的应用和服务通过网络例如互联网变得可用时,越来越多数量的内容、应用和/或服务提供商求助于诸如云计算的技术。云计算通常是通过服务例如Web服务来提供对电子资源的访问的方法,其中用于支持那些服务的硬件和/或软件动态地可升级来在任何给定的时间满足服务的需要。用户或客户一般将租借、租用或以其它方式支付通过云访问资源的费用,并因此不必购买和维持硬件和/或软件来提供对这些资源的访问。虽然各种应用和资源的方面可在云中被调节和管理,但这些应用和资源所依赖的数据存储库并不类似地被客户或其它这样的用户调节或容易管理。一般,执行诸如供应并按比例调整数据存储的任务是冗长乏味的手工程序,其中客户必须给数据库管理员(DBA)或类似的专家用户提供配置信息和需要,使得DBA可确定配置是否是有效的。此外,不存在使客户容易动态地和/或自动地调节数据库实例的参数或管理数据存储库的其它这样的方面的方法。在很多情况下,数据实例将使备份和恢复机制在适当的地方,但这些机制常常在单个位置或区域中,使得它们在该区域中容易受到失败或出故障。此外,当数据实例失败时,一般花费几分钟来生成新的实例,将适当的卷连接到新的实例,并另外执行从故障恢复所必需的任务。附图简述将参考附图描述根据本公开的各种实施方案,其中图I示出各种实施方案可被实现的环境;图2示出可根据各种实施方案使用的控制面和数据面的示例性分离;图3示出利用可根据各种实施方案使用的多个监控部件的例子;图4示出用于在可根据一个实施方案使用的多个数据区中运行的已复制数据实例的示例性实现;图5示出根据一个实施方案的主要副本的示例性状态转变图;图6示出根据一个实施方案的监控部件的示例性状态转变图;图7示出可根据一个实施方案使用的用于执行故障切换操作的示例性过程;图8示出可根据一个实施方案使用的用于恢复辅助副本的示例性过程;图9示出可根据一个实施方案使用的用于管理事件处理器的示例性过程;附图说明图10示出可根据一个实施方案使用的归因于出故障的事件处理器的重新分配的例子;以及图11示出可根据一个实施方案使用的用于添加新的事件处理器作的示例性过程。详细描述根据本公开的各种实施方案的系统和方法可克服在常规方法中经历的前述和其它不足的一个或多个,以在电子环境中管理数据存储的方面。特别是,各种实施方案提供单独的控制环境、或可用于使用户能够管理和/或改变数据环境的各种方面的控制面、或数据面。可经由一组Web服务提供这种“自我服务”功能,使用户面和控制面能够一起充当虚拟数据库管理员(DBA)。用户或客户可通过例如多个外部可见的应用编程接口(API)之一向控制面提交请求。各种API可用于在数据环境中执行关于数据存储库例如关系数据库的特定功能。被接收到API之一的请求可被分析以确定将在数据面中执行的期望行动,例如调节数据存储器或数据存储实例的操作或配置参数的行动。部件例如工作流部件可确定对行动的适当任务,并使任务以适当的顺序执行。这些任务中的至少一个一般将在数据环境中被执行,例如以调节关系数据库的方面。根据某些实施方案,这样的系统可在数据环境中提供已复制数据实例的供应。供应可利用主要-辅助复制方法,主要副本和辅助副本的每个在一个或多个分离的数据区、单独的地理位置等中或跨越一个或多个分离的数据区、单独的地理位置等来供应。数据库副本可在单独的数据实例上运行,每个数据实例连接到在副本中未被共享的专用块存储卷。在各种实施方案中,可使用块级复制机制例如来自奥地利Vienna的Linbit的分 布式复制块设备(DRBD )或如华盛顿州西雅图的Amazon, com公司所提供的弹性块存储(EBS)来执行复制,块级复制机制可反映在服务器之间的块设备的内容,并在冗余系统中同步地复制数据。每个实例可运行安装成管理数据实例的所有输入和输出(I/O)操作的具有块级复制机制(BLRM)内核模块的内核。可在主要副本处执行所有读和写,块级复制机制与辅助副本同步地复制信息。主要副本和辅助副本都可具有外部面向的DNS名称。客户可使用DNS名称例如DNS_pr imary来得到当前的主要副本。DNS_pr imary名称可又被称为或“(别名记录)“cname”为(当前)主要副本的外部DNS名称。当主要副本故障或否则不可用时,辅助副本可被提升或故障切换以变成新的主要副本,由此DNS_primary的别名记录可更新到新的主要实例的DNS名称。所有写被发送到在当前主要副本上的数据库。当主要实例接收到写时,信息被同步地写到辅助副本上。当在两个地方成功地写时,写可被认为是成功的。在各种实施方案中在主要副本处只执行所有读。因此可使用在不同的数据区中运行的实例副本在多个数据实例中支持数据库复制。可使用在块级处的同步复制机制进行数据库写,使得没有数据丢失,除非所有副本由于涉及多个数据区的大规模故障等而不可用。复制可提供比可使用单个数据库实例实现的更高的可用性,因为单个副本故障不在延长的一段时间内引起对数据库的故障。例如,如果数据库的主要副本出故障,那么各种实施方案可执行故障切换操作,由此辅助副本接管作为新的主要副本。复制也可在很多例子中提供比未复制的数据库更高的持久性,免受数据区的故障、数据卷故障等。图I示出用于实现根据各种实施方案的方面的环境100的例子。如将被认识到的,虽然基于Web的环境用于解释的目的,但是不同的环境可在适当时用于实现各种实施方案。所示的环境100包括测试或发展部分(或侧)和生产部分。生产部分包括电子客户端设备102,其可包括可操作来通过适当的网络104发送并接收请求、消息或信息并将信息传送回设备的用户的任何适当的设备。这样的客户端设备的例子包括个人计算机、蜂窝电话、手持式消息发送设备、膝上型计算机、机顶盒、个人数字助理、电子书阅读器等。网络可包括任何适当的网络,包括内联网、互联网、蜂窝网络、局域网或任何其它这样的网络或其组合 。用于这样的系统的部件可至少部分地取决于网络的类型和/或所选择的环境。用于经由这样的网络进行通信的协议和部件是公知的,且将不在本文详细地讨论。通过网络的通信可通过有线或无线连接或其组合来实现。在本实施例中,网络包括互联网,因为环境包括用于接收请求并响应于其请求的Web服务器106,虽然对于其它网络,可使用服务于类似的目的的可选设备,如对本领域的普通技术人员明显的。例证性环境包括至少一个应用服务器108和数据存储器110。应理解,可能有一些应用服务器、层或其它元件、过程或部件,其可被链接或以其它方式配置,其可相互作用以执行任务,例如从适当的数据存储器获得数据。如本文使用的,术语“数据存储器”指能够存储、访问和检索数据的任何设备或设备的组合,其可包括在任何标准的、分布式或群集环境中的任何组合和数量的数据服务器、数据库、数据存储设备和数据存储介质。应用服务器可包括按需要与数据存储器合并以为客户端设备执行一个或多个应用的方面、为应用处理大多数数据访问和商业逻辑的任何适当的硬件和软件。应用服务器与数据存储器协作来提供访问控制服务,并能够产生内容例如文本、图形、音频和/或视频以传输到用户,该内容在本实施例中可通过Web服务器以HTML、XML或另一适当的结构语言的形式提供给用户。所有请求本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2009.10.26 US 12/606,0971.一种使用单独的控制环境管理数据库环境中的已复制数据库实例的计算机实现的方法,包括 在配置有可执行指令的一个或多个计算机系统的控制下, 使用单独的控制环境的监控部件监控在数据库环境中的主要实例副本和辅助实例副本中的每个的状态信息;以及 响应于所述监控部件不能与第一实例副本和第二实例副本中的一个通信 确定故障信息,包括所述第一实例副本和第二实例副本是否能够彼此通信以及所述第一实例副本和第二实例副本是否具有公共数据生成标识符; 至少部分地基于所述故障信息,确定将在所述控制环境中执行的工作流,所述工作流包括响应于所述监控部件不能与所述第一实例副本和第二实例副本中的一个通信而在所 述数据库环境中执行的一个或多个任务;以及 在所述控制环境中执行所述工作流。2.如权利要求I所述的计算机实现的方法,其中所述工作流包括当所述监控部件在最小的时间段内不能与所述主要副本通信、所述辅助实例副本不能与所述主要副本通信、且所述第二实例副本具有与所述主要副本的最后已知状态的公共数据生成标识符时使所述辅助实例副本执行故障切换操作以变成关系数据库实例的新的主要副本的任务。3.如权利要求I所述的计算机实现的方法,其中所述工作流包括当所述监控部件在最小的时间段内不能与所述辅助副本通信且所述主要实例副本不能与所述辅助副本通信时使产生所述关系数据库实例的新的辅助实例副本的辅助实例副本恢复过程被执行的任务。4.如权利要求I所述的计算机实现的方法,其中所述工作流包括当所述监控部件在最小的时间段内不能与所述主要副本和辅助副本中的任一个通信、所述主要实例副本和辅助实例副本能够彼此通信、且所述主要实例副本和辅助实例副本具有公共数据生成标识符时在所述控制环境中将信息存储到数据存储器而不执行故障切换或恢复操作的任务。5.如权利要求I所述的计算机实现的方法,其中在单个数据区中、在分开的地理位置处的分开的数据区中、在越过多个地理位置的单个数据区中或越过在单个地理区域中的多个数据区供应所述第一实例副本和第二实例副本。6.如权利要求5所述的计算机实现的方法,其中所述至少一个监控部件位于第三数据区或地理位置中,或在第一数据区或第二数据区或地理位置中。7.如权利要求I所述的计算机实现的方法,其中给用户提供使所述用户能够与当前主要实例副本通信的别名,包括当故障切换操作使所述辅助实例副本变成新的当前主要实例副本时。8.如权利要求I所述的计算机实现的方法,其中所述第一实例副本和第二实例副本中的每个...

【专利技术属性】
技术研发人员:G·A·M·麦卡利斯特S·西瓦苏布拉马尼亚
申请(专利权)人:亚马逊技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1