从备份系统流式恢复数据库技术方案

技术编号:17561607 阅读:36 留言:0更新日期:2018-03-28 12:09
从备份系统流式恢复数据库。分布式数据仓库系统可代表客户将数据块保持在数据存储的多个集群中。每个集群可包括单个领导节点和多个计算节点,每个节点包括存储数据的多个磁盘。仓库系统可将每个数据块的主要和次要副本存储在集群中不同磁盘或节点上。每个节点可包括数据结构,数据结构保持关于被存储在节点上的每个数据块的元数据,元数据包括数据块的唯一标识符。仓库系统可在远程关键字‑值备份存储系统中具有高耐久性地备份数据块。流式恢复操作可用以使用数据块的唯一标识符作为密钥来从备份存储检索数据块。

Stream recovery database from backup system

Restore the database from the backup system flow. A distributed data warehouse system can represent data blocks in multiple clusters of data storage on behalf of a customer. Each cluster can include a single leadership node and multiple computing nodes, each of which includes multiple disks that store data. The warehouse system can store the main and secondary copies of each data block in different disks or nodes in the cluster. Each node can include data structure, data structure keeps metadata about every block of data stored on the node, and metadata includes the unique identifier of data block. Warehouse system in the remote key value backup storage system with high durability to backup data block. The flow recovery operation can be used to retrieve data blocks from the backup store by using the unique identifier of the data block as the key.

【技术实现步骤摘要】
从备份系统流式恢复数据库本申请是申请号为201380061452.4、专利技术名称为“从备份系统流式恢复数据库”、国际申请日为2013年11月25日的专利申请的分案申请,其全部内容通过引用合并于此。
技术介绍
分布式存储服务可包括在例如一个或多个计算机集群的分布式硬件基础设施上执行的多个并发进程。这些进程中的各种进程可在集群中不同物理和/或逻辑(例如,虚拟)机器上执行。在存储服务中,例如,在不同机器上的进程(例如,软件服务器)可各自将编程接口暴露给客户端,客户端可使用所述编程接口来访问可在多个存储资源上实施的存储系统。存储服务可存储系统中每个数据项的多个复本,使得一个服务器上的数据项的任何改变必须被传播到一个或多个其它服务器。一旦节点或磁盘驱动器出现故障,发生故障的设备上的数据必须被恢复。在提供数据库服务的许多现有存储系统中,整个数据集必须被恢复(例如,从备份或归档文件恢复),然后系统才可恢复接受并处理查询。在执行增量备份的一些系统中,设备出现故障后恢复系统涉及执行多个增量恢复操作(对应于多个增量备份操作)。在其它存储系统中,设备出现故障后恢复系统涉及追踪事务记录来重建系统的状态。对于包括本文档来自技高网...
从备份系统流式恢复数据库

【技术保护点】
一种方法,包括:由一个或多个计算机来执行以下操作:代表一个或多个客户将数据保持在数据存储系统的多个物理数据块中;接收对访问所述数据的一部分的请求;响应于所述接收:确定所述数据的所述部分的未损坏副本在所述数据存储系统中不可用;响应于确定所述数据的所述部分的未损坏副本在所述数据存储系统中不可用,从与所述数据存储系统分离的关键字‑值存储系统检索所述数据的所述部分的备份副本,其中所述关键字‑值存储系统采用与所述数据存储系统不同的数据存储格式;以及在恢复所述数据的所述部分的损坏副本的操作期间,返回对所述请求的响应,所述响应包括所检索的所述数据的所述部分的备份副本。

【技术特征摘要】
2012.11.26 US 61/730,024;2013.03.11 US 13/792,643;1.一种方法,包括:由一个或多个计算机来执行以下操作:代表一个或多个客户将数据保持在数据存储系统的多个物理数据块中;接收对访问所述数据的一部分的请求;响应于所述接收:确定所述数据的所述部分的未损坏副本在所述数据存储系统中不可用;响应于确定所述数据的所述部分的未损坏副本在所述数据存储系统中不可用,从与所述数据存储系统分离的关键字-值存储系统检索所述数据的所述部分的备份副本,其中所述关键字-值存储系统采用与所述数据存储系统不同的数据存储格式;以及在恢复所述数据的所述部分的损坏副本的操作期间,返回对所述请求的响应,所述响应包括所检索的所述数据的所述部分的备份副本。2.如权利要求1所述的方法,其中所述确定包括:访问数据结构,所述数据结构存储指示代表所述一个或多个客户保持的所述数据的每个部分的各自的副本被存储在物理数据块中的一个或多个位置的信息;以及采用所述数据结构来定位所述数据的所述部分的主要副本和次要副本中的至少一个。3.如权利要求1所述的方法,其中所述确定所述数据的所述部分的未损坏副本在所述数据存储系统中不可用包括:确定所述数据的所述部分的副本先前被损坏且尚未被恢复。4.如权利要求1所述的方法,其中所述确定所述数据的所述部分的未损坏副本在所述数据存储系统中不可用包括:确定其上存储有所述数据的所述部分的副本的节点或磁盘已出现故障,且被存储在所述故障节点或磁盘上的数据尚未被恢复。5.如权利要求1所述的方法,其中所述确定包括:对存储所述数据的所述部分的主要副本的物理数据块应用一致性检查。6.如权利要求5所述的方法,其中所述确定还包括:至少部分地基于所述应用来确定所述数据的所述部分的所述主要副本已被损坏或与一个或多个其它物理数据块不一致;以及对存储所述数据的所述部分的次要副本的物理数据块应用一致性检查。7.如权利要求1所述的方法,其中,保持数据的每个物理数据块与唯一标识符相关联;以及其中,检索所述数据的所述部分的备份副本包括:使用与所述数据存储系统中存储所述数据的所述部分的物理数据块相关联的各自的唯一标识符作为密钥,以在所述关键字-值存储系统中访问所述数据存储系统中存储所述数据的所述部分的物理数据块的备份副本。8.如权利要求1所述的方法,还包括:在接收所述请求之前,备份代表所述一个或多个客户将数据保持在所述数据存储系统中的所述多个物理数据块中的至少一些物理数据块,其中所述备份包括:对于所述多个物理数据块中的所述至少一些物理数据块中的每个物理数据块:向所述关键字-值存储系统发送物理数据块的副本和与所述物理数据块相关联的唯一标识符,所述唯一标识符被用作访问密钥来检索所述远程关键字-值存储系统中的所述物理数据块的备份副本。9.如权利要求1所述的方法,还包括:对于代表所述一个或多个客户将数据保持在所述数据存储系统中的所述多个物理数据块中的每个物理数据块:当数据被写入物理数据块时,生成将与所述物理数据块相关联的唯一标识符。10.如权利要求1所述的方法,还包括:接收对访问代表所述一个或多个客户保持在所述数据存储系统中的所述数据的另一部分的另一请求;响应于接收另一请求:确定所述数据的所述另一部分的未损坏副本在所述数据存储系统中可用;响应于确定所述数据的所述部分的未损坏副本在所述数据存储系统中可用,返回对所述另一请...

【专利技术属性】
技术研发人员:A·W·古普塔J·库莱斯扎D·阿加瓦尔A·瑟纳T·亚恩Z·冯S·斯泰法尼
申请(专利权)人:亚马逊科技公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1