到云的任何时间点复制制造技术

技术编号:28738243 阅读:13 留言:0更新日期:2021-06-06 13:12
用于到云的任何时间点复制的系统、装置和方法。通过将数据复制到云中的远程存储器或数据存储区来复制数据。同时,生成并存储元数据流。元数据流在生产卷中建立数据与数据的偏移量之间的关系。这允许连续复制而不必维持副本卷。可以在使用元数据流从云数据构造生产卷的重新补充操作期间生成副本卷。重新补充操作期间生成副本卷。重新补充操作期间生成副本卷。

【技术实现步骤摘要】
【国外来华专利技术】到云的任何时间点复制


[0001]本专利技术的实施方式涉及用于将数据复制到云并恢复数据的系统、装置和方法。更具体地,本专利技术的实施方式涉及用于执行到存储位置(例如云或数据中心)的任何时间点复制的系统和方法。本专利技术的实施方式还涉及连续复制,而不必在云中维持副本卷。

技术介绍

[0002]数据保护是实体保护其数据的过程。数据经常例如通过创建备份而受到保护。通过执行备份操作来创建备份,实体能够在丢失生产数据时从备份副本恢复其生产数据。
[0003]数据保护系统通常与恢复点目标(recovery point objective,RPO)相关联。RPO可以以多种方式表示,但通常是指可以恢复数据的时间点。例如,一个小时的RPO意味着如果生产数据发生问题,则该实体很可能会丢失一个小时的数据。
[0004]某些实体可以选择将其数据复制到云中,而不是在本地备份数据。这通常是使用基于快照的方法执行的。然而,基于快照的系统的RPO通常不令人满意。更具体地说,基于快照的应用程序中的RPO受到限制。只能对最新的快照执行恢复,该最新的快照可能是在过去的几分钟或几小时的快照。
[0005]此外,传统的镜像(如在一级复制中所做的那样)需要远程站点上的计算资源,以便处理数据并维持副本卷或镜像卷。
附图说明
[0006]为了描述可以获得本专利技术的至少一些方面的方式,将通过参考在附图中示出的本专利技术的特定实施方式来进行更具体的描述。将理解,这些附图仅描绘了本专利技术的示例性实施方式,因此不应被认为是对本专利技术的范围的限制,将通过使用附图以附加的特征和细节来描述和解释本专利技术的实施方式,其中:
[0007]图1示出了用于在云中复制数据的系统、装置和方法的示例;
[0008]图2示出了用于通过将对象存储在数据存储区中并维持对象的元数据流来在云中复制数据的系统、装置和方法的示例;
[0009]图3示出了元数据流与生产卷和/或存储在云中的对象之间的关系的示例;
[0010]图4示出了用于复制生产数据的方法的示例;
[0011]图5示出了用于将来自数据存储区的数据重新补充到副本生产卷的系统、装置和方法的示例;
[0012]图6示出了用于使用元数据流和数据存储区重新补充生产卷的方法的示例;以及
[0013]图7示出了在复制系统中合并数据的示例。
具体实施方式
[0014]本专利技术的实施方式涉及用于保护数据的系统、装置和方法。更具体地,本专利技术的实施方式涉及数据保护操作,其可以包括但不限于,备份操作、复制操作、恢复操作、重新补充
操作、重复数据删除操作、元数据操作等或其组合。
[0015]本专利技术的实施方式涉及数据保护系统、装置和方法,其允许在云(例如,数据中心)中保护数据,同时实现数秒的RPO并且具有任何时间点粒度。本专利技术的实施方式也可以应用在本地备份的情况中。为了实现任何时间点粒度和数秒的或更小的RPO,本专利技术的实施方式将生产数据复制到对象存储器(云)并生成元数据流。元数据流存储复制的数据和生产卷之间的关系。
[0016]通过将元数据流应用于云数据,可以将生产数据恢复到任何时间点。在一个示例中,通过连续地复制数据并通过提供元数据流,实施方式允许(对于连续复制系统)将云数据存储在除第一级存储器之外的其他存储器中。此外,在一个实施方式中,可以仅在需要恢复时才需要计算资源。换句话说,仅当以连续方式保护数据时,才有必要将数据写入云。还可以通过执行重复数据删除操作来降低存储需求。
[0017]在本专利技术的实施方式中,连续复制涉及将生产数据(生产卷)上的每个IO(输入/输出)镜像或复制到远程站点。被复制或镜像的数据可以作为对象存储在数据存储区中。将数据复制到远程站点可以实现接近零的RPO。
[0018]传统镜像的缺点是经常需要一级存储。此外,在远程站点处需要计算时间来处理数据并维持副本卷。在一个示例中,本专利技术的实施方式能够连续地复制数据,并且无需维持副本卷即可实现接近零的RPO。相反,仅在恢复或重新补充操作期间才需要计算时间。
[0019]数据可以以不同的方式存储在数据中心中,不同的方式包括对象存储、文件存储和块存储。本文中使用术语数据或对象,并且本专利技术还可以利用文件或块或其他数据存储配置来执行。在基于对象的存储的情况中,每个对象可以包括例如数据、可变数量的元数据和/或全局唯一标识符。
[0020]本专利技术的实施方式提出将生产数据连续复制到远程站点,例如数据中心或云存储器(在本文中也称为在其中存放数据的数据存储区)。
[0021]使用元数据流进行连续复制
[0022]图1示出了在其中执行数据保护操作的计算环境的示例。图1示出了与生产数据106(例如,生产卷)相关联的客户端102。客户端102可以是虚拟机、计算设备(诸如计算机、膝上型计算机、平板电脑、智能电话、服务器计算机等)。生产数据106可以驻留在存储设备(存储阵列或其他存储布置)上。生产数据106可以是客户端102本地的(例如,在同一网络中)或远离客户端102。生产数据106还可以是基于云的存储数据。
[0023]客户端102与生产数据106交互,并且可以写入数据或读取数据或执行其他动作。在保护数据或数据复制的情况中,输入/输出(IO)可以指导致对生产数据106进行更改的动作或命令。无论何时写入(删除、移动、修改、复制等)数据到生产数据106,复制引擎104都复制数据。更具体地,复制引擎104可以复制动作。复制引擎104可以合并到生产数据106中,可以是服务器或其他设备,或者是配置为检测某些命令(包括写入)并相应地复制数据的软件层。
[0024]因此,在该示例中,复制引擎104将数据复制或写入到远程存储器108,远程存储器108可以是数据中心、云存储器等。复制引擎还可以生成元数据流并将元数据流写入远程元数据流存储器110。流存储器110可以与远程存储器108位于相同的位置(例如,相同的存储系统、相同的数据中心)。流存储器110和远程存储器108也可以是分开的存储器。
[0025]图2进一步示出了图1中所示的复制。在一个示例中,复制引擎202(复制引擎104的示例)可以检测正在被写入到生产卷208中的IO 210,生产卷208可以存储生产数据106。复制引擎202可以确定IO 210包括数据A,并且正在将其写入被标识为偏移量X的位置。偏移量X代表数据A在生产卷208或生产数据106中的位置。可以用其他术语来指示偏移量X,这可以取决于生产卷208的配置。
[0026]然后,复制引擎将IO 210复制到数据存储区204,数据存储区204是远程存储器108的一个示例。在一个示例中,数据存储区204是键值型存储器。因此,复制引擎202可以向数据存储区204提供数据A,并且诸如标识符10和IO 210之类的键将被存储在数据存储区204中。为了检索数据A,向数据存储区提供标识符10。使用标识符10,数据存储区204可以检索并返回数据A。
[0027]在将IO 210或数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于复制数据的方法,所述方法包括:捕获在生产数据上发生的处理,其中,所述处理与所述生产数据的变化有关;将与所述处理相关联的数据作为对象传输到远程存储器,使得能够从所述对象复制所述生产数据;生成与所述处理相关联的元数据流,其中,所述元数据流中的每个条目对应于一个处理;以及将所述元数据流存储在元数据存储器中。2.如权利要求1所述的方法,其中,所述处理包括写入和删除中的至少一者。3.如权利要求1所述的方法,还包括将所述数据分块为对象。4.如权利要求3所述的方法,其中,每个所述对象具有预定大小。5.如权利要求3所述的方法,其中,每个对象与所述生产数据中的偏移量相关联,并且每个对象与唯一地标识所述对象的标识符相关联。6.如权利要求1所述的方法,还包括使用合并间隔来合并所述元数据流和所述对象。7.如权利要求1所述的方法,还包括从所述对象和所述元数据流重新补充所述生产数据。8.如权利要求1所述的方法,其中,所述生产数据被连续地复制而无需在所述远程存储器中维持副本卷。9.如权利要求1所述的方法,还包括将初始生产副本存储在所述远程存储器中。10.一种非暂时性计算机可读介质,所述非暂时性计算机可读介质包括指令,所述指令在由处理器执行时执行如权利要求1所述的方法。11.一种用于重新补充生产卷的方法,所述方法包括:创建空白的元数据卷,以准...

【专利技术属性】
技术研发人员:I
申请(专利权)人:EMCIP控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1