数据备份方法、数据恢复方法、装置、介质及电子设备制造方法及图纸

技术编号:37556875 阅读:15 留言:0更新日期:2023-05-15 07:40
本申请公开了一种数据备份方法、数据恢复方法、装置、介质、电子设备,数据备份方法包括:将块设备中的初始数据存储到数据存储区中的第一数据文件中,将每个块设备划分为多个存储单元;实时捕获对块设备的写入操作,将写入操作中的写入数据存储到数据存储区中的第二数据文件中,并将写入操作中的其他信息写入元数据存储区中;将多个第二数据文件合并成第三数据文件;确定与对应的写入操作对应的存储单元,从而确定对应的索引对象,并查找到关联的第一数据文件;将第三数据文件分别与关联的第一数据文件进行合并,得到更新后的第一数据文件,作为备份数据。本发明专利技术可以提高备份灵活性,减少存储成本,可以迅速地以秒级的速度恢复到可恢复时间点。可恢复时间点。可恢复时间点。

【技术实现步骤摘要】
数据备份方法、数据恢复方法、装置、介质及电子设备


[0001]本申请涉及数据处理领域,特别涉及数据备份方法、数据恢复方法、装置、介质、电子设备、计算机程序产品。

技术介绍

[0002]数据备份应用广泛,使用场景通常包括:1.违规操作导致数据丢失时使用备份恢复数据;2.面对黑客攻击和勒索病毒时,将数据回滚到备份时间点;3.使用数据备份进行系统环境复制。
[0003]常见的数据备份技术包括:
[0004]1.快照(Snapshot):快照是关于指定数据集合的一个完全可用拷贝,该拷贝包含了相应数据在某个时间点的镜像,快照的常用技术包括Copy

On

Write(COW),即源数据卷创建快照后会建立一个快照卷,当源数据卷位置有数据首次写入时,把原始数据拷贝到快照卷中,另一种方式是Redirect

On

Write(ROW),即源数据卷创建快照后不会再被写入,所有的写IO都被重定向到新卷中。
[0005]如果对同一源数据卷制作多个快照,为了降低快照的存储成本,通常采用增量快照技术,即该卷第一个快照保存全量数据,后面的快照保存增量数据
[0006]2.连续数据保护(Continuous Data Protect,CDP):CDP是一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法,基本原理是持续捕获所有I/O请求,并将这些请求打上时间戳标记,写入到CDP仓库中。这样数据变化及其时间戳都被保存下来,通过回放可以恢复到过去的任意时刻。
[0007]快照技术是传统的数据备份技术,传统的数据备份解决方案往往要求用户设定一个周期性的备份策略,因此一直有着备份窗口问题。另外,COW和ROW技术不可避免的会对生产系统的I/O产生影响,当快照链过长时,这种影响会变得更加显著。
[0008]连续数据保护是对传统数据备份技术的一次重大突破。但是这种技术普遍遇到数据不断增加所带来的存储成本问题,有很多变种的连续数据保护技术尝试通过二叉树索引技术、分粒度存储技术减少存储成本。但是由于存储成本限制,连续数据保护往往有一个保护期限,过期的数据会被合并掉,所以用户依然需要依赖快照链来长时间保存备份数据。
[0009]因此,目前的数据备份技术并不理想。

技术实现思路

[0010]本申请实施例提供了一种数据备份方法、数据恢复方法、装置、介质、电子设备、计算机程序产品。
[0011]第一方面,本申请实施例提供了一种数据备份方法,所述方法包括:
[0012]初始化步骤,将一个或多个块设备中的初始数据存储到数据存储区中的一个或多个第一数据文件中,将每个块设备划分为多个存储单元,其中每个存储单元对应于索引对
象,每个索引对象与对应的第一数据文件一一关联,其中每个存储单元的信息和所述索引对象存储在元数据存储区中;
[0013]写入步骤,实时捕获对所述块设备的写入操作,将所述写入操作中的写入数据存储到所述数据存储区中的第二数据文件中,并将所述写入操作中的其他信息写入所述元数据存储区中;
[0014]合并步骤,将多个所述第二数据文件合并成预定时间粒度的第三数据文件;
[0015]查找步骤,根据与所述第三数据文件对应的写入操作中的其他信息和每个存储单元的信息,确定与所述对应的写入操作对应的一个或多个存储单元,从而确定对应的一个或多个索引对象,并查找到关联的一个或多个对应的第一数据文件;
[0016]更新步骤,将所述第三数据文件分别与所述一个或多个对应的第一数据文件进行合并,得到更新后的一个或多个对应的第一数据文件,作为备份数据。
[0017]在上述第一方面的一种可能的实现中,在所述初始化步骤中,按照所述初始数据的大小进行分割,并分别存储到所述一个或多个第一数据文件中。
[0018]在上述第一方面的一种可能的实现中,每个存储单元的大小是相同的。
[0019]在上述第一方面的一种可能的实现中,所述数据存储区是大容量的低速存储器,所述元数据存储区是小容量的高速存储器。
[0020]在上述第一方面的一种可能的实现中,在所述合并步骤中,以一个或多个不同的时间粒度,将多个所述第二数据文件合并成预定时间粒度的第三数据文件。
[0021]在上述第一方面的一种可能的实现中,所述第三数据文件是所述预定时间粒度中最后一个第二数据文件。
[0022]在上述第一方面的一种可能的实现中,所述写入操作中的其他信息包括写入时间戳,
[0023]其中,在所述合并步骤中,将所述最后一个第二数据文件之外的其他第二数据文件的所述写入时间戳从所述元数据存储区中删除。
[0024]在上述第一方面的一种可能的实现中,每个存储单元的信息包括存储地址和大小,所述写入操作中的其他信息包括写入起始地址、写入大小,
[0025]其中,根据每个存储单元的存储地址和大小、以及对应的写入操作中的所述写入起始地址和所述写入大小,确定与所述对应的写入数据对应的一个或多个存储单元。
[0026]在上述第一方面的一种可能的实现中,对多个所述存储单元进行快照处理后形成快照链,所述快照链包括多个快照,每个快照包含多个所述存储单元的快照数据,
[0027]其中,如果一个存储单元中的初始数据和另一个存储单元的快照数据相同,则所述一个存储单元和所述另一个存储单元对应于同一个索引对象。
[0028]第二方面,本申请实施例提供了一种数据恢复方法,所述方法用于从根据第一方面所述的数据备份方法获得的备份数据进行数据恢复,所述方法包括:
[0029]读取步骤,从所述元数据存储区中读取与待恢复数据对应的存储单元的信息;
[0030]确定步骤,根据所述存储单元的信息,确定对应的索引对象;
[0031]恢复步骤,从所述数据存储区中读取与所述索引对象对应的第一数据文件,以便从所述第一数据文件恢复数据。
[0032]第三方面,本申请实施例提供了一种数据备份装置,所述装置包括:
[0033]初始化单元,将一个或多个块设备中的初始数据存储到数据存储区中的一个或多个第一数据文件中,将每个块设备划分为多个存储单元,其中每个存储单元对应于索引对象,每个索引对象与对应的第一数据文件一一关联,其中每个存储单元的信息和所述索引对象存储在元数据存储区中;
[0034]写入单元,实时捕获对所述块设备的写入操作,将所述写入操作中的写入数据存储到所述数据存储区中的第二数据文件中,并将所述写入操作中的其他信息写入所述元数据存储区中;
[0035]合并单元,将多个所述第二数据文件合并成预定时间粒度的第三数据文件;
[0036]查找单元,根据与所述第三数据文件对应的写入操作中的其他信息和每个存储单元的信息,确定与所述对应的写入操作对应的一个或多个存储单元,从而确定对应的一个或多个索引对象,并查找到关联的一个或多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据备份方法,其特征在于,所述方法包括:初始化步骤,将一个或多个块设备中的初始数据存储到数据存储区中的一个或多个第一数据文件中,将每个块设备划分为多个存储单元,其中每个存储单元对应于索引对象,每个索引对象与对应的第一数据文件一一关联,其中每个存储单元的信息和所述索引对象存储在元数据存储区中;写入步骤,实时捕获对所述块设备的写入操作,将所述写入操作中的写入数据存储到所述数据存储区中的第二数据文件中,并将所述写入操作中的其他信息写入所述元数据存储区中;合并步骤,将多个所述第二数据文件合并成预定时间粒度的第三数据文件;查找步骤,根据与所述第三数据文件对应的写入操作中的其他信息和每个存储单元的信息,确定与所述对应的写入操作对应的一个或多个存储单元,从而确定对应的一个或多个索引对象,并查找到关联的一个或多个对应的第一数据文件;更新步骤,将所述第三数据文件分别与所述一个或多个对应的第一数据文件进行合并,得到更新后的一个或多个对应的第一数据文件,作为备份数据。2.根据权利要求1所述的方法,其特征在于,在所述初始化步骤中,按照所述初始数据的大小进行分割,并分别存储到所述一个或多个第一数据文件中。3.根据权利要求1所述的方法,其特征在于,每个存储单元的大小是相同的。4.根据权利要求1所述的方法,其特征在于,所述数据存储区是大容量的低速存储器,所述元数据存储区是小容量的高速存储器。5.根据权利要求1所述的方法,其特征在于,在所述合并步骤中,以一个或多个不同的时间粒度,将多个所述第二数据文件合并成预定时间粒度的第三数据文件。6.根据权利要求5所述的方法,其特征在于,所述第三数据文件是所述预定时间粒度中最后一个第二数据文件。7.根据权利要求6所述的方法,其特征在于,所述写入操作中的其他信息包括写入时间戳,其中,在所述合并步骤中,将所述最后一个第二数据文件之外的其他第二数据文件的所述写入时间戳从所述元数据存储区中删除。8.根据权利要求1所述的方法,其特征在于,每个存储单元的信息包括存储地址和大小,所述写入操作中的其他信息包括写入起始地址、写入大小,其中,根据每个存储单元的存储地址和大小、以及对应的写入操作中的所述写入起始地址和所述写入大小,确定与所述对应的写入数据对应的一个或多个存储单元。9.根据权利要求1所述的方法,其特征在于,对多个所述存储单元进行快照处理后形成快照链,所述快照链包括多个快照,每个快照包含多个所述存储单元的快照数据,其中,如果一个存储单元中的初始数据和另一个存储单元的快照数据相同,则所述一个存储单元和所述另一个存储单元对应于同一个索引对象。10.一种数据恢复方法,...

【专利技术属性】
技术研发人员:鲍琨刘鑫张柯陈坚瑞李峰
申请(专利权)人:优刻得科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1