一种基于reflink的TrueCDP数据保护方案设计与实现方法技术

技术编号:27272443 阅读:10 留言:0更新日期:2021-02-06 11:37
本发明专利技术提供一种基于reflink的True CDP数据保护方案设计与实现方法,包括:对QEMU的BlockDriver实现进行定制;确定需要进行CDP保护的系统盘或者数据盘;进行CDP相关配置;执行对BlockDriver定制的QEMU启动虚拟机;所述虚拟机跟踪每个用户的数据IO;对跟踪的每个用户的数据IO做reflink备份。本发明专利技术给出了一种基于reflink的True CDP数据保护方案设计与实现方法方法,通过对QEMU的BlockDriver进行定制用来跟踪虚拟机的每次数据写入,并调用reflink来对数据历史做备份保护,充分利用了reflink的高效、低空间开销的特性,满足了True CDP方案的需求,解决了现有技术方案成本高或效率低的问题。效率低的问题。效率低的问题。

【技术实现步骤摘要】
一种基于reflink的True CDP数据保护方案设计与实现方法


[0001]本专利技术本专利技术涉及云计算、虚拟化
,特别涉及一种基于reflink的True CDP数据保护方案设计与实现方法。

技术介绍

[0002]在云计算、虚拟化场景中,传统的数据备份方案主要是周期性对数据进行备份,包括全量备份及增量备份,主要方案就是快照技术。传统数据备份方案主要存在的问题:数据保护的时间粒度较粗,一般以数小时或者天为单位,只能将数据恢复到指定的备份点,无法恢复到任意时刻。然而在一些对数据安全要求较高的应用场景,用户对数据恢复的粒度具有更高的要求,需要能够将数据恢复到任意时间点,因此CDP技术应用而生。CDP是Continuous Data Protection的缩写,意为持续数据保护,也称数据实时备份(real-time backup),会对用户数据的任意修改都自动备份,本质上是保存了用户对数据修改的任意版本,因此可支持用户将数据恢复到任意时刻。
[0003]CDP和传统周期备份方案的不同之处在于,系统会对用户的数据的每个数据写入都做记录,并支持回放到时间点——如同我们拖动视频回放一样,切换到历史的任意时刻。这种支持任意粒度回放的CDP实现称之为“True CDP(真CDP,真持续数据保护)”,True CDP存在的一个问题是其实现较为复杂,而且由于需要对数据的每次写入IO都做记录,因此会引入额外的数据写入开销,对性能会有较大的影响。另一种CDP实现方案是“Near CDP”(准CDP,准持续数据保护)。Near CDP采用了类似“快照”的方案,但其对数据进行备份的频率一般是秒级。Near CDP无需跟踪每一次数据IO(输入和输出),因此对性能的影响也较小,而秒级的数据保护也基本满足了大部分用户CDP的应用场景需求。但Near CDP只是一种伪CDP方案,不能保证IO粒度的数据记录及恢复,因而无法满足一些对数据保护粒度要求较高的应用场合。
[0004]现有的True CDP实现技术主要有基于硬件和基于日志的两种实现方式。基于硬件的CDP通过专用硬件旁路,将数据写入专用CDP硬件设备中。该方案性能较好,但实现起来成本较高,只应用在一些对成本不敏感的专用场合。另一种CDP方案是基于日志实现,也即每次数据写入前,都会以日志的形式记录到一个备份区域,备份区域记录了系统运行数据保护期间的每一个IO;数据恢复时,需要重放每个历史IO。该方案的优势是成本低,缺点是出现了数据“双写”的问题——数据要先写入日志再写入真正文件中,因而空间和时间效率都很低;且数据回放时,需要遍历过往的每个IO,因此回放效率较低。
[0005]基于上述问题,本专利技术给出了一种基于reflink的True CDP数据保护方案设计与实现方法方法,通过对QEMU(Quick Emulator,一种开源的能够进行硬件虚拟化的管理程序)的BlockDriver(封闭式驱动器)进行定制用来跟踪虚拟机的每次数据写入,并调用reflink(引用链接)来对数据历史做备份保护,充分利用了reflink的高效、低空间开销的特性,满足了True CDP方案的需求。

技术实现思路

[0006]本专利技术提供一种基于reflink的True CDP数据保护方案设计与实现方法,通过对QEMU的BlockDriver进行定制用来跟踪虚拟机的每次数据写入,并调用reflink来对数据历史做备份保护,充分利用了reflink的高效、低空间开销的特性,实现了基于IO粒度的CDP数据保护方案,解决了现有技术方案中应用受限和回放效率较低的问题。
[0007]本专利技术提供一种基于reflink的True CDP数据保护方案设计与实现方法,包括:
[0008]确定需要进行CDP保护的系统盘或者数据盘;
[0009]进行CDP相关配置;
[0010]执行对BlockDriver定制的QEMU启动虚拟机;
[0011]所述虚拟机跟踪每个用户的数据IO;
[0012]对跟踪的每个用户的数据IO做reflink备份。
[0013]进一步地,所述进行CDP相关配置包括:确保数据所在文件系统支持reflink特性、明确reflink数据保护备份保存位置和制定历史数据备份策略。
[0014]进一步地,所述执行对BlockDriver定制的QEMU启动虚拟机的过程还包括:对QEMU的BlockDriver实现进行修改;
[0015]其中,所述对QEMU的BlockDriver实现进行修改是通过增加一个钩子函数进行的,借助钩子函数实现对数据写入的方法修改。
[0016]进一步地,所述借助钩子函数实现对数据写入的方法修改的过程,包括:
[0017]对数据写入进行判断,获得判断结果;
[0018]根据所述判断结果调用底层文件系统的reflink接口;
[0019]通过调用的所述底层文件系统的reflink接口对数据写入前文件做reflink备份。
[0020]进一步地,所述对数据写入进行判断时,如果是数据写入操作,则在数据写入后端文件之前,需要执行reflink对数据做备份保护,然后再执行数据写入;如果是数据读取操作,则直接忽略。
[0021]进一步地,所述对数据写入前文件做reflink备份的同时将所述数据写入前文件的修改时间进行记录。
[0022]进一步地,还包括:
[0023]对历史数据进行恢复和对reflink数据拷贝进行定期清理;
[0024]当用户想要重新获得指定时间的数据时,通过对历史数据进行恢复即可重新获得;
[0025]随着reflink备份数据的增多,基于空间开销的考虑,所述CDP定时对reflink拷贝文件进行清理。
[0026]进一步地,所述对历史数据进行恢复的过程包括:
[0027]确定想要恢复的数据的时间点;
[0028]检索所述想要恢复的数据的时间点对应的reflink拷贝,得到检索结果;
[0029]以所述检索结果作为恢复点启动系统或者恢复数据盘。
[0030]进一步地,所述对reflink数据拷贝进行定期清理包括:
[0031]设置定期清理时间间隔;
[0032]依据所述时间间隔对reflink备份的文件进行分析整理,获得分析整理结果;
[0033]根据所述分析整理结果确定待删除的reflink备份的文件;
[0034]对待删除的reflink备份的文件进行清理。
[0035]进一步地,所述对reflink备份的文件进行分析整理包括对所述reflink备份的文件时间的判断和对所述reflink备份的文件的数据粒度的判断;
[0036]所述对所述reflink备份的文件时间的判断通过判断所述reflink备份的文件的时间确定所述所述reflink备份的文件是近期的还是较为久远的;
[0037]所述对所述reflink备份的文件的数据粒度的判断通过判断所述r本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于reflink的True CDP数据保护方案设计与实现方法,其特征在于,包括:对QEMU的BlockDriver实现进行定制;确定需要进行CDP保护的系统盘或者数据盘;进行CDP相关配置;执行对BlockDriver定制的QEMU启动虚拟机;所述虚拟机跟踪每个用户的数据IO;对跟踪的每个用户的数据IO做reflink备份。2.根据权利要求1所述的一种基于reflink的True CDP数据保护方案设计与实现方法,其特征在于,所述进行CDP相关配置包括:确保数据所在文件系统支持reflink特性、明确reflink数据保护备份保存位置和制定历史数据备份策略。3.根据权利要求1所述的一种基于reflink的True CDP数据保护方案设计与实现方法,其特征在于,所述执行对BlockDriver定制的QEMU启动虚拟机的过程还包括:对QEMU的BlockDriver实现进行修改;其中,所述对QEMU的BlockDriver实现进行修改是通过增加一个钩子函数进行的,借助钩子函数实现对数据写入的方法修改。4.根据权利要求3所述的一种基于reflink的True CDP数据保护方案设计与实现方法,其特征在于,所述借助钩子函数实现对数据写入的方法修改的过程,包括:对数据写入进行判断,获得判断结果;根据所述判断结果调用底层文件系统的reflink接口;通过调用的所述底层文件系统的reflink接口对数据写入前文件做reflink备份。5.根据权利要求4所述的一种基于reflink的True CDP数据保护方案设计与实现方法,其特征在于,所述对数据写入进行判断时,如果是数据写入操作,则在数据写入后端文件之前,需要执行reflink对数据做备份保护,然后再执行数据写入;如果是数据读取操作,则直接忽略。6.根据权利要求4所述的一种基于reflink的True CDP数据保护方案设计与实现方法,其特征在于,所述对数据写入...

【专利技术属性】
技术研发人员:李宏伟
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1