基于云平台的自动数据备份系统、方法及装置制造方法及图纸

技术编号:32731802 阅读:9 留言:0更新日期:2022-03-20 08:37
本发明专利技术公开了基于云平台的自动数据备份系统,包括备份设置模块、备份模块、标签模块和筛选分析模块,所述备份设置模块对需要备份的文件进行选择,设置备份的周期时长,所述备份模块按照设置的周期时长自动备份文件,所述标签模块每次备份后添加备份标签,标签内部包括备份时间、备份文件名称和文件容量,所述筛选分析模块识别重复文件,本发明专利技术通过先对备份文件中重复文件的查找和删除,在对文件中重复数据组的查找和删除,能够快速的对备份数据进行合理删减,使得备份空间中重复数据被删除,释放出备份空间,从而能够备份更多的数据,提高了备份空间的使用率,数据的冗余度降低,节省数据的处理时间,使数据的恢复更加方便。使数据的恢复更加方便。使数据的恢复更加方便。

【技术实现步骤摘要】
基于云平台的自动数据备份系统、方法及装置


[0001]本专利技术涉及基于数据备份
,具体为基于云平台的自动数据备份系统、方法及装置。

技术介绍

[0002]数据备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程,传统的数据备份主要是采用内置或外置的磁带机进行冷备份,但是这种方式只能防止操作失误等人为故障,而且其恢复时间也很长,随着技术的不断发展,数据的海量增加,不少的企业开始采用网络备份,网络备份一般通过专业的数据存储管理软件结合相应的硬件和存储设备来实现;
[0003]但是目前基于云平台的数据备份中,没有对重复数据进行筛选,导致不断备份后,重复数据占用较多的备份空间,不仅导致备份空间利用率降低,对于备份数据的管理和备份数据的恢复也较为麻烦。

技术实现思路

[0004]本专利技术提供基于云平台的自动数据备份系统、方法及装置,可以有效解决上述
技术介绍
中提出目前基于云平台的数据备份中,没有对重复数据进行筛选,导致不断备份后,重复数据占用较多的备份空间,不仅导致备份空间利用率降低,对于备份数据的管理和备份数据的恢复也较为麻烦的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:基于云平台的自动数据备份系统,包括备份设置模块、备份模块、标签模块和筛选分析模块;
[0006]所述筛选分析模块包括重复筛选单元、分析评估单元和删除单元;
[0007]所述重复筛选单元定时识别备份模块中的重复文件;
[0008]所述分析评估单元根据重复文件的筛选结果计算综合备份值和筛选耗费值;
[0009]所述删除单元根据分析评估结果对多余重复文件进行删除;
[0010]所述综合备份值通过下式计算得出:
[0011][0012]式中,H为综合备份值;
[0013]m为备份文件总容量;
[0014]m1为需要删除的重复文件容量;
[0015]k为删除重复文件前,备份文件标签个数;
[0016]k1为删除重复文件后,备份文件标签个数;
[0017]f为删除重复文件前,备份文件的恢复难度;
[0018]f1为删除重复文件后,备份文件的恢复难度;
[0019]t为删除重复文件前,数据恢复预测时长;
[0020]t1为删除重复文件后,数据恢复预测时长;
[0021]T为筛选耗费值;
[0022]所述m和m1的单位为mb;
[0023]所述文件的恢复难度为专家根据国际标准SHARE78对备份文件恢复难度的评分,评分分值为1

7分;
[0024]所述t和t1的单位为s;
[0025]综合备份值H的计算结果大于等于则删除重复数据;
[0026]综合备份值H的计算结果小于则保留重复数据;
[0027]筛选耗费值T为筛选重复数据时耗费的资源,筛选耗费值的计算公式:
[0028]T=(k

k1)lnt2+(2t3)2+4t3;
[0029]式中,t2为重复文件识别的时长;
[0030]k为删除重复文件前,标签个数;
[0031]k1为删除重复文件后,标签个数;
[0032]t3为多余重复文件删除的时长;
[0033]所述t2和t3的单位为s。
[0034]根据上述技术方案,所述备份设置模块对需要备份的文件进行选择,设置备份的周期时长;
[0035]所述备份模块按照设置的周期时长自动备份文件;
[0036]所述标签模块每次备份后添加备份标签,标签内部包括备份时间、备份文件名称和文件容量;
[0037]所述筛选分析模块识别重复文件,对重复文件进行分析,并删除多余的重复文件。
[0038]根据上述技术方案,所述备份设置模块包括云备份库,所述云备份库包括备份数据库、共享数据库和回收数据库;
[0039]所述备份数据库接收备份数据,并存储备份数据,共享数据库存储保留下来的重复数据组,回收数据库保存删除的重复数据;
[0040]共享数据库的存储空间是备份数据库存储空间的十分之一,回收数据库的存储空间是备份数据库存储空间的十分之一,回收数据库存储满后,自动清空数据。
[0041]根据上述技术方案,基于云平台的自动数据备份系统的数据恢复方法,步骤如下:
[0042]S1、首先通过设置模块设置自动备份的时间周期,备份模块在设置的时间周期进行文件备份;
[0043]S2、标签模块对备份的文件设置备份标签,标签内容包括备份时间、文件名称和文件容量;
[0044]S3、重复筛选单元对备份文件中的内容完全重复的文件进行筛选;
[0045]S4、分析评估单元根据备份和筛选的重复文件进行计算,确定综合备份值和筛选耗费值;
[0046]S5、根据计算结果,对需要删除的多余重复文件进行删除;
[0047]S6、对备份文件内的数据划分成数据组,为每个数据组设置名称,将多个文件的数据组进行比较,查看重复次数;
[0048]S7、数据组重复次数是文件个数的0.5

1倍时,则在重复数据组中选择一个保留,删除剩余的重复数据组,并在删除位置标记数据组的名称。
[0049]根据上述技术方案,所述S6中,数据组的划分先将重复部分全部划分为初始数据组,再将两个初始数据组重复的数据划分为一个新的数据组;
[0050]所述S7中,数据组确定删除后,在备份模块新建共享数据库,将保留下来的数据组存储至共享数据库中;
[0051]备份文件恢复时,识别文件中标记的数据组的名称,则在共享数据库中,根据数据组的名称调出对应的数据组。
[0052]根据上述技术方案,一种数据备份装置,根据数据备份系统或方法任一步骤制成的终端装置。
[0053]与现有技术相比,本专利技术的有益效果:
[0054]1、通过设置标签模块和筛选分析模块,将备份的文件设置标签,便于查找,对备份文件中的重复文件进行筛选,计算综合备份值和筛选耗费值,通过在空间、耗时、恢复难度和恢复时长进行分析,更加全面的了解重复文件备份和删除带来的消耗,分析选择是否删除重复文件,能够合理的对重复数据进行筛选删除,减少一些信息量低、不完整的文件的重复存储,从而提高备份空间的利用。
[0055]2、通过对文件中数据组的划分,筛选出文件中重复的数据组,并提取出重复次数较多的数据组,在重复数据组中选择一个数据组保留,删除剩余的重复数据组,并设置共享数据库,将保留的数据组存储至共享数据组中,能够进一步对重复数据进行删除,缩减文件容量,使文件的存储和调取更加便捷。
[0056]3、通过对重复数据的查找确定初始数据组,再对初始数据组之间重复情况的对比,确定数据组,使数据组的划分更加符合重复数据分析的要求,节省数据组划分的时间,提高重复数据组的查找效率,为重复数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于云平台的自动数据备份系统,其特征在于:包括备份设置模块、备份模块、标签模块和筛选分析模块;所述筛选分析模块包括重复筛选单元、分析评估单元和删除单元;所述重复筛选单元定时识别备份模块中的重复文件;所述分析评估单元根据重复文件的筛选结果计算综合备份值和筛选耗费值;所述删除单元根据分析评估结果对多余重复文件进行删除;所述综合备份值通过下式计算得出:式中,H为综合备份值;m为备份文件总容量;m1为需要删除的重复文件容量;k为删除重复文件前,备份文件标签个数;k1为删除重复文件后,备份文件标签个数;f为删除重复文件前,备份文件的恢复难度;f1为删除重复文件后,备份文件的恢复难度;t为删除重复文件前,数据恢复预测时长;t1为删除重复文件后,数据恢复预测时长;T为筛选耗费值;所述m和m1的单位为mb;所述文件的恢复难度为专家根据国际标准SHARE78对备份文件恢复难度的评分,评分分值为1

7分;所述t和t1的单位为s;综合备份值H的计算结果大于等于则删除重复数据;综合备份值H的计算结果小于则保留重复数据;筛选耗费值T为筛选重复数据时耗费的资源,筛选耗费值的计算公式:T=(k

k1)ln t2+(2t3)2+4t3;式中,t2为重复文件识别的时长;k为删除重复文件前,标签个数;k1为删除重复文件后,标签个数;t3为多余重复文件删除的时长;所述t2和t3的单位为s。2.根据权利要求1所述的基于云平台的自动数据备份系统,其特征在于,所述备份设置模块对需要备份的文件进行选择,设置备份的周期时长;所述备份模块按照设置的周期时长自动备份文件;
所述标签模块每次备份后添加备份标签,标签内部包括备份时间、备份文件名称和文件容量;所述筛选分析模块识别重复文件,对重复文件进行分析,并删除多余的重复文件。3.根据权利要求2所述的基于云平台...

【专利技术属性】
技术研发人员:赵志军焦杨段磊磊张利静
申请(专利权)人:江苏金农股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1