【技术实现步骤摘要】
一种数据备份方法、恢复方法、计算机设备和存储介质
本专利技术涉及数据存储
,尤指一种数据备份方法、恢复方法、计算机设备和存储介质。
技术介绍
数据备份是重要的数据保护方式,重要的数据可以按照一定的频率(例如一天或一周)进行副本保存;当某次备份的数据需要再次读取时,可以把相应的备份数据恢复出来使用。由于备份的频率一般较高,其间被修改的数据量一般较小,因此数据备份系统中一般都存在大量的冗余数据。据统计,EMC和赛门铁克公司的商用备份服务器中冗余数据量高达88-90%。因此,我们需要采取数据去重技术来消除掉完全相同的数据块,即数据备份系统中常用的冗余消除技术。数据去重技术包括如下三个环节:数据分块、指纹计算和指纹索引。待备份数据会在数据分块环节被切割成数据块;指纹计算环节会为每个分割好的数据块计算一个指纹来标记该数据块,指纹相同则表示对应的数据块相同,常用的指纹计算方法包括MD5和SHA-1等;指纹索引环节则通过匹配指纹来确定各数据块是否重复。当数据去重技术应用于备份系统中时,如果数据块不重复,系统会保存该数 ...
【技术保护点】
1.一种数据备份方法,其特征在于,所述方法包括:/nS11.初始化一个哈希表HTB,哈希表HTB的关键码为数据块指纹,值为该数据块指纹在本次备份中的出现次数;/nS22.对每个被数据去重处理过的数据块的数据块指纹,查找所述数据块指纹是否存在于哈希表HTB中:/nS2201.如果存在,将其出现次数加1;/nS2202.如果不存在,插入一条记录到哈希表HTB中,记录的关键码为该数据块的指纹,值为其出现次数,赋值为1;/nS33.重复步骤S22直到备份结束,并将哈希表HTB中所有出现次数大于等于2的数据块指纹和出现次数写入磁盘。/n
【技术特征摘要】
1.一种数据备份方法,其特征在于,所述方法包括:
S11.初始化一个哈希表HTB,哈希表HTB的关键码为数据块指纹,值为该数据块指纹在本次备份中的出现次数;
S22.对每个被数据去重处理过的数据块的数据块指纹,查找所述数据块指纹是否存在于哈希表HTB中:
S2201.如果存在,将其出现次数加1;
S2202.如果不存在,插入一条记录到哈希表HTB中,记录的关键码为该数据块的指纹,值为其出现次数,赋值为1;
S33.重复步骤S22直到备份结束,并将哈希表HTB中所有出现次数大于等于2的数据块指纹和出现次数写入磁盘。
2.一种数据恢复方法,其特征在于,所述方法包括:
S300.初始化数据恢复所需要的备份信息、恢复缓存CacheR;
S301.读取需恢复数据的文件谱;
S302.从文件谱中读取恢复数据所需的数据块指纹;判断该数据块指纹是否为空;
S3021.如果为空,表示所有所需数据块已找到,执行步骤S306;
S3022.如果不为空,执行步骤S303;
S303.查看该数据块指纹是否存在于哈希表HTR中;
S3031.如果存在且其数据块内容不为空,获取对应的数据块内容,并将对应记录的数据块出现次数减1,判断数据块出现次数是否等于0;
S30311.如果等于0,将对应记录从哈希表HTR中移除以节约内存,执行步骤S302;
S30312.如果不等于0,执行步骤S302;
S304.查看该数据块指纹是否存在于恢复缓存中;
S3041.如果存在,获取对应的数据块内容;
S3042.如果不存在,将包含所需数据块的容器读取到恢复缓存中,获取该数据块内容;
S305.判断该数据块的指纹是否存在于哈希表HTR中;
S3051.如果存在,将数据块内容拷贝给记录的数据块内容,将该数据块出现次数减1;在队列Queue尾部插入一个指针指向哈希表HTR中对应的记录;执行步骤S3053;
S3052.如果不存在,执行步骤S302;
S3053.判断哈希表HTR的大小是否大于上限值Max;
S30531.如果大于Max,移除队...
【专利技术属性】
技术研发人员:张宇成,张文栋,王春枝,严灵毓,苏军,李星,王早宁,马森,官沙,王梓田,肖嘉伟,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。