【技术实现步骤摘要】
本专利技术涉及数据仓库
,尤其涉及一种。
技术介绍
在数据仓库领域,常用的数据组织方式都是使用星型模型架构,以事实表上的各类维度为核心,辅以各类信息维,支撑起维度建模的数据仓库架构。由于数据仓库主要特点为数据量大,数据属性更新频率相对不高,所以一般情况下事实表和维表都采用时间压缩方式来存储数据,通过在事实表与维表中加上有效开始日期和有效结束日期两个字段来表示记录的时间有效性,这样一段时间内相同记录可以压缩为一条记录。如表1与表2所示,表1为没有进行时间压缩的数据,表2为采用了时间压缩后的数据,可以看出原来10条记录被压缩成了1条记录。实践证明,该方式可以有效地压缩冗余数据,节省存储空间,但这种方式压缩的数据,数据的备份和恢复变得非常不便。 表1 表2在数据仓库
,由于数据库管理系统本身提供的增量备份和恢复功能,只能用于没有进行时间压缩的数据,对于已经进行过时间压缩的数据则无法处理。因此,目前对于经过时间压缩的数据都是采用全量备份方式进行数据备份和恢复。由于数据仓库数据量非常庞大,一般都是海量数据,所以全量备份方式处理效率非常低,备份速度很慢,需要耗费很长的时间,甚至需要中止系统正常的业务处理来进行数据备份与恢复,对生产造成了较大的影响,严重影响了系统24小时提供服务。
技术实现思路
(一)要解决的技术问题有鉴于此,本专利技术的主要目的在于提供一种,以提高数据增量备份与恢复的效率。(二)技术方案为达到上述目的,本专利技术提供了一种,该方法利用基于时间压缩的数据记录的更新前映像BEFORE IMAGE和更新后映像AFTER IM ...
【技术保护点】
一种应用于数据仓库的数据增量备份与恢复的方法,其特征在于,该方法利用基于时间压缩的数据记录的更新前映像BEFOREIMAGE和更新后映像AFTERIMAGE进行数据增量的备份与恢复;在进行数据增量备份时,首先根据本次数据加载 所需要更新的数据生成基于时间压缩的更新数据记录,然后根据被更新表中需要删除的数据记录生成BEFOREIMAGE,并根据被更新表中需要增加的数据记录生成AFTERIMAGE,将BEFOREIMAGE和AFTERIMAGE追加到 加载日志日志文件中,最后将本次的加载日志文件进行备份;在进行数据增量恢复时,包括正向恢复和逆向恢复;正向恢复先将系统恢复到最近的一次全量备份状态,再对该次全量备份以来的增量备份进行恢复,在恢复过程中运用加载日志中的BEFOREI MAGE和AFTERIMAGE,首先将被更新表与BEFOREIMAGE进行匹配,将匹配上的记录删除,然后将AFTERIMAGE插入被更新表;逆向恢复先将被更新表与AFTERIMAGE进行匹配,将匹配上的记录删除,然后将BEF ...
【技术特征摘要】
1.一种应用于数据仓库的数据增量备份与恢复的方法,其特征在于,该方法利用基于时间压缩的数据记录的更新前映像BEFORE IMAGE和更新后映像AFTER IMAGE进行数据增量的备份与恢复;在进行数据增量备份时,首先根据本次数据加载所需要更新的数据生成基于时间压缩的更新数据记录,然后根据被更新表中需要删除的数据记录生成BEFORE IMAGE,并根据被更新表中需要增加的数据记录生成AFTER IMAGE,将BEFORE IMAGE和AFTER IMAGE追加到加载日志日志文件中,最后将本次的加载日志文件进行备份;在进行数据增量恢复时,包括正向恢复和逆向恢复;正向恢复先将系统恢复到最近的一次全量备份状态,再对该次全量备份以来的增量备份进行恢复,在恢复过程中运用加载日志中的BEFORE IMAGE和AFTERIMAGE,首先将被更新表与BEFORE IMAGE进行匹配,将匹配上的记录删除,然后将AFTER IMAGE插入被更新表;逆向恢复先将被更新表与AFTER IMAGE进行匹配,将匹配上的记录删除,然后将BEFORE IMAGE插入被更新表。2.根据权利要求1所述的应用于数据仓库的数据增量备份与恢复的方法,其特征在于,所述数据增量备份的过程具体包括步骤10根据本次数据加载所需要更新的数据,生成基于时间压缩的更新数据记录;步骤11根据生成的基于时间压缩的更新数据记录,确定被更新表中需要删除的数据,生成BEFORE IMAGE,将生成的BEFORE IMAGE追加到加载日志文件中;步骤12根据基于时间压缩的更新数据记录,确定被更新表中需要增加的数据,生成AFTER IMAGE,将生成的AFTER IMAGE追加到加载日志文件中;步骤13将被更新表中与BEFORE IMAGE对应的数据记录删除;步骤14将与AFTER IMAGE对应的数据记录增加到被更新表中;步骤15将本次的加载日志文件进行备份。3.根据权利要求2所述的应用于数据仓库的数据增量备份与恢复的方法,其特征在于,所述步骤10包括在进行数据加载时,先读取被加载数据,根据被加载数据中的日期字段,确定被加载数据的最早日期和最大日期;再查询被更新表,找到有效结束日期比被加载数据最早日期小但最接近的记录,并找到有效开始...
【专利技术属性】
技术研发人员:张昀,金焰,朱敏,赵戬,徐民,吴璇,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。