【技术实现步骤摘要】
增量数据实时比对修复方法、装置、计算机设备及存储介质
[0001]本专利技术涉及数据修复方法,更具体地说是指增量数据实时比对修复方法
、
装置
、
计算机设备及存储介质
。
技术介绍
[0002]目前的实时数据同步领域,由于数据库日志过期机制或者挖掘日志异常,采集位点丢失等情况,采集的增量数据会偶发出现数据丢失的场景;或者因为一些人为因素导致目标部分数据被误操作,快速有效的比对修复数据是整个数据同步领域需要面对的难题
。
[0003]在当下所有的数据修复方法中,都是对全量或者某区间范围数据进行源库和目标数据库比对,发现存在总量或者内容差异后,暂停当前实时同步任务后进行差异化修复
。
该修复方案存在的一个问题在于,当前同步任务会被暂停,整个同步过程发生不可控的时效性问题;如果不暂停会导致目标数据库发生并发写场景,可能出现目标数据库数据的不一致最终修复失败,这是非常致命的问题
。
[0004]因此,有必要设计一种新的方法,实现在不暂停实时同步任务的场景下,完成整个数据的修复工作,以达到同步和修复同时进行的目的
。
技术实现思路
[0005]本专利技术的目的在于克服现有技术的缺陷,提供增量数据实时比对修复方法
、
装置
、
计算机设备及存储介质
。
[0006]为实现上述目的,本专利技术采用以下技术方案:增量数据实时比对修复方法,包括:
[0007]配置增量 ...
【技术保护点】
【技术特征摘要】
1.
增量数据实时比对修复方法,其特征在于,包括:配置增量实时修复计划;根据所述增量实时修复计划获取源数据库表格修复时间窗口内的增量数据快照信息;解析当前
CDC
增量数据日志信息,以获取增量数据所在数据库的事务日志位点;对所述事务日志位点和所述增量数据快照信息的时间窗口范围进行比较,并确定比对数据集合;对所述比对数据集合和目标数据库数据进行比较,以得到修复数据集合;对所述修复数据集合进行数据实时修复
。2.
根据权利要求1所述的增量数据实时比对修复方法,其特征在于,所述增量实时修复计划包括需要修复的源数据库连接信息
、
源数据库相应表格名称
、
开始修复的时间节点
、
每次修复的时间窗口大小以及每次修复的增量数据快照大小
。3.
根据权利要求2所述的增量数据实时比对修复方法,其特征在于,所述根据所述增量实时修复计划获取源数据库表格修复时间窗口内的增量数据快照信息,包括:根据每次修复的增量数据快照大小查询当前的修复时间窗口需修复的增量数据快照信息,并存放在本地内存中
。4.
根据权利要求2所述的增量数据实时比对修复方法,其特征在于,所述解析当前
CDC
增量数据日志信息,以获取增量数据所在数据库的事务日志位点,包括:解析当前
CDC
增量数据日志信息,以获取增量数据所在数据库的事务日志位点
。5.
根据权利要求4所述的增量数据实时比对修复方法,其特征在于,所述对所述事务日志位点和所述增量数据快照信息的时间窗口范围进行比较,并确定比对数据集合,包括:根据所述事务日志位点和所述增量数据快照信息进行比较,以判断所述事务日志位点是否在所述增量数据快照信息的时间窗口范围内;若所述事务日志位点在所述增量数据快照信息的时间窗口范围内,则对所述增量数据快照信息进行主键或者唯一键过滤,将重复数据从所述增量数据快照信息中删除,以得到比对数据集合;若所述事务日志位点不在所述增量数据快照信息的时间窗口范围内,则判断所述事务日志位点是否小于所述增量数据快照信息的时...
【专利技术属性】
技术研发人员:柳遵梁,肖斌,闻建霞,汤国胜,张浩,
申请(专利权)人:杭州美创科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。