【技术实现步骤摘要】
一种对数据抽取方法的改进
本专利技术涉及一种不同数据库间同步数据的方法,具体涉及一种不同数据库间同步数据的ETL方法的优化。
技术介绍
在数据库大量运用的环境下,数据库之间数据同步技术是维护各个数据库节点之间数据一致性的重要方法。其中,包括大量异构数据库之间需要进行数据同步的需求。因此,经常涉及到对大量异构的数据进行处理,数据抽取、转换、装载的过程(Extract-Transform-Load,ETL)是重要的一个环节。在现有技术中,数据在ETL处理过程中,经常遇到源表结构发生变化、源表结构中存在特殊类型字段导致数据抽取失败的情况,而目前主流的ETL工具需要繁琐的人工处理才能解决此类问题,因此需要对不同数据库间同步数据的ETL方法进行改进。
技术实现思路
本专利技术针对一般通用的在数据库间同步数据的ETL方法的优化及改进,对数据源的变化采用自动更新,实现源系统数据表结构变化同步和自定义数据类型屏蔽。本专利技术的技术方案如下:一种对数据抽取方法的改进,所述方法包括以下步骤:第一步:获取源数据库表结构;查询源数据库的字典表获取源数据库表结构;第二步:对比目标数据库表结构,获取有无差异;查询目标数据库的字典表获取目标数据库表结构,将目标数据库表结构与第一步查询到的源数据库表结构进行比对,分析有无差异;第三步:更新目标数据库表结构;如果源数据库表结构与目标数据库表结构有差异,则更新目标数据库表结构,进入下一步;如果源数据库表结构与目标数据库表结构无差异,则直 ...
【技术保护点】
1.一种对数据抽取方法的改进,其特征在于:所述方法包括以下步骤:/n第一步:获取源数据库表结构;查询源数据库的字典表获取源数据库表结构;/n第二步:对比目标数据库表结构,获取有无差异;查询目标数据库的字典表获取目标数据库表结构,将目标数据库表结构与第一步查询到的源数据库表结构进行比对,分析有无差异;/n第三步:更新目标数据库表结构;如果源数据库表结构与目标数据库表结构有差异,则更新目标数据库表结构,进入下一步;如果源数据库表结构与目标数据库表结构无差异,则直接进入下一步;/n第四步:判断是否有类型屏蔽;查询屏蔽类型用户配置表,判断字段是否属于屏蔽类型;/n第五步:加载屏蔽类型;如字段属于屏蔽类型,则过滤该字段,进入下一步;如字段不属于屏蔽类型,则直接进入下一步;/n第六步:数据抽取;从源数据库表中抽取数据,存入目标数据库表;/n第七步:抽取结束,并完成存储,操作完成。/n
【技术特征摘要】
1.一种对数据抽取方法的改进,其特征在于:所述方法包括以下步骤:
第一步:获取源数据库表结构;查询源数据库的字典表获取源数据库表结构;
第二步:对比目标数据库表结构,获取有无差异;查询目标数据库的字典表获取目标数据库表结构,将目标数据库表结构与第一步查询到的源数据库表结构进行比对,分析有无差异;
第三步:更新目标数据库表结构;如果源数据库表结构与目标数据库表结构有差异,则更新目标数据库表结构,进入下一步;如果源数据库表结构与目标数据库表结构无差异,则直接进入下一步;
第四步:判断是否有类型屏蔽;查询屏蔽类型用户配置表,判断字段是否属于屏蔽类型;
第五步:加载屏蔽类型;如字段属于屏蔽类型,则过滤该字段,进入下一步;如字段不属于屏蔽类...
【专利技术属性】
技术研发人员:李东升,
申请(专利权)人:南京我爱我家信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。