The application provides an incremental data extraction method, device and server, which includes: obtaining the identification corresponding to the latest incremental data generated from the source database system; determining the identification range of the incremental data to be extracted based on the acquired identification and the identification of the last incremental data extracted locally; extracting and storing the incremental corresponding to the identification range from the source database system. Data. Because this application does not need to install any agent program in the source database system, it can realize the extraction of incremental data, thus reducing the impact of incremental data extraction on the normal operation of the source database.
【技术实现步骤摘要】
增量数据抽取方法、装置及服务器
本申请涉及数据处理
,尤其涉及一种增量数据抽取方法、装置及服务器。
技术介绍
数据库同步技术通常应用在数据的容灾备份、业务分担等领域,而无论是同一类型数据库之间的同步,还是不同类型数据库之间的同步,在源数据库中进行的数据抽取是数据库同步技术的基础,常用的数据抽取方式有增量数据抽取。相关技术中的增量数据抽取,通常需要在源数据库系统中安装一个代理程序,由代理程序来完成增量数据的抽取,以及最终的同步。然而这种需要在源数据库系统中安装代理程序的抽取方式,与源数据库耦合比较深,在代理程序出现问题时,会对源数据库的正常运行造成影响。
技术实现思路
有鉴于此,本申请提供一种增量数据抽取方法、装置及服务器,以解决在源数据库系统安装代理程序抽取增量数据的方式,可能会导致源数据库无法正常运行的问题。根据本申请实施例的第一方面,提供一种增量数据抽取方法,所述方法应用于能够访问源数据库系统的服务器,所述方法包括:从所述源数据库系统中获取最新产生的增量数据对应的标识;依据获取的标识和本地已抽取的最后一条增量数据的标识,确定待抽取增量数据的标识范围;从所述源数据库系统中抽取并存储所述标识范围对应的增量数据。根据本申请实施例的第二方面,提供一种增量数据抽取装置,所述装置应用于能够访问源数据库系统的服务器,所述装置包括:获取模块,用于从所述源数据库系统中获取最新产生的增量数据对应的标识;确定模块,用于依据获取的标识和本地已抽取的最后一条增量数据的标识,确定待抽取增量数据的标识范围;抽取模块,用于从所述源数据库系统中抽取并存储所述标识范围对应的增量数据。根 ...
【技术保护点】
1.一种增量数据抽取方法,其特征在于,所述方法应用于能够访问源数据库系统的服务器,所述方法包括:从所述源数据库系统中获取最新产生的增量数据对应的标识;依据获取的标识和本地已抽取的最后一条增量数据的标识,确定待抽取增量数据的标识范围;从所述源数据库系统中抽取并存储所述标识范围对应的增量数据。
【技术特征摘要】
1.一种增量数据抽取方法,其特征在于,所述方法应用于能够访问源数据库系统的服务器,所述方法包括:从所述源数据库系统中获取最新产生的增量数据对应的标识;依据获取的标识和本地已抽取的最后一条增量数据的标识,确定待抽取增量数据的标识范围;从所述源数据库系统中抽取并存储所述标识范围对应的增量数据。2.根据权利要求1所述的方法,其特征在于,从所述源数据库系统中抽取并存储所述标识范围对应的增量数据,包括:将所述标识范围划分为多段标识;通过运行各个抽取线程,并行从源数据库系统中抽取每段标识对应的增量数据;将抽取的增量数据按照标识从小到大进行排序,并将排序后的增量数据存入缓存。3.根据权利要求2所述的方法,其特征在于,并行从源数据库系统中抽取每段标识对应的增量数据,包括从所述源数据库系统中,获取每个重做日志组记录的增量数据的起止标识;针对每段标识,依据所述起止标识判断该段标识中是否存在重做日志组未记录的标识;若存在,则从归档日志中抽取所述重做日志组未记录的标识对应的增量数据,并确定该段标识除所述重做日志组未记录的标识之外其它标识所在的重做日志组,并从确定的重做日志组中抽取其它标识对应的增量数据;若不存在,则直接确定该段标识所在的重做日志组,并从确定的重做日志组中抽取该段标识对应的增量数据。4.根据权利要求2所述的方法,其特征在于,将排序后的增量数据存入缓存之后,所述方法还包括:从所述缓存中读取所述增量数据;通过运行各个处理线程,并行处理读取到的增量数据;其中,每个处理线程每次处理预设数量的增量数据;将处理后的增量数据按照标识从小到大进行排序之后,依次存储到预设消息队列中。5.一种增量数据抽取装置,其特征在于,所述装置应用于能够访问源数据库系统的服务器,所述装置包括:获取模块,用于从所述源数据库系统中获取最新产...
【专利技术属性】
技术研发人员:褚占峰,王建毅,徐辉,王俊皓,
申请(专利权)人:杭州数梦工场科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。