一种基于涉及批量任务的应用系统数据切片的抽取方法技术方案

技术编号：27935509 阅读：66 留言：0更新日期：2021-04-02 14:15

本发明专利技术公开了一种基于涉及批量任务的应用系统数据切片的抽取方法，属于数据处理技术领域，解决了大数据抽取数据切片与应用系统执行批量任务串行拉长批量任务时间，在规定时间内未完成抽数而后续执行批量任务污染数据抽取的问题，本方案包括以下步骤：数据库预处理；中断主从同步；大数据抽数和应用系统后续批量的并行执行；恢复主从同步。本发明专利技术的目的：缩短日终批量任务时间，避免污染待抽取的数据切片。本发明专利技术适用于银行或金融机构涉及较多批量任务且需大数据抽取数据切片的应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于涉及批量任务的应用系统数据切片的抽取方法
本专利技术涉及数据处理
，具体涉及一种基于涉及批量任务的应用系统数据切片的抽取方法。
技术介绍
应用系统的数据库集群采用主从备的架构体系。在进行数据主库同一实例下进行写入操作时，数据在主库写入成功之后，会触发数据自动同步的机制把主库当前时间段内所有的操作同步到从库和备库。在数据库使用过程中，主库用于应用系统增删改查操作。从库用于应用系统部分查询操作。备库用于大数据数据抽取。约定：大数据抽取的是应用系统从主库同步到从库，再从从库同步到备库的数据，本申请不涉及从库相关使用。为和业界术语保持统一，以下描述中实际的主备同步，都统称为“主从同步”；描述中所有的备库，都用“从库”代替。现有技术中，大数据会抽取应用系统若干批量任务中某个时间点以前的数据切片。在抽取过程中，为避免待抽取数据被后续应用系统批量任务的执行所改变从而造成数据污染，该批量任务会暂停一段时间，等待大数据抽数结束后，才能继续执行；暂停时间长短可设置。本方案提到的应用系统，是指在金融行业中涉及批量任务的应用系统，包括信贷核心应用系统、行核心应用系统等应用系统；按功能划分，可有处理信贷业务的批量、出合作方对账文件的批量、处理总账流水的批量等应用系统。综上所述，在现有的抽取方法中，存在以下两个问题：1、大数据抽数异常时，超过设置等待时间仍未完成，应用系统批量任务的继续执行会污染需要抽取的数据切片。2、应用系统的批量任务中途需暂停等待大数据抽数，拉长了总体执行...

【技术保护点】
1.一种基于涉及批量任务的应用系统数据切片的抽取方法，其特征在于：包括：/n步骤A:数据库预处理，具体为：在应用系统的主库和从库的同一实例中分别增加一个数据库，并在主库增加的数据库中新建一张表X,在从库中增加的数据库中新建一张表X'；/n步骤B：中断主从同步；/n步骤C:大数据抽取应用系统从库数据的同时，应用系统继续执行后续批量任务；/n步骤D:恢复主从同步。/n

【技术特征摘要】
1.一种基于涉及批量任务的应用系统数据切片的抽取方法，其特征在于：包括：
步骤A:数据库预处理，具体为：在应用系统的主库和从库的同一实例中分别增加一个数据库，并在主库增加的数据库中新建一张表X,在从库中增加的数据库中新建一张表X'；
步骤B：中断主从同步；
步骤C:大数据抽取应用系统从库数据的同时，应用系统继续执行后续批量任务；
步骤D:恢复主从同步。

2.根据权利要求1所述的一种基于涉及批量任务的应用系统数据切片的抽取方法，其特征在于：所述步骤A具体为：
主库和从库中所述新建表X与所述新建表X'的表名均无命名要求且表名相同。

3.根据权利要求1所述的一种基于涉及批量任务的应用系统数据切片的抽取方法，其特征在于：所述步骤B具体为：在应用系统执行批量任务到达大数据抽数节点时，通知大数据可进行...

【专利技术属性】
技术研发人员：张妍洁，唐振华，朱小容，杨斌，廖雪强，
申请(专利权)人：四川新网银行股份有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人