一种从kafka向数据库同步数据的方法技术

技术编号：33127005 阅读：21 留言：0更新日期：2022-04-17 00:38

本发明专利技术提供了一种从kafka向数据库同步数据的方法，包括：S1、从数据库查询进度表得到原始数据对应的消费进度；S2、根据消费进度从kafka中读取数据，并对读取的数据进行解析；S3、数据解析后，判断数据的操作类型，对不同操作类型的数据进行攒批操作，构造sql语句；S4、在数据库中执行sql语句，向进度表写入消费进度，并判断数据库执行结果是否正确；若数据库执行结果正确，则数据库执行提交操作；若数据库执行结果错误，数据库执行回滚操作，循环至步骤S2。本发明专利技术在用户对数据库有并发查询业务时，通过攒批集中处理，保证了用户正常业务使用计算资源，保证了数据的高同步性，同时在保证了数据结果的准确性，也保持较高的数据处理速度。速度。速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种从kafka向数据库同步数据的方法

[0001]本专利技术属于数据库
，尤其是涉及一种从kafka向数据库同步数据的方法。

技术介绍

[0002]Kafka作为一种消息队列中间件，在大数据领域应用比较广泛，可以用kafka暂存数据，实现在两个或多个数据库之间准实时同步数据，存放在kafka的数据是一条一条的，kafka用偏移量作为数据的索引，一个偏移量唯一对应一条数据，根据增量数据对应的操作类型的不同，可以把增量数据归类到新增、删除、修改三种操作类型之一；典型应用场景是业务性数据库把增量数据写到kafka，数据库从kafka读取数据，使得两个数据库的数据准实时性的保持一致，这样，数据库可以满足即席查询分析要求。
[0003]目前Kafka向数据库同步数据存在以下问题：(1)、由kafka自动保存偏移量，即每当消费者读到一批数据，kafka就自动保存这批数据的最后一条数据对应的偏移量，这种方法缺点是当消费者尚未把这批处理完就出现了异常，那么当消费者恢复正常，继续读取数据时，kafka认为刚才这批数据已经被消费过了，于是消费者会读到下一批数据，这样就造成遗漏消费；(2)、消费者调用kafka提供的接口，自行决定何时保存偏移量。当消费者完成了一批数据的处理，主动保存偏移量。这种方法的缺点是数据处理和保存偏移量这两个动作不是原子的，有可能出现，数据处理完成，数据已经进入数据库，但保存偏移量时遇到异常情况没有成功(例如kafka宕机)，这样下次再从kafka读取数据时，kafka以为上一批数据还没有被消费，于...

【技术保护点】

【技术特征摘要】
1.一种从kafka向数据库同步数据的方法，其特征在于，包括如下步骤：S1、从数据库查询进度表得到原始数据对应的消费进度；S2、根据消费进度从kafka中读取数据，并对读取的数据进行解析；S3、数据解析后，判断数据的操作类型，对不同操作类型的数据进行攒批操作，构造sql语句；S4、在数据库中执行sql语句，向进度表写入消费进度，并判断数据库执行结果是否正确；若数据库执行结果正确，则数据库执行提交操作；若数据库执行结果错误，数据库执行回滚操作，跳转至步骤S2。2.根据权利要求1所述的一种从kafka向数据库同步数据的方法，其特征在于:步骤S3中，操作类型包括insert、delete和update，在执行步骤S3的过程中，根据攒批操作的状态构造sql语句，具体方法如下:判断攒批操作是否结束；若攒批操作结束，则对应构造insert sql语句和delete sql语句；若攒批操作未结束，则跳转至步骤S2。3.根据权利要求2所述的一种从kafka向数据库同步数据的方法，其特征在于，在进行步骤S3中，执行攒批操作时需配合设置不同的缓冲区，缓冲区包括缓冲区A、缓冲区B和缓冲区C，...

【专利技术属性】
技术研发人员：赵伟，姜骁，
申请(专利权)人：天津南大通用数据技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人