Mysql增量数据实时同步方法、计算机可读存储介质技术

技术编号：39314569 阅读：8 留言：0更新日期：2023-11-12 15:58

本发明专利技术实施例公开了Mysql增量数据实时同步方法、计算机可读存储介质；方法包括步骤：S1、利用Canal监听数据库变更，获取增量数据，将增量数据发送到kafka；S2、利用Structured Streaming读取kafka的数据流，进行实时处理分析，并写入外部系统，实现增量数据的同步。Mysql增量数据实时同步方法，基于Canal、Kafka和Structured Streaming的数据采集和分析流程包括安装配置Canal、连接并同步数据到Kafka、使用Structured Streaming读取Kafka数据、定义数据结构和转换操作、执行流数据处理逻辑以及输出结果或存储数据到外部系统等步骤。Mysql增量数据实时同步方法可以实现实时的数据采集、流数据处理和分析，具有高可靠性、低延迟和强大的数据处理能力。低延迟和强大的数据处理能力。低延迟和强大的数据处理能力。

全部详细技术资料下载

【技术实现步骤摘要】
Mysql增量数据实时同步方法、计算机可读存储介质

[0001]本专利技术属于数据处理
，具体涉及Mysql增量数据实时同步方法、计算机可读存储介质。

技术介绍

[0002]随着互联网技术的飞速发展，大数据时代已经到来，数据实时采集、同步、计算并及时响应和反馈结果成为根据业务的实时变化及时调整策略并快速响应执行解决方案中至关重要的环节。
[0003]数据同步环节是其中重要的内容。通常数据同步是指在不影响业务方正常业务的情况下从业务数据库同步实时数据和历史数据到大数据仓库，为后续的变量计算等操作提供有效实时的数据。
[0004]Canal是基于Java开发、基于数据库增量日志解析、提供增量数据订阅和消费、目前主要支持mysql数据库的同步系统。
[0005]kafka是一个分布式、支持分区、多副本、基于zookeeper协调的分布式消息系统，其最大的特性是可以实时处理大量数据以满足各种需求场景，比如基于hadoop的批处理系统、低延迟的实时系统、storm/spark流式处理引擎，web/nginx日志、访问日志，消息服务等。目前宜信也有过类似系统，借鉴了linkedin的思想通过canal和kafka来实现数据同步操作。但是，其维度单一，添加、减少所对接的业务线不方便，无法根据对接业务线控制并发量，不同集群之间的kafka、hbase、elasticsearch无法写入。

技术实现思路

[0006]有鉴于此，一方面，一些实施例公开了Mysql增量数据实时同步方法，其特征在...

【技术保护点】

【技术特征摘要】
1.Mysql增量数据实时同步方法，其特征在于，包括步骤：S1、利用Canal监听数据库变更，获取增量数据，将增量数据发送到kafka；S2、利用Structured Streaming读取kafka的数据流，进行实时处理分析，并写入外部系统，实现增量数据的同步。2.根据权利要求1所述的Mysql增量数据实时同步方法，其特征在于，步骤S2还包括对异常数据采取报警机制。3.根据权利要求1所述的Mysql增量数据实时同步方法，其特征在于，步骤S2还包括在实时数据仪表盘上可视化展示数据处理结果。4.根据权利要求1～3任一项所述的Mysql增量数据实时同步方法，其特征在于，步骤S1、利用canal监听数据库变更具体包括：S11、读取mysql BinalyLog日志；S12、EventParser向mysql发送dump命令，mysql接受到dump命令后，由EventParser从mysql上拉取binlog数据进行解析，并传递给EventSink，更新Log Position；S13、EventSink对数据进行过滤、分发、归并和加工；S14、EventStore利用三个指针Put、Get和Ack标识数据的存储和读取位置。5.根据权利要求4所述的Mysql增量数据...

【专利技术属性】
技术研发人员：杨斌，于洋，张宝庆，张立斌，庄力，
申请(专利权)人：中远海运科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人