一种数据同步的方法及相关设备技术

技术编号：29063654 阅读：12 留言：0更新日期：2021-06-30 09:08

本申请提供一种数据同步的方法及相关设备。其中，该方法包括：跟随者分区follower partition获取偏移量选取策略；该follower partition基于所述偏移量选取策略确定在待同步的话题topic的领导者分区leader partition中的目标偏移量；该follower partition从所述leader partition的确定的目标偏移量开始同步所述leader partition中的数据到所述follower partition。上述方法能够提高数据同步的灵活性，提高数据同步效率，缩短数据同步时间。时间。时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据同步的方法及相关设备

[0001]本专利技术涉及信息
，尤其涉及一种数据同步的方法及相关设备。

技术介绍

[0002]分布式发布订阅消息系统(kafka)具备良好的功能特性，它通过磁盘结构提供消息的持久化，可以保持长时间的稳定性能，具备高吞吐量，能够支持每秒数百万的消息，而且可以支持并行数据加载，所以kafka一般用于处理应用服务系统或人工智能(artificial intellingence，AI)平台产生的海量流数据。
[0003]Kafka作为当前最常用的分布式消息队列系统，通常会缓存消息数据在本地磁盘上，kafka中发布订阅的对象是类别(topic)，每个topic表示一类数据，一个topic又分为多个分区(partition)，每个partition就是一个有序的队列。每个topic的不同partition分布在不同的磁盘或主机上，同时，kafka为了保证可靠性，每个partition又存在多个副本(replica)，多个副本之间会选举出一个主副本，主副本又可以称为领导者分区(leader partition)，其余的副本为从副本，又可以称为跟随者分区(follower partition)。Follower partition会持续的从leader partition同步最新的消息数据，消费者(从topic订阅消息的客户端)和生产者(向topic发布消息的客户端)在进行消费和生产时，直接和leader partition进行交互。当某个leader partition所在的节点突然发...

【技术保护点】

【技术特征摘要】
1.一种数据同步的方法，其特征在于，所述方法包括：跟随者分区follower partition获取偏移量选取策略；所述follower partition基于所述偏移量选取策略确定在待同步的话题topic的领导者分区leader partition中的目标偏移量；所述follower partition从所述leader partition的确定的目标偏移量开始同步所述leader partition中的数据到所述follower partition。2.如权利要求1所述的方法，其特征在于，所述方法还包括：所述follower partition向所述leader partition发送查询请求，所述查询请求用于查询当前时刻所述leader partition中的偏移量；所述follower partition计算所述当前时刻所述leader partition中的偏移量与所述follower partition中的偏移量的差值，并在所述差值大于预设阈值时确定同步所述leader partition中的数据到所述follower partition。3.如权利要求1或2所述的方法，其特征在于，所述偏移量选取策略为偏移量自适应确定策略，所述follower partition基于所述偏移量选取策略确定在待同步的topic的leader partition中的偏移量，包括：所述follower partition获取所述leader partition的数据平均写入速度；所述follower partition根据所述leader partition的数据平均写入速度，计算得到所述目标偏移量。4.如权利要求1或2所述的方法，其特征在于，所述偏移量选取策略为偏移量自适应确定策略，所述follower partition基于所述偏移量选取策略确定在待同步的topic的leader partition中的偏移量，包括：所述follower partition获取所述leader partition的起始偏移量和所述leader partition的数据平均写入速度；所述follower partition根据所述leader partition的起始偏移量和leader partition的数据平均写入速度，计算得到所述目标偏移量。5.如权利要求3或4所述的方法，其特征在于，在所述leader partition的数据平均写入速度大于所述leader partition的数据同步传输速度时，所述目标偏移量为当前时刻所述leader partition的最大的偏移量；在所述leader partition的数据平均写入速度小于或等于所述数据同步传输速度时，所述目标偏移量为所述leader partition的起始偏移量。6.如权利要求3或4所述的方法，其特征在于，在所述leader partition的数据平均写入速度大于所述leader partition的数据同步传输速度时，所述目标偏移量为当前时刻所述leader partition的最大的偏移量；在所述leader partition的数据平均写入速度小于或等于所述数据同步传输速度、并且所述leader partition的当前数据总量所需要的同步时间小于预设时长时，所述目标偏移量为所述leader partition的起始偏移量。7.如权利要求1或2所述的方法，其特征在于，所述偏移量选取策略为基于数据价值的选取策略，所述follower partition基于所述偏移量选取策略确定在待同步的topic的leader partition中的偏移量，包括：
所述follower partition获取多个消费者组的消费偏移量，所述follower partition确定最小的所述消费偏移量为所述目标偏移量；其中，所述消费者组用于消费所述...

【专利技术属性】
技术研发人员：汝佳，赵东，智伟，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人