【技术实现步骤摘要】
一种数据同步的方法及相关设备
[0001]本专利技术涉及信息
,尤其涉及一种数据同步的方法及相关设备。
技术介绍
[0002]分布式发布订阅消息系统(kafka)具备良好的功能特性,它通过磁盘结构提供消息的持久化,可以保持长时间的稳定性能,具备高吞吐量,能够支持每秒数百万的消息,而且可以支持并行数据加载,所以kafka一般用于处理应用服务系统或人工智能(artificial intellingence,AI)平台产生的海量流数据。
[0003]Kafka作为当前最常用的分布式消息队列系统,通常会缓存消息数据在本地磁盘上,kafka中发布订阅的对象是类别(topic),每个topic表示一类数据,一个topic又分为多个分区(partition),每个partition就是一个有序的队列。每个topic的不同partition分布在不同的磁盘或主机上,同时,kafka为了保证可靠性,每个partition又存在多个副本(replica),多个副本之间会选举出一个主副本,主副本又可以称为领导者分区(leader partition),其余的副本为从副本,又可以称为跟随者分区(follower partition)。Follower partition会持续的从leader partition同步最新的消息数据,消费者(从topic订阅消息的客户端)和生产者(向topic发布消息的客户端)在进行消费和生产时,直接和leader partition进行交互。当某个leader partition所在的节点突然发 ...
【技术保护点】
【技术特征摘要】
1.一种数据同步的方法,其特征在于,所述方法包括:跟随者分区follower partition获取偏移量选取策略;所述follower partition基于所述偏移量选取策略确定在待同步的话题topic的领导者分区leader partition中的目标偏移量;所述follower partition从所述leader partition的确定的目标偏移量开始同步所述leader partition中的数据到所述follower partition。2.如权利要求1所述的方法,其特征在于,所述方法还包括:所述follower partition向所述leader partition发送查询请求,所述查询请求用于查询当前时刻所述leader partition中的偏移量;所述follower partition计算所述当前时刻所述leader partition中的偏移量与所述follower partition中的偏移量的差值,并在所述差值大于预设阈值时确定同步所述leader partition中的数据到所述follower partition。3.如权利要求1或2所述的方法,其特征在于,所述偏移量选取策略为偏移量自适应确定策略,所述follower partition基于所述偏移量选取策略确定在待同步的topic的leader partition中的偏移量,包括:所述follower partition获取所述leader partition的数据平均写入速度;所述follower partition根据所述leader partition的数据平均写入速度,计算得到所述目标偏移量。4.如权利要求1或2所述的方法,其特征在于,所述偏移量选取策略为偏移量自适应确定策略,所述follower partition基于所述偏移量选取策略确定在待同步的topic的leader partition中的偏移量,包括:所述follower partition获取所述leader partition的起始偏移量和所述leader partition的数据平均写入速度;所述follower partition根据所述leader partition的起始偏移量和leader partition的数据平均写入速度,计算得到所述目标偏移量。5.如权利要求3或4所述的方法,其特征在于,在所述leader partition的数据平均写入速度大于所述leader partition的数据同步传输速度时,所述目标偏移量为当前时刻所述leader partition的最大的偏移量;在所述leader partition的数据平均写入速度小于或等于所述数据同步传输速度时,所述目标偏移量为所述leader partition的起始偏移量。6.如权利要求3或4所述的方法,其特征在于,在所述leader partition的数据平均写入速度大于所述leader partition的数据同步传输速度时,所述目标偏移量为当前时刻所述leader partition的最大的偏移量;在所述leader partition的数据平均写入速度小于或等于所述数据同步传输速度、并且所述leader partition的当前数据总量所需要的同步时间小于预设时长时,所述目标偏移量为所述leader partition的起始偏移量。7.如权利要求1或2所述的方法,其特征在于,所述偏移量选取策略为基于数据价值的选取策略,所述follower partition基于所述偏移量选取策略确定在待同步的topic的leader partition中的偏移量,包括:
所述follower partition获取多个消费者组的消费偏移量,所述follower partition确定最小的所述消费偏移量为所述目标偏移量;其中,所述消费者组用于消费所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。