The invention provides a data synchronization method and device, which belongs to the field of network technology. Among them, the first server cluster can divide several virtual nodes and allocate corresponding amount of memory for each virtual node. Using each node in the multiple virtual nodes, the target data of each virtual node in the corresponding partition of the first server cluster can be loaded into the memory of the virtual node, thereby improving the efficiency of obtaining target data from the first server cluster. Multiple virtual nodes write the target data in memory into the corresponding partition of the preset data table, and then omit the operation of loading the target data by the second server cluster, further improve the efficiency of data synchronization, control the second server cluster to update the preset data table according to the target data, so that the next step can identify the preset data table to synchronize to the second one. The target data of server cluster can be processed normally.
【技术实现步骤摘要】
一种数据同步方法及装置
本专利技术属于网络
,特别是涉及一种数据同步方法及装置。
技术介绍
随着网络技术的不断发展,网络中产生的数据越来越多,为了便于对数据进行管理,这些数据往往会存储在服务器集群的文件系统中的不同分区中。由于数据中包含有大量有价值的信息,因此经常需要对数据进行分析,而在对数据进行分析之前,往往需要对数据进行同步,例如,将第一服务器集群上的数据同步到第二服务器集群上。现有技术中,在将第一服务器集群上的数据同步到第二服务器集群上时,通常是对第一服务器集群的各个分区依次进行扫描来获取需要同步的数据,然后将获取的需要同步的数据存储至第一服务器集群的某个磁盘中,在获取到所有需要进行同步的数据之后,再将这个磁盘中的数据拷贝至第二服务器集群的磁盘中,然后第二服务器集群再将这个磁盘中的数据分别加载到对应的分区中,整个操作过程较为繁琐,效率较低。
技术实现思路
本专利技术提供一种数据同步方法及装置,以便解决数据同步操作较为繁琐,效率较低的问题。依据本专利技术的第一方面,提供了一种数据同步方法,应用于第一服务器集群,该方法包括:根据预先定义的节点数及各个节点对应的内存量,将所述第一服务器集群的处理资源划分为多个虚拟节点并为每个虚拟节点分配对应量的内存;利用所述多个虚拟节点中的每个虚拟节点,将每个虚拟节点在所述第一服务器集群中对应的分区中的目标数据加载至所述虚拟节点的内存中;其中,每个虚拟节点对应至少一个分区;根据第二服务器集群的预设数据表,利用所述多个虚拟节点将所述内存中的目标数据写入所述预设数据表对应的分区中;所述预设数据表用于指示所述目标数据中的各部分 ...
【技术保护点】
1.一种数据同步方法,应用于第一服务器集群,其特征在于,所述方法包括:根据预先定义的节点数及各个节点对应的内存量,将所述第一服务器集群的处理资源划分为多个虚拟节点并为每个虚拟节点分配对应量的内存;利用所述多个虚拟节点中的每个虚拟节点,将每个虚拟节点在所述第一服务器集群中对应的分区中的目标数据加载至所述虚拟节点的内存中;其中,每个虚拟节点对应至少一个分区;根据第二服务器集群的预设数据表,利用所述多个虚拟节点将所述内存中的目标数据写入所述预设数据表对应的分区中;所述预设数据表用于指示所述目标数据中的各部分数据对应的分区;控制所述第二服务器集群根据所述目标数据对所述预设数据表进行更新。
【技术特征摘要】
1.一种数据同步方法,应用于第一服务器集群,其特征在于,所述方法包括:根据预先定义的节点数及各个节点对应的内存量,将所述第一服务器集群的处理资源划分为多个虚拟节点并为每个虚拟节点分配对应量的内存;利用所述多个虚拟节点中的每个虚拟节点,将每个虚拟节点在所述第一服务器集群中对应的分区中的目标数据加载至所述虚拟节点的内存中;其中,每个虚拟节点对应至少一个分区;根据第二服务器集群的预设数据表,利用所述多个虚拟节点将所述内存中的目标数据写入所述预设数据表对应的分区中;所述预设数据表用于指示所述目标数据中的各部分数据对应的分区;控制所述第二服务器集群根据所述目标数据对所述预设数据表进行更新。2.根据权利要求1所述的方法,其特征在于,所述根据第二服务器集群的预设数据表,利用所述多个虚拟节点将所述内存中的目标数据写入所述预设数据表对应的分区中,包括:对于每个虚拟节点,在所述虚拟节点对应的内存的占用率大于预设占用率阈值时,调用所述第二服务器集群的文件系统接口;通过所述文件系统接口,将所述目标数据以列式存储格式写入所述第二服务器集群中所述预设数据表对应的分区中;释放所述虚拟节点对应的内存。3.根据权利要求1所述的方法,其特征在于,所述利用所述多个虚拟节点将所述内存中的目标数据写入所述预设数据表对应的分区中之前,所述方法还包括:检测所述第二服务器集群中是否存在所述预设数据表;若所述第二服务器集群中不存在所述预设数据表,则在所述第二服务器集群中建立所述预设数据表。4.根据权利要求1所述的方法,其特征在于,所述控制所述第二服务器集群根据所述目标数据对所述预设数据表进行更新,包括:向所述第二服务器集群发送修复命令,以使所述第二服务器集群将所述目标数据的字段信息写入所述预设数据表的元信息中。5.根据权利要求3所述的方法,其特征在于,所述在所述第二服务器集群中建立所述预设数据表,包括:根据所述目标数据中的各部...
【专利技术属性】
技术研发人员:黄文仁,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。