【技术实现步骤摘要】
数据同步方法、装置及设备
[0001]本申请实施例涉及大数据
,尤其涉及一种数据同步方法、装置及设备。
技术介绍
[0002]大数据(big data)为所涉及的数据量规模巨大到无法通过目前常用工具,在合理时间内对数据进行处理并且能够生成帮助企业经营决策的资讯。
[0003]企业的各业务系统在进行数据查询或者数据处理时,可以在数据库中获取历史时段内业务交易的相关数据。为了企业的各业务系统可以正常进行数据查询或者数据处理,企业可以在不同机房分别设置主数据库和从数据库(主数据库和从数据库存储有与企业相关的所有业务数据),以使主数据库存在异常情况时,企业的各业务系统可以在从数据库中获取数据。
[0004]但在实际使用过程中,业务数据只会实时同步并存储至主数据库,若主数据库存在异常情况,在各业务系统在从数据库中获取数据时,可能存在获取不到数据或者获取错误数据的情况,导致数据获取的可靠性较低。
技术实现思路
[0005]本申请实施例提供一种数据同步方法、装置及设备,用以解决数据获取的可靠性较低的问题。
[0006]第一方面,本申请实施例提供一种数据同步方法,包括:
[0007]获取数据同步请求,所述数据同步请求包括相同类型的多个业务数据对应的标识;
[0008]在第一缓存区中获取所述数据同步请求对应的第一数据集,以及在第二缓存区中获取所述数据同步请求对应的第二数据集,所述第一缓存区用于存储第一数据库中的多个业务数据,所述第二缓存区用于存储第二数据库中的多个业务数据; ...
【技术保护点】
【技术特征摘要】
1.一种数据同步方法,其特征在于,包括:获取数据同步请求,所述数据同步请求包括相同类型的多个业务数据对应的标识;在第一缓存区中获取所述数据同步请求对应的第一数据集,以及在第二缓存区中获取所述数据同步请求对应的第二数据集,所述第一缓存区用于存储第一数据库中的多个业务数据,所述第二缓存区用于存储第二数据库中的多个业务数据;确定所述第一数据集和所述第二数据集之间的目标相似度;根据所述目标相似度,对所述第一数据集和所述第二数据集中的业务数据进行同步处理。2.根据权利要求1所述的方法,其特征在于,确定所述第一数据集和所述第二数据集之间的目标相似度,包括:判断所述第一数据集的数据个数与所述第二数据集的数据个数是否相同;若是,则在所述第二数据集中,确定每个第一业务数据对应的第二业务数据,并确定每个第一业务数据与所述第二业务数据之间的第一相似度,得到多个第一相似度,并根据所述多个第一相似度,确定所述第一数据集和所述第二数据集之间的目标相似度;若否,则在所述第二数据集合中,确定至少一个第一业务数据对应的第二业务数据,根据所述每个第一数据与所述第二业务数据之间的第一相似度、第三业务数据和第四业务数据,确定所述第一数据集和所述第二数据集之间的目标相似度;其中,所述第三业务数据为所述第一数据集中、除所述至少一个第一业务数据之外的业务数据;所述第四业务数据为所述第二数据集中、除所述第二业务数据之外的业务数据。3.根据权利要求2所述的方法,其特征在于,针对任意一个第一业务数据;确定所述第一业务数据与对应的第二业务数据之间的第一相似度,包括:获取所述第一业务数据对应的多个第一字段,以及所述第二业务数据对应的多个第二字段;确定每个第一字段、以及所述第一字段对应的第二字段之间的匹配结果,所述匹配结果为相同或者不同;根据每个第一字段、以及所述第一字段对应的第二字段之间的匹配结果,确定所述第一业务数据与所述第二业务数据之间的第一相似度。4.根据权利要求3所述的方法,其特征在于,根据每个第一字段和所述第一字段对应的第二字段之间的匹配结果,确定所述第一数据与所述第二业务数据之间的第一相似度,包括:若多个匹配结果分别为相同,则确定所述第一业务数据与所述第二业务数据之间的第一相似度为预设相似度;若所述多个匹配结果中存在所述匹配结果为不同,则获取所述匹配结果为相同的第一数量,根据所述第一数量和第二数量,确定所述第一业务数据与所述第二业务数据之间的第一相似度为预设相似度,所述第二数量为将所述第一字段和所述第二字段中字段数量的最大值。5.根据权利要求2
‑
4任一项所述的方法,其特征在于,根据所述多个第一相似度,确定所述第一数据集和所述第二数据集之间的目标相似度,包括:将所述多个第一相似度之和与所述第一数据集的数据个数的比值,确定为所述第一数
据集和所述第二数据集之间的目标相似度。6.根...
【专利技术属性】
技术研发人员:李帅,杜思佳,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。