关系图谱的更新方法、装置、介质、设备及生成方法制造方法及图纸

技术编号:33044736 阅读:14 留言:0更新日期:2022-04-15 09:27
本公开涉及一种关系图谱的更新方法、装置、介质、设备及生成方法,该方法包括:监听初始数据库的变更日志,当变更日志中新写入初始数据库的数据变更信息时,将数据变更信息形成消息并发布到消息队列,监听消息队列以获取新增消息,当新增消息中包含的数据变更类型为修改型、插入型或删除型时,确定新增消息中所包含的第一数据主键,基于第一数据主键确定关系图谱中的第一位置,删除第一位置所存储的图谱数据,基于第一数据主键确定初始数据库中的第二位置,将第二位置存储的数据导入到关系图谱中的第一位置,以更新关系图谱。避免了基于更新消息更新关系图谱导致乱序和数据错乱问题,使关系图谱能够基于初始数据库中的变更数据,进行准确的更新。进行准确的更新。进行准确的更新。

【技术实现步骤摘要】
关系图谱的更新方法、装置、介质、设备及生成方法


[0001]本公开涉及数据处理领域,具体地,涉及一种关系图谱的更新方法、装置、介质、设备及生成方法。

技术介绍

[0002]现有的关系型数据库中,都是通过表格来记录各个公司、老板、员工、法人以及各个实体之间的连接关系,在进行数据查询时,需要先从数据库中找到查询实体对应的所有表格,再根据对应的表格手动获取各个实体之间的对应关系生成关系图谱。由于数据库中的数据容量较大且相关数据内容容易发生变动,当数据库中的数据进产生变更时,对应关系图谱中的相关数据会根据更新消息进行数据更新,但由于更新消息在传递过程中容易出现乱序的情况,导致更新后的关系图谱中相关数据发生错乱,从而无法准确更新关系图谱。

技术实现思路

[0003]本公开的目的是提供一种关系图谱的更新方法、装置、介质、设备及一种关系图谱的生成方法,以解决现有技术中基于更新消息更新关系图谱,导致数据发送错乱,无法准确更新关系图谱的技术问题。
[0004]根据本公开实施例的第一方面,提供一种关系图谱的更新方法,包括:
[0005]监听初始数据库的变更日志,当所述变更日志中新写入所述初始数据库的数据变更信息时,将所述数据变更信息形成消息并发布到消息队列;
[0006]监听所述消息队列以获取新增消息,当所述新增消息中包含的数据变更类型为修改型、插入型或删除型时,确定所述新增消息中所包含的第一数据主键;
[0007]基于所述第一数据主键确定关系图谱中的第一位置,删除所述第一位置所存储的图谱数据;
[0008]基于所述第一数据主键确定所述初始数据库中的第二位置,将所述第二位置存储的数据导入到所述关系图谱中的所述第一位置,以更新所述关系图谱。
[0009]可选地,所述监听初始数据库的变更日志,当所述变更日志中新写入所述初始数据库的数据变更信息时,将所述数据变更信息形成消息并发布到消息队列,包括:
[0010]监听初始数据库的变更日志,当所述变更日志中存在新写入内容时,解析所述新写入内容;
[0011]当解析出所述新写入内容为所述初始数据库的数据变更信息时,将所述数据变更信息中的所述第一数据主键,以及所述第一数据主键对应的数据内容形成消息,发布到消息队列。
[0012]可选地,所述关系图谱为工商关系图谱,所述方法还包括:
[0013]获取所述初始数据库中的待导入数据,所述待导入数据包括节点数据和关系数据;其中,所述节点数据包括对应于公司实体的节点数据和对应于人员实体的节点数据;所述关系数据包括所述节点数据之间的法人关系数据,投资关系数据和/或母公司关系数据;
[0014]根据所述节点数据和所述关系数据,生成所述关系图谱。
[0015]可选地,所述方法还包括:
[0016]批量获取差异数据的第二数据主键,将所第二数据主键写入差异列表中;
[0017]遍历所述差异列表,针对所述差异列表中的任一第二数据主键,删除第二数据主键所对应节点在所述关系图谱中的所有工商关系;
[0018]基于所述第二数据主键在所述初始数据库中查询对应的法人记录,若存在法人记录,则在所述关系图谱中新增所述节点对应的法人关系;
[0019]基于所述第二数据主键在所述初始数据库中查询对应的投资记录,若存在投资记录,则在所述关系图谱中新增所述节点对应的投资关系;
[0020]基于所述第二数据主键在所述初始数据库中查询对应的母公司记录,若存在母公司记录,则在所述关系图谱中新增所述节点对应的母公司关系。
[0021]可选地,所述批量获取差异数据的第二数据主键,包括:
[0022]确定所述初始数据库、所述消息队列或者所述关系图谱的出错时间段;
[0023]在所述变更日志中,确定所述出错时间段内记录的变更内容,从所述记录的变更内容中批量获取差异数据的所述第二数据主键。
[0024]根据本实施例的第二方面,提供一种关系图谱的生成方法,包括:
[0025]获取第一待查节点和第二待查节点;
[0026]基于根据上述任一项所述更新方法获得的关系图谱,生成从所述第一待查节点到所述第二待查节点的全量关系图谱,所述全量关系图谱中包括从所述第一待查节点到所述第二待查节点的所有路径;
[0027]基于所述全量关系图谱,确定从所述第一待查节点到所述第二待查节点的最短路径;
[0028]基于所述最短路径生成对应的目标关系图谱。
[0029]根据本实施例的第三方面,提供一种关系图谱的更新装置,包括:
[0030]发布模块,用于监听初始数据库的变更日志,当所述变更日志中新写入所述初始数据库的数据变更信息时,将所述数据变更信息形成消息并发布到消息队列;
[0031]第一确定模块,用于监听所述消息队列以获取新增消息,当所述新增消息中包含的数据变更类型为修改型、插入型或删除型时,确定所述新增消息中所包含的数据主键;
[0032]删除模块,用于基于所述数据主键确定关系图谱中的第一位置,删除所述第一位置所存储的图谱数据;
[0033]更新模块,用于基于所述数据主键确定所述初始数据库中的第二位置,将所述第二位置存储的数据导入到所述关系图谱中的所述第一位置,以更新所述关系图谱。
[0034]根据本实施例的第四方面,提供一种关系图谱的生成装置,包括:
[0035]获取模块,用于获取第一待查节点和第二待查节点;
[0036]第一生成模块,用于基于根据上述任一项所述更新方法获得的关系图谱,获取从所述第一待查节点到所述第二待查节点的全量关系图谱,所述全量关系图谱中包括从所述第一待查节点到所述第二待查节点的所有路径;
[0037]第二确定模块,用于基于所述全量关系图谱,确定从所述第一待查节点到所述第二待查节点的最短路径;
[0038]第二生成模块,用于基于所述最短路径生成对应的目标关系图谱。
[0039]根据本实施例的第五方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一项所述方法的步骤。
[0040]根据本实施例的第六方面,提供一种电子设备,包括:
[0041]存储器,其上存储有计算机程序;
[0042]处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面中任一项所述方法的步骤。
[0043]通过上述技术方案,监听初始数据库的变更日志,当变更日志中新写入初始数据库的数据变更信息时,将数据变更信息形成消息并发布到消息队列,监听消息队列以获取新增消息,当新增消息中包含的数据变更类型为修改型、插入型或删除型时,确定新增消息中所包含的第一数据主键,基于第一数据主键确定关系图谱中的第一位置,删除第一位置所存储的图谱数据,基于第一数据主键确定初始数据库中的第二位置,将第二位置存储的数据导入到关系图谱中的第一位置,以更新关系图谱。从而先根据第一数据主键删除关系图谱中对应位置的图谱数据,再根据第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关系图谱的更新方法,其特征在于,包括:监听初始数据库的变更日志,当所述变更日志中新写入所述初始数据库的数据变更信息时,将所述数据变更信息形成消息并发布到消息队列;监听所述消息队列以获取新增消息,当所述新增消息中包含的数据变更类型为修改型、插入型或删除型时,确定所述新增消息中所包含的第一数据主键;基于所述第一数据主键确定关系图谱中的第一位置,删除所述第一位置所存储的图谱数据;基于所述第一数据主键确定所述初始数据库中的第二位置,将所述第二位置存储的数据导入到所述关系图谱中的所述第一位置,以更新所述关系图谱。2.根据权利要求1所述的更新方法,其特征在于,所述监听初始数据库的变更日志,当所述变更日志中新写入所述初始数据库的数据变更信息时,将所述数据变更信息形成消息并发布到消息队列,包括:监听初始数据库的变更日志,当所述变更日志中存在新写入内容时,解析所述新写入内容;当解析出所述新写入内容为所述初始数据库的数据变更信息时,将所述数据变更信息中的所述第一数据主键,以及所述第一数据主键对应的数据内容形成消息,发布到所述消息队列。3.根据权利要求1所述的更新方法,其特征在于,所述关系图谱为工商关系图谱,所述方法还包括:获取所述初始数据库中的待导入数据,所述待导入数据包括节点数据和关系数据;其中,所述节点数据包括对应于公司实体的节点数据和对应于人员实体的节点数据;所述关系数据包括所述节点数据之间的法人关系数据,投资关系数据和/或母公司关系数据;根据所述节点数据和所述关系数据,生成所述关系图谱。4.根据权利要求3所述的更新方法,其特征在于,所述方法还包括:批量获取差异数据的第二数据主键,将所第二数据主键写入差异列表中;遍历所述差异列表,针对所述差异列表中的任一第二数据主键,删除第二数据主键所对应节点在所述关系图谱中的所有工商关系;基于所述第二数据主键在所述初始数据库中查询对应的法人记录,若存在法人记录,则在所述关系图谱中新增所述节点对应的法人关系;基于所述第二数据主键在所述初始数据库中查询对应的投资记录,若存在投资记录,则在所述关系图谱中新增所述节点对应的投资关系;基于所述第二数据主键在所述初始数据库中查询对应的母公司记录,若存在母公司记录,则在所述关系图谱中新增所述节点对应的母公司关系。5.根据权利要求4所述的更新方法,其特征在于,所述批量获取差异数据的第二数据主...

【专利技术属性】
技术研发人员:樊佩生曲悠杨李刚
申请(专利权)人:北京金堤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1