一种基于知识图谱的家族关系推理方法及系统技术方案

技术编号:32805751 阅读:9 留言:0更新日期:2022-03-26 19:58
一种基于知识图谱的家族关系推理方法及系统,方法包括:步骤1,基于知识图谱中的实体的家族关系,对所有实体进行分类,分别为实体两条出边、实体两条入边和实体一进一出两条边;步骤2,对于每一种分类的实体:通过聚合或关联操作,过滤出含有两条及以上家族关系连接的实体;步骤3,根据关系推理规则字典,计算获取组合关系推理的结果,并将三个分类的结果进行合并。本发明专利技术对知识图谱中连接人员实体的家族关系进行分类,通过一系列逻辑转换,得到目标结果集合,再根据关系推理规则字典计算推理结果,准确率非常高。准确率非常高。准确率非常高。

【技术实现步骤摘要】
一种基于知识图谱的家族关系推理方法及系统


[0001]本专利技术涉及知识图谱分析、数据挖掘领域,具体涉及一种基于知识图谱 的家族关系推理方法及系统。

技术介绍

[0002]知识图谱上已经有了非常多的实体对和关系,但是由于家族关系数据的 更新迭代以及不完整性,注定了这部分数据的不完整,同样,它里面也隐藏 着我们难以轻易发现的信息。这时就需要持续的通过关系推理来不断完善家 族关系数据,以帮助我们发现这些隐藏的信息。
[0003]通常知识图谱家族关系推理实现方式有的是基于知识表达将人员实 体和家族关系映射到一个低维的embedding空间中,基于知识的语义表达进 行推理建模,这种建模方法着眼于实体间的直接关联关系,难以利用人们普 遍认知实现精确的逻辑推理。有的是基于深度学习将知识图谱中训练样本数 据集中的实体、关系分别做向量映射表示,生成训练负样本数据,再根据训 练样本和生成的训练负样本,将实体映射结果和关系映射结果分别带入训练 过程中定义的目标函数,经过优化得到向量表示,最后根据计算知识图谱三 元组中实体和关系之间的距离值进行关系推理,这种方式需要基于大量数据 进行模型训练调优,整个过程较为复杂,且准确率有限,对于有限关系类型 推理不够灵活。

技术实现思路

[0004]鉴于现有技术中存在的技术缺陷和技术弊端,本专利技术实施例提供克服上 述问题或者至少部分地解决上述问题的一种基于知识图谱的家族关系推理 方法及系统,具体方案如下:
[0005]作为本专利技术的第一方面,提供一种基于知识图谱的家族关系推理方法, 所述方法包括:
[0006]步骤1,基于知识图谱中的实体的家族关系,对所有实体进行分类,分 别为实体两条出边、实体两条入边和实体一进一出两条边;
[0007]步骤2,对于每一种分类的实体:通过聚合或关联操作,过滤出含有两 条及以上家族关系连接的实体;
[0008]步骤3,根据关系推理规则字典,计算获取组合关系推理的结果,并将 三个分类的结果进行合并。
[0009]其中,所述方法还包括:在进行聚合或关联操作前,将知识图谱的实体、 家族关系数据加载到图分布式内存计算框架。
[0010]其中,步骤1具体包括:
[0011]基于人类对家族关系的认知判断,即由某些特定两条边的家族关系可以 得到第三条边的家族关系,将知识图谱中连接实体的家族关系划分为三类, 分别是实体两条出边、实体两条入边和实体一进一出两条边。
[0012]其中,步骤3中,通过聚合或关联操作,过滤出含有两条及以上家族关 系连接的实体具体包括:对于实体两条出边分类,构建实体顶点id和出边信 息的二元组,通过聚合操作,再过滤出含有两条及以上家族关系出边的实体 二元组,得到对应的实体二元组集合;对于实体两条入边分类,构建实体顶 点id和入边信息的二元组,通过聚合操作,再过滤出含有两条及以上家族关 系入边的实体二元组,得到对应的实体二元组集合;对于实体一进一出两条 边分类,构建实体顶点id和出边信息的二元组,构建实体顶点id和入边信 息的二元组,将两个二元组集合进行join操作,得到含有一条家族关系入边 和一条家族关系出边的实体二元组,得到对应的实体二元组集合。
[0013]其中,所述方法还包括:步骤3还包括:对过滤出的实体的家族关系进 行组合,并加入需要判断唯一性的关系组合约束。
[0014]其中,对过滤出的实体的家族关系进行组合,并加入需要判断唯一性的 关系组合约束具体包括:对实体两条出边、实体两条入边以及实体一进一出 两条边的分类的实体二元组集合,对每个二元组中的家族关系边进行两两组 合,并加入需要判断唯一性的关系组合约束。
[0015]其中,步骤3具体包括:根据实体两条出边的关系推理规则字典,计算 实体两条出边分类的每个二元组中家族关系边两两组合关系推理的结果;根 据实体两条入边的关系推理规则字典,计算实体两条入边分类的每个二元组 中家族关系边两两组合关系推理的结果;根据实体一进一出两条边的关系推 理规则字典,计算实体一进一出两条边分类的每个二元组中家族关系边关系 推理的结果,最后将三个分类的结果集进行合并;
[0016]其中,关系推理规则字典是预置的一个规则集合,包括根据二元组中两 个已知的家族关系边,推导出第三个家族关系边。
[0017]作为本专利技术的第二方面,提供一种基于知识图谱的家族关系推理系统, 所述系统包括:分类单元、过滤单元和分析单元;
[0018]所述分类单元用于基于知识图谱中的实体的家族关系,对所有实体进行 分类,分别为实体两条出边、实体两条入边和实体一进一出两条边;
[0019]所述过滤单元用于对于每一种分类的实体:通过聚合或关联操作,过滤 出含有两条及以上家族关系连接的实体;
[0020]所述分析单元用于根据关系推理规则字典,计算获取组合关系推理的结 果,并将三个分类的结果进行合并。
[0021]进一步地,所述过滤单元具体用于:通过聚合或关联操作,过滤出含有 两条及以上家族关系连接的实体具体包括:对于实体两条出边分类,构建实 体顶点id和出边信息的二元组,通过聚合操作,再过滤出含有两条及以上家 族关系出边的实体二元组,得到对应的实体二元组集合;对于实体两条入边 分类,构建实体顶点id和入边信息的二元组,通过聚合操作,再过滤出含有 两条及以上家族关系入边的实体二元组,得到对应的实体二元组集合;对于 实体一进一出两条边分类,构建实体顶点id和出边信息的二元组,构建实体 顶点id和入边信息的二元组,将两个二元组集合进行join操作,得到含有 一条家族关系入边和一条家族关系出边的实体二元组,得到对应的实体二元 组集合。
[0022]进一步地,所述分析单元具体用于:根据实体两条出边的关系推理规则 字典,计算实体两条出边分类的每个二元组中家族关系边两两组合关系推理 的结果;根据实体两
条入边的关系推理规则字典,计算实体两条入边分类的 每个二元组中家族关系边两两组合关系推理的结果;根据实体一进一出两条 边的关系推理规则字典,计算实体一进一出两条边分类的每个二元组中家族 关系边关系推理的结果,最后将三个分类的结果集进行合并;
[0023]其中,关系推理规则字典是预置的一个规则集合,包括根据二元组中两 个已知的家族关系边,推导出第三个家族关系边。
[0024]本专利技术具有以下有益效果:
[0025]1.对知识图谱中连接人员实体的家族关系进行分类,通过一系列逻辑转 换,得到目标结果集合,再根据关系推理规则字典计算推理结果,准确率非 常高。
[0026]2.关系推理规则字典能准确计算推理结果,同时对有限关系类型扩展性 强,简洁灵活。
[0027]3.基于图分布式内存计算框架,能对接且快速导入多种图数据库中存储 的知识图谱数据并进行分析推理,更加稳定、高效。
附图说明
[0028]图1为本专利技术实施例提供的一种基于知识图谱的家族关系推理方法的流 程示意图。
[0029]图2为本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的家族关系推理方法,其特征在于,所述方法包括:步骤1,基于知识图谱中的实体的家族关系,对所有实体进行分类,分别为实体两条出边、实体两条入边和实体一进一出两条边;步骤2,对于每一种分类的实体:通过聚合或关联操作,过滤出含有两条及以上家族关系连接的实体;步骤3,根据关系推理规则字典,计算获取组合关系推理的结果,并将三个分类的结果进行合并。2.根据权利要求1所述的基于知识图谱的家族关系推理方法,其特征在于,所述方法还包括:在进行聚合或关联操作前,将知识图谱的实体、家族关系数据加载到图分布式内存计算框架。3.根据权利要求1所述的基于知识图谱的家族关系推理方法,其特征在于,步骤1具体包括:基于人类对家族关系的认知判断,即由某些特定两条边的家族关系可以得到第三条边的家族关系,将知识图谱中连接实体的家族关系划分为三类,分别是实体两条出边、实体两条入边和实体一进一出两条边。4.根据权利要求1所述的基于知识图谱的家族关系推理方法,其特征在于,步骤3中,通过聚合或关联操作,过滤出含有两条及以上家族关系连接的实体具体包括:对于实体两条出边分类,构建实体顶点id和出边信息的二元组,通过聚合操作,再过滤出含有两条及以上家族关系出边的实体二元组,得到对应的实体二元组集合;对于实体两条入边分类,构建实体顶点id和入边信息的二元组,通过聚合操作,再过滤出含有两条及以上家族关系入边的实体二元组,得到对应的实体二元组集合;对于实体一进一出两条边分类,构建实体顶点id和出边信息的二元组,构建实体顶点id和入边信息的二元组,将两个二元组集合进行join操作,得到含有一条家族关系入边和一条家族关系出边的实体二元组,得到对应的实体二元组集合。5.根据权利要求4所述的基于知识图谱的家族关系推理方法,所述方法还包括:步骤3还包括:对过滤出的实体的家族关系进行组合,并加入需要判断唯一性的关系组合约束。6.根据权利要求5所述的基于知识图谱的家族关系推理方法,其特征在于,对过滤出的实体的家族关系进行组合,并加入需要判断唯一性的关系组合约束具体包括:对实体两条出边、实体两条入边以及实体一进一出两条边的分类的实体二元组集合,对每个二元组中的家族关系边进行两两组合,并加入需要判断唯一性的关系组合约束。7.根据权利要求4所述的基于知识图谱的家族关系推理方法,其特征在于,步骤3具体包括:根据实体两条出边的关系推理规则字典,计算实体两条出边分类的每个...

【专利技术属性】
技术研发人员:李辰贺珊张龙涛杨光吕峰张宇
申请(专利权)人:武汉众智数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1