知识图谱构建方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38947276 阅读:20 留言:0更新日期:2023-09-25 09:43
本申请涉及一种知识图谱构建方法、装置、计算机设备和存储介质。属于人工智能技术领域,所述方法包括:根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系,根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,可自动实现对知识图谱的构建,不仅构建效率更高,而且构建得到的知识图谱的更加准确。而且构建得到的知识图谱的更加准确。而且构建得到的知识图谱的更加准确。

【技术实现步骤摘要】
知识图谱构建方法、装置、计算机设备和存储介质


[0001]本申请涉及人工智能
,特别是涉及一种知识图谱构建方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着信息化的飞速发展,各行业均存在不同量级的历史数据沉淀。利用现有数据资源,将累积数据转化为高质量的知识库成为提升竞争力的重要手段。知识图谱以图数据结构的形式描述实体对象及其相互关系,能够直观地呈现真实世界里的复杂实体关系。基于知识图谱的方法能够有效利用数据之间的联系,提升数据利用水平,目前已经在金融、电商等垂直领域得到广泛的落地应用。
[0003]目前针对结构化数据在构建知识图谱时,需要人工确定筛选各数据表,获取数据表中的实体数据,再基于实体数据间的关系,人工构建知识图谱,不仅效率低,而且构建得到的知识图谱准确性较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种可自动且准确的构建知识图谱构建方法、装置、计算机设备和存储介质。
[0005]第一方面,本申请提供了一种知识图谱构建方法。该方法包括:
[0006]根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
[0007]根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
[0008]根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
[0009]根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
[0010]在其中一个实施例中,根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,包括:
[0011]根据各数据表的表内容,确定各数据表的候选关键字段;
[0012]从各数据表的候选关键字段中,确定各数据表的主键实体;
[0013]将各数据表的候选关键字段中除主键实体外的其他各候选关键字段作为各数据表的属性实体。
[0014]在其中一个实施例中,根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系,包括:
[0015]针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表;
[0016]若存在,则确定该数据表的主键实体与关联数据表的主键实体之间具有关联关
系。
[0017]在其中一个实施例中,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
[0018]根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表;
[0019]根据实体关系数据表,构建知识图谱。
[0020]在其中一个实施例中,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,包括:
[0021]根据各数据表对应的主键实体和属性实体,创建实体数据表;
[0022]根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建关系数据表;
[0023]根据实体数据表和关系数据表,创建实体关系数据表。
[0024]在其中一个实施例中,关联信息包括关系类型、关系名称、关系属性和关联实体。
[0025]在其中一个实施例中,根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:
[0026]根据各数据表对应的主键实体和属性实体,确定知识图谱节点的节点名称和节点属性;
[0027]根据各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,确定知识图谱节点之间的拓扑关系和关系信息;
[0028]根据知识图谱节点的节点名称和节点属性和知识图谱节点之间的拓扑关系和关系信息,构建知识图谱。
[0029]第二方面,本申请还提供了一种知识图谱构建装置。该装置包括:
[0030]第一确定模块,用于根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
[0031]第二确定模块,用于根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
[0032]第三确定模块,用于根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
[0033]构建模块,用于根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
[0034]第三方面,本申请还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
[0035]根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
[0036]根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
[0037]根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关
联关系的主键实体之间的关系信息;
[0038]根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
[0039]第四方面,本申请还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
[0040]根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
[0041]根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联关系;
[0042]根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;
[0043]根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。
[0044]第五方面,本申请还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0045]根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;
[0046]根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的属性实体之间的关系,确定各数据表的主键实体之间的关联本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,所述方法包括:根据各数据表的表内容,确定各数据表对应的主键实体和属性实体;根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的所述属性实体之间的关系,确定各数据表的主键实体之间的关联关系;根据具有关联关系的主键实体对应的数据表的主键实体和属性实体,确定具有关联关系的主键实体之间的关系信息;根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱。2.根据权利要求1所述的方法,其特征在于,所述根据各数据表的表内容,确定各数据表对应的主键实体和属性实体,包括:根据各数据表的表内容,确定各数据表的候选关键字段;从各数据表的所述候选关键字段中,确定各数据表的主键实体;将各数据表的候选关键字段中除所述主键实体外的其他各候选关键字段作为各数据表的属性实体。3.根据权利要求1所述的方法,其特征在于,所述根据每一数据表的主键实体与各数据表中除该数据表之外的其他各数据表的所述属性实体之间的关系,确定各数据表的主键实体之间的关联关系,包括:针对每一数据表,判断其他各数据表中是否存在属性实体与该数据表的主键实体一致的关联数据表;若存在,则确定该数据表的主键实体与所述关联数据表的主键实体之间具有关联关系。4.根据权利要求1所述的方法,其特征在于,所述根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,构建知识图谱,包括:根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表;根据实体关系数据表,构建知识图谱。5.根据权利要求4所述的方法,其特征在于,所述根据各数据表对应的主键实体、属性实体、各数据表的主键实体之间的关联关系,以及具有关联关系的主键实体之间的关系信息,创建实体关系数据表,包括:根据各数据表对应的主键实体和属性实体,创建实体数据表;根据各数据表的主键实体之间...

【专利技术属性】
技术研发人员:李敏汪美玲
申请(专利权)人:工银科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1