知识图谱的实体建边方法、装置、设备及介质制造方法及图纸

技术编号:38589985 阅读:8 留言:0更新日期:2023-08-26 23:30
本申请公开了一种知识图谱的实体建边方法、装置、设备及介质,属于人工智能领域。该方法包括:获取第一实体的目标二元关系,目标二元关系包括第一实体、目标属性和第二实体,第二实体是第一实体在目标属性的一个属性值;基于目标属性,在知识图谱中确定与第二实体对应的第二实体节点;在知识图谱中,将与第一实体对应的第一实体节点与第二实体节点进行建边。上述方案克服了当知识图谱的数据来自不同数据外源时可能导致的无法抓取跳转链接问题,进而提高了知识图谱的导通率。而提高了知识图谱的导通率。而提高了知识图谱的导通率。

【技术实现步骤摘要】
知识图谱的实体建边方法、装置、设备及介质


[0001]本申请涉及人工智能领域,特别涉及一种知识图谱的实体建边方法、装置、设备及介质。

技术介绍

[0002]知识图谱的基本单元由两个实体节点和两个实体节点间的连边构成,如何在两个实体节点之间建边是构建知识图谱十分重要的步骤。
[0003]相关技术中,知识图谱的数据来自于同一个数据外源,比如,知识图谱中“张三”的知识子图谱和“李四”的知识子图谱均来自于百度百科提供的数据,在百度百科“张三”的知识图谱卡片上存在跳转至“李四”的知识图谱卡片的链接,因此,可以通过爬虫抓取该链接关系,即可在知识图谱中将“张三”的实体节点与“李四”的实体节点进行建边。
[0004]然而,若知识图谱的数据来自于多个数据外源,则可能无法抓取到需要建边的实体节点之间的链接关系,显然实体建边就无法完成。

技术实现思路

[0005]本申请提供了一种知识图谱的实体建边方法、装置、设备及介质,能够提高知识图谱的导通率。所述技术方案如下:
[0006]根据本申请的一个方面,提供了一种知识图谱的实体建边方法,所述方法包括:
[0007]获取第一实体的目标二元关系,目标二元关系包括第一实体、目标属性和第二实体,第二实体是第一实体在目标属性的一个属性值;
[0008]基于目标属性,在知识图谱中确定与第二实体对应的第二实体节点;
[0009]在知识图谱中,将与第一实体对应的第一实体节点与第二实体节点进行建边。
[0010]根据本申请的另一方面,提供了一种知识图谱的实体建边装置,该装置包括:
[0011]获取模块,用于获取第一实体的目标二元关系,目标二元关系包括第一实体、目标属性和第二实体,第二实体是第一实体在目标属性的一个属性值;
[0012]确定模块,用于基于目标属性,在知识图谱中确定与第二实体对应的第二实体节点;
[0013]建边模块,用于在知识图谱中,将与第一实体对应的第一实体节点与第二实体节点进行建边。
[0014]根据本申请的一个方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如上所述的知识图谱的实体建边方法。
[0015]根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序由处理器加载并执行以实现如上所述的知识图谱的实体建边方法。
[0016]根据本申请的另一个方面,提供了一种计算机程序产品或计算机程序,该计算机
程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述知识图谱的实体建边方法。
[0017]本申请实施例提供的技术方案带来的有益效果至少包括:
[0018]基于目标属性确定与第二实体对应的第二实体节点,克服了当知识图谱的数据来自不同数据外源时可能导致的无法抓取跳转链接问题,进而提高了知识图谱的导通率。
附图说明
[0019]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本申请一个示例性实施例提供的知识图谱的完整构建流程的示意图;
[0021]图2是本申请一个示例性实施例提供的计算机系统的示意图;
[0022]图3是本申请一个示例性实施例提供的知识图谱的实体建边方法的流程图;
[0023]图4是本申请另一个示例性实施例提供的知识图谱的实体建边方法的流程图;
[0024]图5是本申请另一个示例性实施例提供的知识图谱的实体建边方法的流程图;
[0025]图6是本申请一个示例性实施例提供的知识图谱的实体建边装置的结构框图;
[0026]图7是本申请一个示例性实施例提供的计算机设备的结构框图。
具体实施方式
[0027]为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
[0028]首先,对本申请实施例中涉及的名词进行简单介绍:
[0029]知识图谱:是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系。知识图谱中的基本单元可以认为是一个SPO(Subject

Predicate

Object,实体1

谓词

实体2)三元组,一个SPO即为一个二元关系,比如,三元组(张三

妻子

李四)。在SPO三元组中的谓词也可称为属性,实体2即可认为是该属性的一个属性值。值得说明的是,在本申请的所有实施例中,属性的属性值均为实体类型,因为在知识图谱中仅有实体类型的属性值需要进行实体建边。
[0030]实体建边:是指对于抽取得到的实体,将其链接到知识库中对应的正确实体的操作,也即在知识图谱中确定与抽取得到的实体2对应的实体节点2,将实体节点1与实体节点2进行建边。其基本思想是首先根据给定的实体2,从知识库中选出一组候选实体节点,然后通过实体确定方式将实体2链接到正确的实体节点2中。
[0031]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0032]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0033]在本申请的相关技术中,实体建边的方法包括以下四种:
[0034]第一种实体建边方式,知识图谱的数据来自于同一个数据外源。第一种实体建边方式在上述
技术介绍
已详细介绍,此处不再展开论述。
[0035]第二种实体建边方式,通过推理规则进行建边,比如,在“张三”的知识子图谱中存在二元关系“张三

父亲

张四”,在“张二”的知识子图谱中存在二元关系“张二

爷爷

张四”,即可推理知悉张二是张三的儿子或女儿,在知识图谱中将“张三”实体节点与“张二”实体节点进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱的实体建边方法,其特征在于,所述方法包括:获取第一实体的目标二元关系,所述目标二元关系包括第一实体、目标属性和第二实体,所述第二实体是所述第一实体在所述目标属性的一个属性值;基于所述目标属性,在所述知识图谱中确定与所述第二实体对应的第二实体节点;在所述知识图谱中,将与所述第一实体对应的第一实体节点与所述第二实体节点进行建边。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标属性,在所述知识图谱中确定与所述第二实体对应的第二实体节点,包括:在所述目标属性属于至少两个属性集合中的目标属性集合的情况下,通过与所述目标属性集合对应的实体确定方式在所述知识图谱中确定与所述第二实体对应的第二实体节点;其中,所述至少两个属性集合对应的实体确定方式不同。3.根据权利要求2所述的方法,其特征在于,所述在所述目标属性属于至少两个属性集合中的目标属性集合的情况下,通过与所述目标属性集合对应的实体确定方式在所述知识图谱中确定与所述第二实体对应的第二实体节点,包括如下步骤中的至少一个:基于所述目标属性属于第一预设属性集合,通过先验词典在所述知识图谱中确定与所述第二实体对应的第二实体节点;基于所述目标属性属于第二预设属性集合,通过第一策略在所述知识图谱中确定与所述第二实体对应的第二实体节点;基于所述目标属性属于第三预设属性集合,通过第二策略在所述知识图谱中确定与所述第二实体对应的第二实体节点;其中,所述先验词典对应的计算资源消耗量小于所述第一策略对应的计算资源消耗量,所述第一策略对应的计算资源消耗量小于所述第二策略对应的计算资源消耗量。4.根据权利要求3所述的方法,其特征在于,所述通过先验词典在所述知识图谱中确定指示所述第二实体的第二实体节点,包括:通过所述先验词典确定与所述第二实体的名称相同的候选实体节点为第二实体节点;其中,所述先验词典包括所述目标属性和n个属性值之间的映射关系,n为正整数。5.根据权利要求3所述的方法,其特征在于,所述通过第一策略在所述知识图谱中确定与所述第二实体对应的第二实体节点,包括:在所述知识图谱中,获取与所述第二实体的名称对应的k个候选实体节点,k为正整数;通过第一打分方式确定所述k个候选实体节点的分数;在所述知识图谱中将所述分数达到第一分数阈值的候选实体节点,确定为所述第二实体节点。6.根据权利要求5所述的方法,其特征在于,所述通过第一打分方式确定所述k个候选实体节点的分数,包括:在所述k个候选实体节点存在第一候选实体节点的情况下,确定所述第一候选实体节点的分数为第一分数,所述第一候选实体节点与所述第二实体的名称相同;在所述k个候选实体节点存在第二候选实体节点的情况下,确定所述第二候选实体节点的分数为第二分数,所述第二候选实体节点与所述第二实体的名称不同;
其中,所述第一分数大于所述第二分数。7.根据权利要求5所述的方法,其特征在于,所述通过第一打分方式确定所述k个候选实体节点的分数,包括:在所述k个候选实体节点存在第三候选实体节点的情况下,确定所述第三候选实体节点的分数为第三分数,所述第三候选实体节点的二元关系的属性值与所述第一实体节点的二元关系的属性值匹配;在所述k个候选实体节点存在第四候选实体节点的情况下,确定所述第四候选实体节点的分数为第四分数,所述第四候选实体节点的二元关系的属性值与所述第一实体节点的二元关系的属性值不匹配;其中,所述第三分数大于所述第四分数,所述属性值匹配指示所述候选实体节点的对称二元关系的属性值与所述第一实体节点的名称相同,或,所述候选实体节点的其他二元关系的属性值与所述第一实体节点的其他二元关系的属性值相同;所述对称二元关系与所述目标二元关系指示同一事实,所述其他二元关系是除所述目标二元关系和所述对称二元关系之外的任意一个二元关系。8.根据权利要求5所述的方法,其特征在于,所述通过第一打分方式确定所述k个候选实体节点的分数,包括:在所述k个候选实体节点存在第五候选实体节点的情况下,确定所述第五候选实体节点的分数为第五分数,所述第五候选实体节点的类别与所述第一实体节点的类别之间的关联程度达到第一关联阈值;在所述k个候选实体节点存在第六候选实体节点的情况下,确定所述第六候选实体节点的分数为第六分数,所述第六候选实体节点的类别与所述第一实体节点的类别之间的关联程度未达到第一关联阈值;其中,所述第五分数大于所述第六分数。9.根据权利要求3所述的方法,其特征在于,所述通过第二策略在所述知识图谱中确定与所述第二实体对应的第二实体节点,包括:在所述知识图谱中,获取与所述第二实体的名称对应的k个候选实体节点,k为正整数;通过第二打分方式确定所述...

【专利技术属性】
技术研发人员:沈卓方舟荆宁罗雨
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1