【技术实现步骤摘要】
本公开涉及知识图谱,尤其涉及一种基于对偶复数的知识图谱推理方法、装置、设备及介质。
技术介绍
1、知识图谱是一种以结构化的形式描述现实世界中的知识的图数据库,基本单位为三元组(头实体,关系,尾实体),每个三元组都对应一个对应的事实信息。知识图谱能够为海量信息的存储和表示提供便利,被广泛应用于信息检索、智能问答、推荐系统等领域。然而,在知识图谱的构建初期,由于知识抽取不完全以及实体关系的动态变化,导致构建的知识图谱中存在实体或关系的缺失,因此,如何对知识图谱进行合理地推理补全引起了人们的关注。
2、现有的知识图谱推理补全方法一般依赖于知识图谱嵌入(knowledge graphembedding,kge)技术,通过向量转换模型将知识图谱中的实体和关系转换为合适的向量表示,进而利用这些向量执行高效的推理补全任务,但在关系中包含非可交换组合关系时,大多数现有模型都无法对其进行有效的表示和区分,导致后续的任务处理难以有较好的表现,而quate、rotate3d、duale等模型采用三维空间来表示非可交换组合关系和其他关系,虽然提升了模型的表现力,却也导致了参数量大、运算效率低的问题。因此,如何在保证模型的表现力的前提下,降低知识图谱推理补全任务所使用的参数量并提高运算效率成为亟待解决的技术问题。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种基于对偶复数的知识图谱推理方法、装置、设备及介质。
2、本公开实施例的第一方面提供了一种基于对偶复数的知识图谱推理方
3、从待推理的知识图谱中提取样本三元组,所述样本三元组包括第一头实体、第一关系和第一尾实体;
4、对所述样本三元组进行负采样,得到负样本三元组,所述负样本三元组包括第二头实体、第二关系和第二尾实体;
5、将所述样本三元组和所述负样本三元组确定为训练数据输入至预先建立的向量转换模型,得到所述向量转换模型输出的所述样本三元组对应的第一头实体向量、第一关系向量和第一尾实体向量,以及所述负样本三元组对应的第二头实体向量、第二关系向量和第二尾实体向量,所述向量转换模型用于将实体和关系嵌入至对偶复数空间;
6、基于所述第一头实体向量、所述第一关系向量、所述第一尾实体向量、所述第二头实体向量、所述第二关系向量和所述第二尾实体向量构建损失函数,并基于所述损失函数对所述向量转换模型进行训练,以得到训练后的向量转换模型;
7、基于所述训练后的向量转换模型对所述待推理的知识图谱进行推理补全。
8、本公开实施例的第二方面提供了一种基于对偶复数的知识图谱推理装置,该装置包括:
9、提取模块,用于从待推理的知识图谱中提取样本三元组,所述样本三元组包括第一头实体、第一关系和第一尾实体;
10、负采样模块,用于对所述样本三元组进行负采样,得到负样本三元组,所述负样本三元组包括第二头实体、第二关系和第二尾实体;
11、输入模块,用于将所述样本三元组和所述负样本三元组确定为训练数据输入至预先建立的向量转换模型,得到所述向量转换模型输出的所述样本三元组对应的第一头实体向量、第一关系向量和第一尾实体向量,以及所述负样本三元组对应的第二头实体向量、第二关系向量和第二尾实体向量,所述向量转换模型用于将实体和关系嵌入至对偶复数空间;
12、训练模块,用于基于所述第一头实体向量、所述第一关系向量、所述第一尾实体向量、所述第二头实体向量、所述第二关系向量和所述第二尾实体向量构建损失函数,并基于所述损失函数对所述向量转换模型进行训练,以得到训练后的向量转换模型;
13、补全模块,用于基于所述训练后的向量转换模型对所述待推理的知识图谱进行推理补全。
14、本公开实施例的第三方面提供了一种计算机设备,包括存储器和处理器,以及计算机程序,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的基于对偶复数的知识图谱推理方法。
15、本公开实施例的第四方面提供了一种计算机可读存储介质,存储介质中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的基于对偶复数的知识图谱推理方法。
16、本公开实施例提供的技术方案与现有技术相比具有如下优点:
17、在本公开实施例提供的基于对偶复数的知识图谱推理方法、装置、设备及介质中,通过从待推理的知识图谱中提取样本三元组,样本三元组包括第一头实体、第一关系和第一尾实体,对样本三元组进行负采样,得到负样本三元组,负样本三元组包括第二头实体、第二关系和第二尾实体,将样本三元组和负样本三元组确定为训练数据输入至预先建立的向量转换模型,得到向量转换模型输出的样本三元组对应的第一头实体向量、第一关系向量和第一尾实体向量,以及负样本三元组对应的第二头实体向量、第二关系向量和第二尾实体向量,向量转换模型用于将实体和关系嵌入至对偶复数空间,基于第一头实体向量、第一关系向量、第一尾实体向量、第二头实体向量、第二关系向量和第二尾实体向量构建损失函数,并基于损失函数对向量转换模型进行训练,以得到训练后的向量转换模型,基于训练后的向量转换模型对待推理的知识图谱进行推理补全,能够将对偶复数空间应用于知识图谱的向量表示,利用对偶复数的非可交换性在二维空间对包括非可交换组成模式在内的各种关系模式进行表示,基于对偶复数空间中的向量表示构建损失函数并对向量转换模型进行训练,使得向量转换模型有效地表示和区分各种关系模式,与采用三维空间(如quate、rotate3d、duale等模型)进行向量表示相比,对偶复数空间能够在不牺牲模型表现力的情况下减少参数量,提高知识图谱推理补全任务的运算效率。
本文档来自技高网...【技术保护点】
1.一种基于对偶复数的知识图谱推理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一头实体向量、所述第一关系向量、所述第一尾实体向量、所述第二头实体向量、所述第二关系向量和所述第二尾实体向量构建损失函数,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一头实体向量、所述第一关系向量和所述第一尾实体向量,计算所述样本三元组对应的第一距离得分,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述第二头实体向量、所述第二关系向量和所述第二尾实体向量,计算所述负样本三元组对应的第二距离得分,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述样本三元组进行负采样,得到负样本三元组之后,所述方法还包括:
6.根据权利要求2所述的方法,其特征在于,所述对所述样本三元组进行负采样,得到负样本三元组,包括:
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述基于所述训练后的向量转换模型对所述待推理的知识图谱进行推理补全,包括:
8
9.一种计算机设备,其特征在于,包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-7中任一项所述的基于对偶复数的知识图谱推理方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-7中任一项所述的基于对偶复数的知识图谱推理方法。
...【技术特征摘要】
1.一种基于对偶复数的知识图谱推理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一头实体向量、所述第一关系向量、所述第一尾实体向量、所述第二头实体向量、所述第二关系向量和所述第二尾实体向量构建损失函数,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一头实体向量、所述第一关系向量和所述第一尾实体向量,计算所述样本三元组对应的第一距离得分,包括:
4.根据权利要求2所述的方法,其特征在于,所述基于所述第二头实体向量、所述第二关系向量和所述第二尾实体向量,计算所述负样本三元组对应的第二距离得分,包括:
5.根据权利要求1所述的方法,其特征在于,所述对所述样本三元组进行负采样,得到负样本三元组之后,所述方法还包括:
...【专利技术属性】
技术研发人员:董垚,徐楠,孔庆超,李庆晓,李军锋,曹家,罗引,王磊,
申请(专利权)人:北京中科闻歌科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。