知识图谱补全方法、装置、电子设备和存储介质制造方法及图纸

技术编号:35195607 阅读:24 留言:0更新日期:2022-10-12 18:24
本申请涉及一种知识图谱补全方法、装置、电子设备和存储介质。所述方法包括:获取待处理语料数据;通过预测模型对所述待处理语料数据进行预测处理,得到所述待处理语料数据对应的预测结果,所述预测模型包括至少一个可微神经计算机DNC模型,在存在多个所述DNC模型的情况下,所述多个DNC模型呈堆叠结构;根据所述待处理语料数据及所述预测结果对待补全知识图谱进行补全,得到补全后的知识图谱。采用本方法能够提高知识图谱补全精度。法能够提高知识图谱补全精度。法能够提高知识图谱补全精度。

【技术实现步骤摘要】
知识图谱补全方法、装置、电子设备和存储介质


[0001]本申请涉及神经网络
,特别是涉及一种知识图谱补全方法、装置、电子设备和存储介质。

技术介绍

[0002]知识图谱(Knowledge Graph,KG)因其优秀的可解释性和强大的语义识别处理能力,成为大数据时代极为重要的一种知识表示方式。
[0003]知识图谱现普遍存在的缺陷之一是其不完整性,这限制了知识图谱技术的发展及应用。面向知识图谱的知识推理可以根据知识图谱中现有的知识进行推理,得到新的知识,达到知识图谱补全(Knowledge Graph Completion,KGC)的作用,这对弥补知识图谱不完整性的缺陷具有重要意义,因此面向知识图谱的知识推理受到国内外研究者的重视,成为知识图谱技术体系中的热点研究问题。
[0004]但由于受制于数据的丰富性,也即知识图谱的构建来源并不十分充分,并且由于知识抽取的方法以及知识推理方法的性能有限,导致对一些隐含知识不能充分挖掘,进而导致在知识图谱补全过程中推理精度较低,补全后的知识图谱精度较差。

技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种能够提高知识图谱补全精度的知识图谱补全方法、装置、电子设备和存储介质。
[0006]第一方面,本申请提供了一种知识图谱补全方法,所述方法包括:
[0007]获取待处理语料数据;
[0008]通过预测模型对所述待处理语料数据进行预测处理,得到所述待处理语料数据对应的预测结果,所述预测模型包括至少一个可微神经计算机DNC模型,在存在多个所述DNC模型的情况下,所述多个DNC模型呈堆叠结构;
[0009]根据所述待处理语料数据及所述预测结果对待补全知识图谱进行补全,得到补全后的知识图谱。
[0010]根据本公开实施例提供的知识图谱补全方法,由于DNC模型将神经网络参数和记忆容量分离,可以增加网络容量,且将DNC模型堆叠化,可以增加超参规模,增大模型表示空间,可以具有较好的推理和问答效果,面向问答系统任务,有效降低了平均单词错误率和综合平均单词错误率,提高了知识图谱补全精度。
[0011]在其中一个实施例中,所述DNC模型包括控制器和记忆体,所述通过预测模型对所述待处理语料数据进行预测处理,得到所述待处理语料数据对应的预测结果,包括:
[0012]针对所述待处理语料数据中任一时间步t,采用基于内容的寻址操作,从所述记忆体中读取时间步t

1对应的记忆信息,得到对应的记忆体读向量r
t
‑1;
[0013]通过所述控制器对所述待处理语料数据中所述时间步t对应的语料数据X
t
、所述记忆体读向量r
t
‑1进行预测处理,得到对应的控制器输出向量V
t

[0014]采用基于内容的寻址操作,从所述记忆体中读取所述时间步t对应的记忆信息,得到对应的记忆体读向量r
t

[0015]通过所述控制器输出向量V
t
和所述记忆体读向量r
t
,得到所述时间步t对应的输出向量Y
t

[0016]在所述时间步t为所述待处理语料数据中的最后一个时间步的情况下,确定所述时间步t对应的输出向量Y
t
为所述待处理语料数据对应的最终向量表示;
[0017]通过所述待处理语料数据对应的最终向量表示,得到所述待处理语料数据对应的预测结果。
[0018]根据本公开实施例提供的知识图谱补全方法,可以去除DNC模型中的冗余结构,减少不必要的系统资源消耗,增强模型效率。
[0019]在其中一个实施例中,所述采用基于内容的寻址操作,从所述记忆体中读取所述时间步对应的记忆信息,得到对应的记忆体读向量r
t
,包括:
[0020]根据所述时间步t对应的语料数据X
t
,对所述记忆体中存储的记忆信息进行更新;
[0021]采用基于内容的寻址操作,从更新后的所述记忆体中读取所述时间步t对应的记忆信息,得到对应的记忆体读向量r
t

[0022]根据本公开实施例提供的知识图谱补全方法,预测模型中各DNC模型将时序记忆链接及其相关部件进行移除,记忆体存储矩阵的寻址方式将只使用基于内容的寻址,可以提高模型预测效率。
[0023]在其中一个实施例中,所述记忆体包括项目记忆体及关系记忆体,所述项目记忆体用于通过门控联想记忆存储输入的语料数据,所述关系记忆体用于存储所述语料数据之间的关系。
[0024]根据本公开实施例提供的知识图谱补全方法,通过对原有注意力机制的分析,引入双记忆体结构对注意力机制进行增强,增强了模型的推理能力。
[0025]在其中一个实施例中,记忆体读向量包括项目记忆信息及关系记忆信息,所述采用基于内容的寻址操作,从更新后的所述记忆体中读取所述时间步t对应的记忆信息,得到对应的记忆体读向量r
t
,包括:
[0026]采用基于内容的寻址操作,从更新后的所述项目记忆体中读取所述时间步t对应的项目记忆信息,以及从更新后的所述关系记忆体重读取所述时间步t对应的关系记忆信息。
[0027]根据本公开实施例提供的知识图谱补全方法,通过对原有注意力机制的分析,引入双记忆体结构对注意力机制进行增强,增强了模型的推理能力。
[0028]在其中一个实施例中,所述根据所述时间步t的语料数据X
t
,对所述记忆体中存储的记忆信息进行更新,包括:
[0029]根据所述时间步t的语料数据X
t
对所述项目记忆体中存储的时间步t

1的项目记忆信息进行更新,得到更新后的项目记忆体,所述更新后的项目记忆体存储时间步t的项目记忆信息;
[0030]根据所述时间步t的语料数据X
t
及所述关系记忆体中存储的时间步t

1的关系记忆信息,及确定目标关系向量;
[0031]根据所述目标关系向量、所述时间步t的项目记忆信息及所述时间步t的语料数据
X
t
,确定目标项目向量;
[0032]根据所述目标项目向量对所述关系记忆体中存储的时间步t

1的关系记忆信息进行更新,得到更新后的关系记忆体,所述更新后的关系记忆体存储时间步t的关系记忆信息。
[0033]根据本公开实施例提供的知识图谱补全方法,本公开实施例提供的知识图谱补全方法,对可微神经计算机DNC模型的冗余结构进行简化,并通过对原有注意力机制的分析,引入双记忆体结构对注意力机制进行增强。此外,模型进行了堆叠化处理,采用双层结构,增强了模型的推理能力。
[0034]第二方面,本申请还提供了一种知识图谱补全装置,所述装置包括:
[0035]获取模块,用于从待补全知识图谱中获取待处理语料数据;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱补全方法,其特征在于,所述方法包括:获取待处理语料数据;通过预测模型对所述待处理语料数据进行预测处理,得到所述待处理语料数据对应的预测结果,所述预测模型包括至少一个可微神经计算机DNC模型,在存在多个所述DNC模型的情况下,所述多个DNC模型呈堆叠结构;根据所述待处理语料数据及所述预测结果对待补全知识图谱进行补全,得到补全后的知识图谱。2.根据权利要求1所述的方法,其特征在于,所述DNC模型包括控制器和记忆体,所述通过预测模型对所述待处理语料数据进行预测处理,得到所述待处理语料数据对应的预测结果,包括:针对所述待处理语料数据中任一时间步t,采用基于内容的寻址操作,从所述记忆体中读取时间步t

1对应的记忆信息,得到对应的记忆体读向量r
t
‑1;通过所述控制器对所述待处理语料数据中所述时间步t对应的语料数据X
t
、所述记忆体读向量r
t
‑1进行预测处理,得到对应的控制器输出向量V
t
;采用基于内容的寻址操作,从所述记忆体中读取所述时间步t对应的记忆信息,得到对应的记忆体读向量r
t
;通过所述控制器输出向量V
t
和所述记忆体读向量r
t
,得到所述时间步t对应的输出向量Y
t
;在所述时间步t为所述待处理语料数据中的最后一个时间步的情况下,确定所述时间步t对应的输出向量Y
t
为所述待处理语料数据对应的最终向量表示;通过所述待处理语料数据对应的最终向量表示,得到所述待处理语料数据对应的预测结果。3.根据权利要求2所述的方法,其特征在于,所述采用基于内容的寻址操作,从所述记忆体中读取所述时间步对应的记忆信息,得到对应的记忆体读向量r
t
,包括:根据所述时间步t对应的语料数据X
t
,对所述记忆体中存储的记忆信息进行更新;采用基于内容的寻址操作,从更新后的所述记忆体中读取所述时间步t对应的记忆信息,得到对应的记忆体输出向量r
t
。4.根据权利要求2或3所述的方法,其特征在于,所述记忆体包括项目记忆体及关系记忆体,所述项目记忆体用于通过门控联想记忆存储输入的语料数据,所述关系记忆体用于存储所述语料数据之间的...

【专利技术属性】
技术研发人员:孙建强常小龙郭庆宋怀明
申请(专利权)人:青岛中科曙光科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1