知识图谱链接预测方法及系统技术方案

技术编号:38901672 阅读:12 留言:0更新日期:2023-09-22 14:20
本发明专利技术公开了一种知识图谱链接预测方法及系统,属于知识图谱链接领域,包括步骤:实体连通差异预处理,计算偏僻实体阈值并采用规则补全对其进行连通性处理;计算过饱和实体阈值,采用邻域注意力排序截断对其进行连通性处理;预处理后,生成均衡知识图谱;将生成的所述均衡知识图谱输入至目标导向注意力网络中进行嵌入学习,将预测链接任务融入至邻域交互作用体,计算目标导向的邻域注意力,针对链接预测任务的预测链接进行针对性的嵌入更新和进行链接预测。本发明专利技术提高了知识图谱的质量,增强了聚合邻域信息更新嵌入的效果,有效提高了注意力分配的质量,增强了嵌入学习的质量,提高了知识图谱链接预测任务的准确度。高了知识图谱链接预测任务的准确度。高了知识图谱链接预测任务的准确度。

【技术实现步骤摘要】
知识图谱链接预测方法及系统


[0001]本专利技术涉及知识图谱链接领域,更为具体的,涉及一种知识图谱链接预测方法及系统。

技术介绍

[0002]知识图谱是由大量实体以及它们之间的关系构成的大规模知识库,它作为许多人工智能应用的基础,具有不可或缺的地位。
[0003]目前信息对抗知识图谱的发展方兴未艾,在指挥控制信息系统中已经逐步开始构建一些较大规模知识图谱,但是大部分知识都是由人工或者半自动构建生成的,这必然会导致两个问题:其一,装备实体和目标实体之间存在许多潜藏的关系;其二,已有的知识存在噪声。这就导致知识图谱距离知识完备这一目标仍相距甚远。
[0004]为了进一步补全和完善信息对抗知识图谱,提高知识图谱整体质量,为智能化的电磁态势分析服务打好坚实的基础,研究者们提出了知识图谱的链接预测方法作为解决方案。目前的知识图谱链接预测方法主要分为2类:
[0005]1.基于规则推理的链接预测方法:通过人工归纳或现代规则挖掘系统从现有知识图谱中挖掘霍恩规则并进行推理预测,这类方法具有较好的可解释性,但在大规模知识图谱上效率很低。信息对抗知识图谱的规模一般较大,且随着战场实时数据的不断融合,规模会日渐庞大,因此该类方法无法直接应用。
[0006]2.基于表示学习的链接预测方法:通过某种映射将知识图谱中实体和关系的语义投影到连续的低维向量空间中(即知识图谱嵌入),该空间的嵌入能够保存原始知识图谱中的语义结构信息,同时基于向量和矩阵的运算能够极大改善方法的整体效率,适用于目前日渐增大的信息对抗知识图谱。但该类方法目前主要存在两个问题:第一,在知识图谱中,实体根据其邻域连通数量的分布应当有所差异,部分实体邻域数极少,部分实体邻域数极多,这种实体本身存在的连通差异会影响模型的能力和效率。在信息对抗领域,往往存在部分邻域数极多或极少的极端实体,现有模型在这类实体嵌入的学习效果上表现较差;第二,现有模型学习网络结构时大多采用注意力机制以便为不同的邻域赋予不同的权重,但从具体实现上来看它们都忽视了任务目标本身对注意力所产生的影响,因而注意力分配效果较差,模型预测能力有限。

技术实现思路

[0007]本专利技术的目的在于克服现有技术的不足,提供一种知识图谱链接预测方法及系统,提高了知识图谱的质量,增强了聚合邻域信息更新嵌入的效果,有效提高了注意力分配的质量,增强了嵌入学习的质量,提高了知识图谱链接预测任务的准确度等。
[0008]本专利技术的目的是通过以下方案实现的:
[0009]一种知识图谱链接预测方法,包括以下步骤:
[0010]实体连通差异预处理,计算偏僻实体阈值并采用规则补全对其进行连通性处理;
计算过饱和实体阈值,采用邻域注意力排序截断对其进行连通性处理;预处理后,生成均衡知识图谱;
[0011]将生成的所述均衡知识图谱输入至目标导向注意力网络中进行嵌入学习,将预测链接任务融入至邻域交互作用体,计算目标导向的邻域注意力,针对链接预测任务的预测链接进行针对性的嵌入更新和进行链接预测。
[0012]进一步地,所述计算偏僻实体阈值并采用规则补全对其进行连通性处理,包括子步骤:
[0013]A1,遍历知识图谱统计获取各个实体的邻域数目;
[0014]A2,计算偏僻实体邻域阈值,确定知识图谱偏僻实体集合;
[0015]A3,采用关联规则挖掘系统从知识图谱挖掘霍恩规则并转换为链式规则;
[0016]A4,基于链式规则对偏僻实体集合中的实体进行邻域推导以补全偏僻实体。
[0017]进一步地,所述计算过饱和实体阈值,采用邻域注意力排序截断对其进行连通性处理,包括子步骤:
[0018]B1,计算过饱和实体领域阈值,确定知识图谱过饱和实体集合;
[0019]B2,基于注意力对过饱和实体的邻域进行排序截断。
[0020]进一步地,所述将预测链接任务融入至邻域交互作用体,计算目标导向的邻域注意力,包括子步骤:
[0021]C1,建模邻域关系与邻域实体的交互作用,生成邻域嵌入;
[0022]C2,为关系定义预测链接特征矩阵,将预测链接嵌入与邻域交互作用体融合得到目标导向的邻域交互作用体嵌入;
[0023]C3,基于目标导向的邻域交互作用体嵌入计算各邻域的注意力值。
[0024]进一步地,所述针对链接预测任务的预测链接进行针对性的嵌入更新和进行链接预测,包括子步骤:
[0025]D1,采用图注意力网络,以步骤C3中计算的目标导向注意力值和邻域置信度的积作为邻域权重,聚合邻域信息更新中心实体嵌入;
[0026]D2,更新后的实体嵌入输入至解码器中进行链接预测任务。
[0027]进一步地,在步骤D2中,所述更新后的实体嵌入输入至解码器中进行链接预测任务,包括子步骤:采用置信度修正的二值交叉熵损失函数作为模型训练的损失函数,模型整体以自编码的形式进行端到端的训练。
[0028]进一步地,所述解码器包括Conv

TransE解码器。
[0029]进一步地,在步骤A3中,所述转换为链式规则包括子步骤:通过反向边方法转换构建链式规则。
[0030]一种知识图谱链接预测系统,包括:
[0031]实体连通差异预处理单元,用于计算偏僻实体阈值并采用规则补全对其进行连通性处理;计算过饱和实体阈值,采用邻域注意力排序截断对其进行连通性处理;所述连通性处理预处理后,生成均衡知识图谱;
[0032]链接预测单元,用于将生成的所述均衡知识图谱输入至目标导向注意力网络中进行嵌入学习,将预测链接任务融入至邻域交互作用体,计算目标导向的邻域注意力,针对链接预测任务的预测链接进行针对性的嵌入更新和进行链接预测。
[0033]进一步地,所述实体连通差异预处理单元包括规则挖掘转换模,用于采用关联规则挖掘系统从知识图谱挖掘霍恩规则并通过反向边方法转换为链式规则,基于链式规则对偏僻实体集合中的实体进行邻域推导以补全偏僻实体。
[0034]本专利技术的有益效果包括:
[0035](1)本专利技术通过对知识图谱中的不均衡实体进行处理,有效提高了知识图谱的质量,增强了聚合邻域信息更新嵌入的效果。
[0036](2)本专利技术通过将预测链接任务融入至邻域交互作用体,构建目标导向的邻域注意力,有效提高了注意力分配的质量,增强了嵌入学习的质量,相对于SACN模型而言,各项评价指标均有极大的提升。
[0037](3)本专利技术对实体分布不均衡的信息对抗知识图谱,首先进行实体连通差异预处理,计算偏僻实体阈值和过饱和实体阈值,并分别采用规则补全和邻域注意力排序截断的手段对其进行连通性处理以生成均衡知识图谱;基于处理后的均衡知识图谱,针对链接预测任务,解决了现有技术注意力分配策略效果较低的问题;本专利技术建模邻域交互作用体,并将链接预测任务本身融入邻域交互嵌入中以计算目标导向的邻域注意力,从而实现高效高质的注意力分配,进而增强嵌入学习的质量,提高了知识图谱链接预测任务的准确度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱链接预测方法,其特征在于,包括以下步骤:实体连通差异预处理,计算偏僻实体阈值并采用规则补全对其进行连通性处理;计算过饱和实体阈值,采用邻域注意力排序截断对其进行连通性处理;预处理后,生成均衡知识图谱;将生成的所述均衡知识图谱输入至目标导向注意力网络中进行嵌入学习,将预测链接任务融入至邻域交互作用体,计算目标导向的邻域注意力,针对链接预测任务的预测链接进行针对性的嵌入更新和进行链接预测。2.根据权利要求1所述的知识图谱链接预测方法,其特征在于,所述计算偏僻实体阈值并采用规则补全对其进行连通性处理,包括子步骤:A1,遍历知识图谱统计获取各个实体的邻域数目;A2,计算偏僻实体邻域阈值,确定知识图谱偏僻实体集合;A3,采用关联规则挖掘系统从知识图谱挖掘霍恩规则并转换为链式规则;A4,基于链式规则对偏僻实体集合中的实体进行邻域推导以补全偏僻实体。3.根据权利要求1所述的知识图谱链接预测方法,其特征在于,所述计算过饱和实体阈值,采用邻域注意力排序截断对其进行连通性处理,包括子步骤:B1,计算过饱和实体领域阈值,确定知识图谱过饱和实体集合;B2,基于注意力对过饱和实体的邻域进行排序截断。4.根据权利要求1所述的知识图谱链接预测方法,其特征在于,所述将预测链接任务融入至邻域交互作用体,计算目标导向的邻域注意力,包括子步骤:C1,建模邻域关系与邻域实体的交互作用,生成邻域嵌入;C2,为关系定义预测链接特征矩阵,将预测链接嵌入与邻域交互作用体融合得到目标导向的邻域交互作用体嵌入;C3,基于目标导向的邻域交互作用体嵌入计算各邻域的注意力值。5.根据权利要求4所述的知识图谱链接预测方法,其特征在于,所述针对链接预测任务的...

【专利技术属性】
技术研发人员:闫德祥王飞葛江涛王禹力于翔苏骞申治明刘忆璐
申请(专利权)人:中国电子科技集团公司第二十九研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1