基于注意力的知识图谱链接预测方法、装置、设备及介质制造方法及图纸

技术编号:37724302 阅读:25 留言:0更新日期:2023-06-02 00:26
本发明专利技术公开了一种基于注意力的知识图谱链接预测方法、装置、设备及介质,包括:对知识图谱的原始数据中所有实体和关系构建索引和标签,得到样本数据;分别将实体的索引和关系的索引转化为嵌入向量并融合,得到融合嵌入向量;基于融合嵌入向量和标签,对初始知识图谱链接预测模型进行训练,得到训练好的知识图谱链接预测模型;将知识图谱中的实体和关系进行组合,得到模型输入数据,并将模型输入数据输入到训练好的知识图谱链接预测模型中进行预测,得到预测结果;将预测结果作为尾实体,并基于尾实体和输入数据,构建三元组并加入到知识图谱中。采用本发明专利技术可提高知识图谱链接预测的效率。效率。效率。

【技术实现步骤摘要】
基于注意力的知识图谱链接预测方法、装置、设备及介质


[0001]本专利技术涉及知识图谱处理领域,尤其涉及一种基于注意力的知识图谱链接预测方法、装置、设备及介质。

技术介绍

[0002]知识图谱是事实的结构化表示,它由大量的主体(节点)和关系(边)组成。使用(s, r, o)用来表示三元组,其中关系r表示主体s和客体o之间的联系,结构化信息包含大量的客观事实。知识图谱可以帮助下游的任务,如问答机器人,垂直搜索等,受到了业界的广泛关注。然而,知识图谱通常是不完整的、稀疏的,导致占用了大量的存储空间,而所包含的信息又相对有限,无法有效地应用于下游任务,因此需要对知识图谱进行补全。知识图谱补全,又称链接预测,是构建大规模知识图的关键环节。链接预测模型通常由简单的操作组成,并使用有限数量的参数。使用这种简单、快速、浅层的模型可拓展性强,但预测效果较差。在浅层模型中增加它们的表现力的唯一方法是通过增加嵌入的大小从而增加特征的数量。然而,这样做会减小模型的拓展性,因为嵌入参数的总数与图中实体和关系的数量成比例。其次,链接预测中生成负样本的常规方法是将三元组的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力的知识图谱链接预测方法,其特征在于,包括:对知识图谱的原始数据(s,r,o)中所有实体和关系构建索引和标签,并对所述原始数据进行数据预处理,得到样本数据;分别将样本数据中实体的索引和关系的索引转化为嵌入向量,得到实体嵌入向量和关系嵌入向量,并将所述关系嵌入向量作为所述实体嵌入向量的上下文,得到融合嵌入向量;基于所述融合嵌入向量和所述标签,对初始知识图谱链接预测模型进行训练,得到训练好的知识图谱链接预测模型,其中,所述初始知识图谱链接预测模型为包含注意力机制的神经网络模型;将知识图谱中的实体和关系进行组合,得到模型输入数据(s,r),并将所述模型输入数据输入到所述训练好的知识图谱链接预测模型中进行预测,得到预测结果;将所述预测结果作为尾实体,并基于所述尾实体和所述输入数据,构建三元组并加入到所述知识图谱中。2.如权利要求1所述的基于注意力的知识图谱链接预测方法,其特征在于,所述对知识图谱的原始数据(s,r,o)中所有实体和关系构建索引和标签,并对所述原始数据进行数据预处理,得到样本数据包括:为原始数据(s,r,o)三元组中的所有实体和关系生成索引;将三元组中的头实体和关系(s,r)的索引作为输入数据,构建输入数据的标签,所述标签的表现形式为1
×
n的矩阵,矩阵中尾实体o所在的位置为1,其余实体位置为0,作为正样本,其中,n为实体的个数;选取K个训练好的异构的链接预测模型,作为负样本数据生成器,将三元组中的头实体和关系输入到所述负样本数据生成器,得到K个预测结果其中,m为输入数据的数量,pred
ji
为第j个模型对第i个(s,r)得出的预测结果,其表现形式为模型对所有实体的评分,即所有实体{O1,O2,...,O
i
}是输入的(s,r)对应的尾实体的置信度,其表现形式为1
×
n的矩阵,n为实体数;对pred
ji
中的评分降序排序,若在K个所述预测结果{pred
1i
,pred
2i
,...,pred
Ki
}中,输入数据(s,r)
i
对应的尾实体O
i
的评分均未排在前十,则对{pred
1i
,pred
2i
,...,pred
Ki
}进行
混合排序,将评分排在前十的尾实体与(s,r)
i
组成十个三元组,将(s,r)
i
作为输入数据加入到负样本集合中,其标签表现形式为1
×
n的矩阵,其中,O
i
所在的位置置为

1,其余实体置为0;将所述正样本和所述负样本作为所述样本数据。3.如权利要求1所述的基于注意力的知识图谱链接预测方法,其特征在于,所述分别将实体的索引和关系的索引转化为嵌入向量,得到实体嵌入向量和关系嵌入向量包括:构建一个n
×
m的二维权重矩阵,n为实体或关系的数量,m为嵌入维度;将实体和关系的索引值对应一行,实体和关系的索引分别通过各自的二维权重矩阵,输出的行向量为对...

【专利技术属性】
技术研发人员:曹文治雷小东谢夏张冰陈丽君余海航
申请(专利权)人:湖南工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1