基于动态卷积的知识图谱链接预测方法技术

技术编号：40801956 阅读：2 留言：0更新日期：2024-03-28 19:27

本公开提供基于动态卷积的知识图谱链接预测方法。方法包括：输入知识图谱数据，将知识图谱数据中的实体表示为实体嵌入向量，将知识图谱数据中的关系表示为关系嵌入向量；将关系嵌入向量重塑为多个卷积核；确定实体嵌入向量和关系嵌入向量的相关性；基于相关性将多个卷积核构建为自适应动态卷积核权重向量；利用自适应动态卷积核权重向量对实体嵌入向量进行动态卷积；通过全连接层输出特征向量；通过最小化交叉熵损失来调整模型参数，得到训练后的模型。本公开的方法可以使每个卷积核都得到有效的合理利用，能突出关键特征信息，同时缓解不相关信息的干扰，使实体嵌入与关系嵌入实现有效充分地交互，显著提高模型的表达能力。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及信息，尤其涉及基于动态卷积的知识图谱链接预测方法。

技术介绍

1、知识图谱以结构化形式描述现实世界中的客观事实和关系，为知识存储、管理和分析提供了不可或缺的研究基础，其基本结构是三元组(h,r,t)，包含头实体、关系和尾实体。然而，由于抽取算法误差或数据来源缺失等问题导致知识图谱普遍遭受不完整性的问题。知识嵌入是缓解这一难题的最流行方法，旨在将研究对象的语义信息嵌入连续低维向量空间中，通过学习实体与关系的有效表示预测缺失的链接以进行知识图谱补全。

2、该领域早期的大量工作主要集中在基于平移距离和语义匹配的模型，能提取知识库部分语义信息。基于平移距离的模型是高效且直观的，该类模型一般实现较为简单，但它们在表达能力方面存在局限性。transe是该类模型的开创性成果，直接将关系作为头实体与尾实体之间的翻译，试图使数据在低纬向量空间层面实现h+t≈r的形式。基于语义匹配的模型代表工作时rescal，该工作将实体和关系映射到低维矩阵中，对于每一种关系，都会有一个对应的关系矩阵，该矩阵的每一列对应一个实体在关系中的表示，实体则由矩阵的列表示。该领域模型的实现流程一般为：1.收集知识图谱数据，通常以三元组(实体1,关系,实体2)的形式表示；2.为每个正样本三元组生成负样本，即不成立的三元组。这用于训练模型，使其能够区分正确和错误的关系。(若为神经网络类模型使用交叉熵损失函数则无需构造负样本数据)；3.初始化实体和关系的嵌入表示，可以使用随机初始化或预训练的嵌入。每个实体和关系都被映射到低维空间的向量；4.选择适当的损失函

3、由于神经网络在不同任务中展现出的强大能力，基于卷积神经网络的深度知识嵌入模型逐渐成为研究热点，其可以抽取更丰富的语义信息，显著提升模型性能。基于卷积神经网络的深度知识图谱嵌入模型的优势主要在于卷积可以捕捉实体嵌入和关系嵌入的交互信息，从而提取更深层次的语义信息，显著提高模型的表达能力。因此，这类方法的核心创新点主要围绕卷积核的设计以提高实体嵌入与关系嵌入之间的交互程度。

4、如图1所示，conve是经典卷积嵌入方法，采用卷积神经网络(cnn)来学习实体和关系的嵌入表示，其主要使用堆栈重塑函数和外部卷积核抽取语义信息，将实体嵌入和关系嵌入拼接成一个二维矩阵，作为卷积层的输入。卷积核通过矩阵的滑动窗口进行卷积操作，提取局部特征。

5、如图2所示，interacte在conve基础上首次提出交替重塑函数以提高特征交互信息，有效地捕捉了实体对之间的关系，特别适用于需要建模复杂关系的知识图谱表示学习任务。

6、如图3所示，convr则以关系嵌入直接充当内部卷积核直接抽取实体嵌入信息，以增加特征交互提升性能。相比于interacte，可以用较少的参数代价实现更高效的特征提取，更加适合大规模数据集。

7、现有大多数卷积嵌入方法为了增加模型表达能力，卷积过程都会构建多个卷积核提取特征，并且每个卷积核对于特征提取的贡献是相等的。然而，每个卷积核权重相同在知识图谱嵌入领域是不合理的，每个卷积核对于特征的提取应该侧重不同。知识嵌入过程中每个卷积核以相同权重进行简单粗狂式的特征聚合，虽然可以增加实体嵌入和关系嵌入的交互信息，但是也模糊了重要交互信息的贡献，甚至引入一些无用噪音信息干扰嵌入性能，使模型的表达能力受限。

技术实现思路

1、为解决现有问题，本公开提供一种基于动态卷积的知识图谱链接预测方法。

2、本公开采用以下的技术方案。

3、本公开的实施例提供一种基于动态卷积的知识图谱链接预测方法，所述基于动态卷积的知识图谱链接预测方法包括：输入知识图谱数据，将所述知识图谱数据中的实体表示为实体嵌入向量，将所述知识图谱数据中的关系表示为关系嵌入向量；将所述关系嵌入向量重塑为多个卷积核；确定所述实体嵌入向量和所述关系嵌入向量的相关性；基于所述相关性将所述多个卷积核构建为自适应动态卷积核权重向量；利用所述自适应动态卷积核权重向量对所述实体嵌入向量进行动态卷积；通过全连接层输出特征向量；通过最小化交叉熵损失来调整模型参数，得到训练后的模型。

4、本公开的另一实施例提供了一种基于动态卷积的知识图谱链接预测装置，包括：输入模块，配置为输入知识图谱数据，将所述知识图谱数据中的实体表示为实体嵌入向量，将所述知识图谱数据中的关系表示为关系嵌入向量；卷积核构建模块，配置为将所述关系嵌入向量重塑为多个卷积核；相关性确定模块，配置为确定所述实体嵌入向量和所述关系嵌入向量的相关性；权重向量构建模块，配置为基于所述相关性将所述多个卷积核构建为自适应动态卷积核权重向量；动态卷积模块，配置为利用所述自适应动态卷积核权重向量对所述实体嵌入向量进行动态卷积；输出模块，配置为通过全连接层输出特征向量；参数调整模块，配置为通过最小化交叉熵损失来调整模型参数，得到训练后的模型。

5、本公开的方法将关系嵌入向量重塑为多个内部卷积核，直接抽取实体嵌入特征信息，提高模型特征交互程度。同时，通过确定实体嵌入向量与关系嵌入向量的相关性来构建自适应动态卷积核权重向量，通过这种注意力增强的动态卷积交互，模型可以使每一个关系卷积核都得到有效的合理利用，既能突出关键特征信息，也可以缓解无用信息的干扰，使实体嵌入与关系嵌入实现有效充分地交互，显著提高模型的表达能力。

本文档来自技高网...

【技术保护点】

1.一种基于动态卷积的知识图谱链接预测方法，其特征在于，包括：

2.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，确定所述实体嵌入向量和所述关系嵌入向量的相关性包括：

3.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，所述多个卷积核的维数彼此相同。

4.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，所述多个卷积核的定义为：

5.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，利用所述自适应动态卷积核权重向量对所述实体嵌入向量进行动态卷积包括：利用所述自适应动态卷积核权重向量对所述实体嵌入向量的二维重塑进行动态卷积。

6.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，所述特征向量为：

7.根据权利要求2所述的基于动态卷积的知识图谱链接预测方法，其特征在于，所述注意力机制为：

【技术特征摘要】

1.一种基于动态卷积的知识图谱链接预测方法，其特征在于，包括：

2.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，确定所述实体嵌入向量和所述关系嵌入向量的相关性包括：

3.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，所述多个卷积核的维数彼此相同。

4.根据权利要求1所述的基于动态卷积的知识图谱链接预测方法，其特征在于，所述多个卷积核的定义为：

【专利技术属性】
技术研发人员：王鑫，郭文斌，李钊，陈子睿，余亮豪，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人