一种基于多样图注意力机制的知识图谱嵌入方法技术

技术编号：21399098 阅读：39 留言：0更新日期：2019-06-19 07:01

本发明专利技术提出一种基于多样图注意力机制的知识图谱嵌入方法，包括以下步骤：步骤1，知识图谱数据预处理，将传统知识图谱根据模型需求预处理为结构化数据；步骤2，建立实体注意力机制，所述建立实体注意力机制方式为通过使用多样图注意力机制，利用n个注意力头与自注意力在邻接图上来学习实体的向量表示；步骤3，建立关系注意力机制，所述建立关系注意力机制通过使用多样图注意力机制，利用n个注意力头与自注意力在关系图上学习实体的向量表示；步骤4，在关系图谱中进行多关系数据的建模；步骤5，模型训练，获得知识图谱中所有关系的向量化表示。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多样图注意力机制的知识图谱嵌入方法
本专利技术涉及一种知识图谱嵌入方法，具体涉及一种基于多样图注意力机制的知识图谱嵌入方法。
技术介绍
在2012年，谷歌提出了知识图谱概念，其本质是一种图结构表示的知识库。现有的常用知识图谱包括但不限于Freebase，DBPedia和YAGO。存储在知识图谱中的多关系数据已作为一组先验规则或约束应用于大量机器学习任务中，例如，信息检索，问答系统和自然语言处理。为了促进和标准化下游任务中的知识应用，一些工作尝试以更可计算的形式对这些数据进行建模。其中，许多知识图谱嵌入方法已得到广泛研究和重点关注。通常，知识图谱中的知识存储为标准三元组，即(头部实体，关系，尾部实体)。由Trans家族为代表的翻译模型将每个三元组视为训练样本并通过将实体和关系投影到一个连续向量空间以获取相应的知识表示，在投影过程中要遵循基本原理(h+r≈t，其中h，r，t是三元组的嵌入向量)和各种约束。通过充分考虑丰富的外部信息，例如多跳路径，实体图像或实体描述，许多特征模型已被不断地提出。此外，还有一些模型收集三元组以形成一个图，其点是实体，其边是实体之间的关系，同时获得更多通过结合图结构和点的特征来综合知识图谱嵌入。显然，现有的各种方法并不适用于多关系数据，因为它们总是直接进行推理计算而不考虑样本的邻域三元组或者不加区别地将所有环境因素结合。特别是，当存在大量不同类型的候选实体或单个给定实体对之间存在多重关系时，现有方法的效果将显著降低。此外，由于数据收集不完整，知识图谱往往稀疏且不完整，这将直接影响知识图谱嵌入的质量。此外，一些现有模型通常无法...

【技术保护点】
1.一种基于多样图注意力机制的知识图谱嵌入方法，其特征在于，包括以下步骤：步骤1，知识图谱数据预处理，将传统知识图谱根据模型需求预处理为结构化数据；步骤2，建立实体注意力机制，所述建立实体注意力机制方式为通过使用多样图注意力机制，利用n个注意力头与自注意力在邻接图上学习实体的向量表示；步骤3，建立关系注意力机制，所述建立关系注意力机制通过使用多样图注意力机制，利用n个注意力头与自注意力在关系图上学习实体的向量表示；步骤4，在关系图谱中进行多关系数据的建模；步骤5，模型训练，获得知识图谱中所有关系的向量化表示。

【技术特征摘要】
1.一种基于多样图注意力机制的知识图谱嵌入方法，其特征在于，包括以下步骤：步骤1，知识图谱数据预处理，将传统知识图谱根据模型需求预处理为结构化数据；步骤2，建立实体注意力机制，所述建立实体注意力机制方式为通过使用多样图注意力机制，利用n个注意力头与自注意力在邻接图上学习实体的向量表示；步骤3，建立关系注意力机制，所述建立关系注意力机制通过使用多样图注意力机制，利用n个注意力头与自注意力在关系图上学习实体的向量表示；步骤4，在关系图谱中进行多关系数据的建模；步骤5，模型训练，获得知识图谱中所有关系的向量化表示。2.如权利要求1所述的方法，其特征在于，在所述步骤1中，首先对不同领域的知识图谱数据进行预处理为10个文件，所述处理后的文件包括训练集实体特征，训练集实体标签，测试集实体特征，测试集实体标签，全集实体特征，全集实体标签，测试集实体的ID，整个知识图谱的邻接图，全体关系的特征，全体关系特征的图。3.如权利要求2所述的方法，其特征在于，在所述步骤2中建立实体注意力机制的具体方式为，获得知识图谱中的实体嵌入是实体嵌入建模多关系数据的初始步骤，所述通过从其邻接实体及其自身中的部分信息学习，每个信息源的学习规模由实体对(ei,ej)之间的关注系数cij确定，将输入实体特征转换为高级嵌入，通过使用加性注意力实现所述关注系数cij的计算,所述i,j为正整数，其中，所述a是加性的自注意力机制，用来表示实体ei到实体ej之间的重要程度，所述a的计算为：，所述ReLU表示激活函数，W表示注意力机...

【专利技术属性】
技术研发人员：李建欣，李晨，林子崴，张帅，张日崇，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人