【技术实现步骤摘要】
一种融合图卷积与翻译模型的知识图谱联合表示学习方法
本专利技术涉及知识图谱、表示学习等领域,特别给出了一种融合图卷积与翻译模型的知识图谱联合表示学习方法。
技术介绍
知识图谱表示学习旨在通过学习知识图谱中的语义特征,在保留原有语义信息的前提下将知识图谱的实体和关系从高维离散的空间映射到一个连续低维的向量空间中,从而使实体和关系能够被直接数值化地计算,提高计算效率。现有主要的知识图谱表示学习模型包括翻译模型、语义匹配模型和神经网络模型。翻译模型的主要思想是将三元组(h,r,t)中的关系r解释为头实体h到尾实体t的翻译过程,TransE(AnnualConferenceonNeuralInformationProcessingSystems,2013)是最具代表性的翻译模型之一,该模型认为头实体的嵌入加上关系的嵌入应该等于尾实体在向量空间中的位置,即h+r=t。语义匹配模型是使用基于语义相似度的得分函数,通过语义相似度的匹配来衡量事实的合理性,RESCAL(InternationalConferenceonInterna ...
【技术保护点】
1.一种融合图卷积与翻译模型的知识图谱联合表示学习方法,其特征在于,所述方法包括以下步骤:/n1)构建知识图谱邻接矩阵/n在知识图谱中,根据节点之间的链接关系定义两种邻接关系:/n定义1:在知识图谱中,存在直接链接关系的一对节点互为直接邻接点,此时两个节点间的距离为1,又称为1跳邻接点;/n定义2:在知识图谱中,存在通路的一对节点称为间接邻接点,此时两个节点间的距离为n,n>1,又称为n跳邻接点;/n假设一个知识图谱的节点数量为N,构建其直接邻接矩阵:/n
【技术特征摘要】
1.一种融合图卷积与翻译模型的知识图谱联合表示学习方法,其特征在于,所述方法包括以下步骤:
1)构建知识图谱邻接矩阵
在知识图谱中,根据节点之间的链接关系定义两种邻接关系:
定义1:在知识图谱中,存在直接链接关系的一对节点互为直接邻接点,此时两个节点间的距离为1,又称为1跳邻接点;
定义2:在知识图谱中,存在通路的一对节点称为间接邻接点,此时两个节点间的距离为n,n>1,又称为n跳邻接点;
假设一个知识图谱的节点数量为N,构建其直接邻接矩阵:
其中若两个节点为直接邻节点,则直接邻接矩阵A中对应位置的值为1,否则为0;同时,构建该知识图谱的间接邻接矩阵:
其中若两个节点互为间接邻接点,则间接邻接矩阵A’中对应位置的值为1,否则为0;
2)基于图卷积学习知识图谱的结构信息,过程如下:
2.1)学习实体向量表示
设计图卷积网络,包括一个输入层和两个隐藏层,每个隐藏层同时学习直接邻节点和间接邻节点的信息,以第二个隐藏层的输出作为实体的向量表示,利用该多跳图卷积网络学习知识图谱的结构信息;
图卷积网络的输入是A和A′,对直接邻节点和间接邻节点分别设置不同的权重,实体i在第l层的向量表示为
其中,Ni,1表示节点i∈E的直接邻节点集合,Ni,2表示节点i∈E的间接邻节点集合,分别是直接邻节点和间接邻节点在第l层的权重矩阵,σ1表示的是激活函数;μ1是一个权重系数,用于对直接邻节点和间接邻节点的影响力进行平衡;表示的是节点i与其邻节点j之间的注意力权重;
2.2)学习邻接点的注意力系数
在图卷积网络中引入注意力机制,通过对实体的影响力进行控制,对于越重要的邻节点其值越大,计算公式为:
其中是注意力系数,反映了在第l层中节点i和节点j之间的相关性;softmax函数归一化注意力系数将所有系数权重之和设置为1,并更加突出重要元素的权重;
公式(2)中的注意力系数的计算公式如下:
其中sim(·,·)是相似度的函数,用于比较节点i和节点j在经过一次线性变换之后的向量表示的相似度;W1和W2分别作为中心实体和其邻节点的线性变换矩阵,以表征相邻节点之间的差异;
3)基于翻译模型学习知识图...
【专利技术属性】
技术研发人员:张元鸣,高天宇,肖刚,陆佳炜,程振波,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。