一种基于图结构转化的知识超图补全方法技术

技术编号:38742579 阅读:11 留言:0更新日期:2023-09-08 23:26
本发明专利技术公开了一种基于图结构转化的知识超图补全方法,包括:S1:根据真实世界知识构造知识超图,获取实体和关系的初始化向量表示;S2:根据实体和关系的初始化向量表示以及所述知识超图,构造多元关系事实集;S3:利用卷积神经网络对多元关系事实集中各多元关系事实内部的实体和关系进行信息聚合,得到各多元关系事实的向量表示;S4:基于所述知识超图构造辅助图;S5:根据各所述多元关系事实的向量表示和所述辅助图,利用图神经网络汇聚所述知识超图的超边之间的上下文信息,得到汇聚后的新的超边向量;S6:根据所述汇聚后的新的超边向量,利用评分函数计算各多元关系事实成立的可能性,并确定得分最高的多元关系事实为补全结果。果。果。

【技术实现步骤摘要】
一种基于图结构转化的知识超图补全方法


[0001]本专利技术涉及知识图谱
,具体涉及一种基于图结构转化的知识超图补全方法。

技术介绍

[0002]随着人类社会的飞速发展,各领域内知识的多元性、交叉性和可扩展性等出现了质的提升,知识图谱凭借其对现实世界的强大建模能力,为下游产业应用提供了有力支撑。然而,由于现实世界中的关系具有极大的复杂性,知识图谱基于三元组的表示方法往往难以表示普遍存在的多元关系,针对连接两个及以上实体的多元关系事实,三元组无法对其高阶结构信息进行建模,从而导致知识图谱语义内涵缺失。此外,现有知识图谱仍存在实体或关系的缺失,导致知识的不完备性,极大限制了知识图谱的表示和推理能力。知识超图补全方法在三元组的基础上进行扩展,丰富其语义信息,并在知识超图中进行链接预测和知识补全,从而提高知识图谱的知识完备性。
[0003]超图(Hypergraph)作为图的一种推广形式,从以三元组为主体的二元成对关系发展到包含任意数量节点的多元关系,多元关系又被称为超边(Hyperedge)。知识图谱通过引入超图的概念,实现了对高阶复杂结构信息的建模,从而进一步丰富了知识图谱的语义内涵。当前知识超图补全技术以基于表示学习的方法为主流,将实体作为节点,关系作为边,并使用低维稠密的实值向量对节点和边进行矢量化表示,以此反映潜在向量空间与现实世界的相似性,采用的技术主要包括卷积神经网络、图神经网络和空间映射。
[0004]基于卷积神经网络的方法通过设置不同卷积层对实体和关系进行卷积,从多元关系事实中学习实体和关系的向量表示,捕获实体和关系之间的相关性。通常先将实体和关系按照一定方法进行拼接组合,如横向、纵向、错位拼接等,然后将组合向量送入若干个卷积层,并设置不同大小的卷积核,得到一组融合后的特征向量,最后经过池化、全连接层等操作得到最终的预测结果。卷积神经网络在构造上相对来说较为简易,开发代价较小,但无法体现出知识超图特有的图结构信息,限制了知识超图的推理效果。
[0005]基于图神经网络的方法在知识超图的图结构上进行学习,利用消息传递框架学习给定图节点和边的潜在向量表示,通过递归迭代将节点的邻域信息聚合到中心节点上。图神经网络以节点为主体,通常先将一个多元关系事实中的各个实体和关系以加、乘等方式聚合到其中一个实体节点上,作为该多元关系事实整体的融合信息表示,然后根据多元关系事实之间的关联关系进行进一步的消息传递,最后通过递归实现全图节点的遍历。图神经网络在图结构上进行学习,对实体和关系的关联可达到更好的学习效果,但现有技术在信息聚合过程中存在结构信息丢失、语义感知不全面、上下文关联性弱等问题,补全效果有待进一步提升。
[0006]基于空间映射的方法将知识超图嵌入到更为丰富的几何空间中,根据图结构的不同特征寻找相似的几何体进行拟合。例如在知识超图的特定结构中,实体度数越高,位置越接近于球形中心;度数越低,位置越接近球形边界,这与庞加莱球的性质类似。空间映射可
将知识超图映射到庞加莱球面中,然后通过对数映射等方法将实体投影到切线空间中,实现知识超图实体的信息交互。空间映射方法在知识超图补全中可达到很好的推理效果,但其受制于特定知识超图数据图结构的限制,一般性、普适性较差,难适用于所有的知识超图结构。

技术实现思路

[0007]本专利技术的目的在于提供一种基于图结构转化的知识超图补全方法,以能够弥补了现有知识超图补全算法结构信息丢失、语义感知不全面、上下文关联性弱等问题,可以达到更好的补全效果。
[0008]本专利技术解决上述技术问题的技术方案如下:
[0009]本专利技术提供一种基于图结构转化的知识超图补全方法,所述基于图结构转化的知识超图补全方法包括:
[0010]S1:根据真实世界知识构造知识超图,获取实体和关系的初始化向量表示;
[0011]S2:根据所述实体和关系的初始化向量表示以及所述知识超图,构造多元关系事实集;
[0012]S3:利用卷积神经网络对多元关系事实集中各多元关系事实内部的实体和关系进行信息聚合,得到各多元关系事实的向量表示;
[0013]S4:基于所述知识超图构造辅助图;
[0014]S5:根据各所述多元关系事实的向量表示和所述辅助图,利用图神经网络汇聚所述知识超图的超边之间的上下文信息,得到汇聚后的新的超边向量;
[0015]S6:根据所述汇聚后的新的超边向量,利用评分函数计算各多元关系事实成立的可能性,并确定得分最高的多元关系事实为补全结果。
[0016]可选择地,所述S2包括:
[0017]S21:随机替换所述知识超图的超边中部分实体或关系,以构造负样本超边;
[0018]S22:根据所述负样本超边和未替换实体或关系的超边,得到多元关系事实集;
[0019]其中,所述负样本超边和所述未替换实体或关系的超边均为所述多元关系事实集中的多元关系事实,每条多元关系事实以三元组+辅助键值对形式表示,视为一条主要信息和一些辅助信息的组合,表达公式为:
[0020]Rel={s,r,o,Q={(qr
i
,qv
i
)}}
[0021]其中,Rel是一条多元关系事实,s,r,o分别代表主三元组中的头实体、主关系和尾实体,Q是辅助信息的集合,qr
i
和qv
i
分别代表第i组辅助信息中的关系和实体,并构成键值对(qr
i
,qv
i
)。
[0022]可选择地,所述S3包括:
[0023]S31:为所述多元关系事实集中各条超边的辅助信息的每个键值对引入相应的位置向量,得到每个键值对的向量表示;
[0024]S32:统计所述辅助信息中每个实体跨越超边的数量,计算跨越超边的实体所在的键值对的注意力值;
[0025]S33:以所述注意力值为权重将S31中得到的键值对的向量进行加权求和,得到多元关系事实集中各条超边的辅助信息的向量;
[0026]S34:将所述辅助信息的向量、头实体、主关系和尾实体的特征向量进行拼接,得到拼接后的特征向量组合;
[0027]S35:将所述拼接后的特征向量组合作为所述卷积神经网络的输入,利用所述卷积神经网络进行信息融合,得到各多元关系事实的向量表示。
[0028]可选择地,所述S31中,每个键值对的向量表示q
i
为:
[0029][0030]其中,q
i
表示辅助信息中第i组键值对的融合向量表示;q
ri
、q
vi
和q
li
分别表示第i组键值对的关系、实体和位置嵌入向量,表示融合计算且融合计算定义为:
[0031][0032]其中,a和b为维度相同的两个输入向量,将向量拆分为前后两部分分别得到[a
re
,a
im
]与[b
re
,b
im
]。...

【技术保护点】

【技术特征摘要】
1.一种基于图结构转化的知识超图补全方法,其特征在于,所述基于图结构转化的知识超图补全方法包括:S1:根据真实世界知识构造知识超图,获取实体和关系的初始化向量表示;S2:根据所述实体和关系的初始化向量表示以及所述知识超图,构造多元关系事实集;S3:利用卷积神经网络对多元关系事实集中各多元关系事实内部的实体和关系进行信息聚合,得到各多元关系事实的向量表示;S4:基于所述知识超图构造辅助图;S5:根据各所述多元关系事实的向量表示和所述辅助图,利用图神经网络汇聚所述知识超图的超边之间的上下文信息,得到汇聚后的新的超边向量;S6:根据所述汇聚后的新的超边向量,利用评分函数计算各多元关系事实成立的可能性,并确定得分最高的多元关系事实为补全结果。2.根据权利要求1所述的基于图结构转化的知识超图补全方法,其特征在于,所述S2包括:S21:随机替换所述知识超图的超边中部分实体或关系,以构造负样本超边;S22:根据所述负样本超边和未替换实体或关系的超边,得到多元关系事实集;其中,所述负样本超边和所述未替换实体或关系的超边均为所述多元关系事实集中的多元关系事实,每条多元关系事实以三元组+辅助键值对形式表示,视为一条主要信息和一些辅助信息的组合,表达公式为:Rel={s,r,o,Q={(qr
i
,qv
i
)}}其中,Rel是一条多元关系事实,s,r,o分别代表主三元组中的头实体、主关系和尾实体,Q是辅助信息的集合,qr
i
和qv
i
分别代表第i组辅助信息中的关系和实体,并构成键值对(qr
i
,qv
i
)。3.根据权利要求1所述的基于图结构转化的知识超图补全方法,其特征在于,所述S3包括:S31:为所述多元关系事实集中各条超边的辅助信息的每个键值对引入相应的位置向量,得到每个键值对的向量表示;S32:统计所述辅助信息中每个实体跨越超边的数量,计算跨越超边的实体所在的键值对的注意力值;S33:以所述注意力值为权重将S31中得到的键值对的向量进行加权求和,得到多元关系事实集中各条超边的辅助信息的向量;S34:将所述辅助信息的向量、头实体、主关系和尾实体的特征向量进行拼接,得到拼接后的特征向量组合;S35:将所述拼接后的特征向量组合作为所述卷积神经网络的输入,利用所述卷积神经网络进行信息融合,得到各多元关系事实的向量表示。4.根据权利要求3所述的基于图结构转化的知识超图补全方法,其特征在于,所述S31中,每个键值对的向量表示q
i
为:其中,q
i
表示辅助信息中第i组键值对的融合向量表示;q
ri
、q
v...

【专利技术属性】
技术研发人员:惠孛董寅闫科田玲罗胜尹张馨月
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1