基于转移矩阵的链接预测方法、系统和可读存储介质技术方案

技术编号:37964178 阅读:10 留言:0更新日期:2023-06-30 09:39
本发明专利技术公开的一种基于转移矩阵的链接预测方法、系统和可读存储介质,其中方法包括:基于预设的知识图谱进行子图采样得到子图样本;获取子图样本的随机游走画像以计算随机游走转移矩阵;将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新;基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征;基于所述目标特征结合更新后的随机游走画像获取目标链接以完成链接预测作业。本发明专利技术可以有效改善高频共现的节点之间目标链接被错误地预测为真的问题,同时转移矩阵和随机游走画像具有很强的可解释性。性。性。

【技术实现步骤摘要】
基于转移矩阵的链接预测方法、系统和可读存储介质


[0001]本专利技术涉及知识图谱以及自然语言处理
,更具体的,涉及一种基于转移矩阵的链接预测方法、系统和可读存储介质。

技术介绍

[0002]知识图谱是对现实世界的数据映射,例如蛋白质的互作用、社交网络等。由于被观察和收集到的数据始终只是现实世界的其中一部分,因此知识图谱的一个核心问题就是解决链接的缺失,也就是链接预测(Link Prediction)问题。
[0003]现有的实现方式往往基于启发式的算法:基于两个节点共同的临近节点信息来判断目标链接是否应该存在。启发式算法有一个很强的假设,路径上节点的权重和路径长度直接相关,距离目标链接越远的节点,对目标链接的影响越小。这种启发式算法不容易转化为知识图谱的节点特征和边特征。
[0004]因此图神经网络的编码方式开始成为主流,使用图神经网络做链接预测有两种策略,一种是用打分函数对目标链接的头尾实体进行评估,另一种是对目标链接所在的子图整体做子图分类。尽管如此,当前对于池化层的权重设置,以及转移矩阵的概率更新仍然有很大的提升空间。当前的池化层权重虽然由训练得来,但没有考虑在不同的拓扑层级下,应该有不同的权重变化;当前的转移矩阵由节点的度数和对目标链接的重要性权重相乘得来,是一个固定值,也不能体现在拓扑层次变化后,重要度产生的变化。

技术实现思路

[0005]本专利技术的目的是提供一种基于转移矩阵的链接预测方法、系统和可读存储介质,可以有效改善高频共现的节点之间目标链接被错误地预测为真的问题,同时转移矩阵和随机游走画像具有很强的可解释性。
[0006]本专利技术第一方面提供了一种基于转移矩阵的链接预测方法,包括以下步骤:
[0007]基于预设的知识图谱进行子图采样得到子图样本;
[0008]获取子图样本的随机游走画像以计算随机游走转移矩阵;
[0009]将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新;
[0010]基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征;
[0011]基于所述目标特征结合更新后的随机游走画像获取目标链接以完成链接预测作业。
[0012]本方案中,所述基于预设的知识图谱进行子图采样得到子图样本,具体包括:
[0013]获取所述知识图谱G
O
=(V,E
O
),其中,V是节点集合,E
O
是观测到的链接集合;
[0014]基于所述知识图谱进行k跳子图采样得到子图样本G(V,E),其中,E是子图链接集合。
[0015]本方案中,所述获取子图样本的随机游走画像以计算随机游走转移矩阵,具体包括:
[0016]基于节点集合V识别子图样本中的节点Z,将节点Z编码为边权重;
[0017]获取两个节点Z的关联编码ω
x,y
,其中,
[0018][0019]其中,{x,t}∈E,Z
x
和Z
y
为节点x和y的向量表示,Q
θ
和K
θ
是两个多层感知机MLPs,F

是MLPs输出的向量维度;
[0020]计算随机游走转移矩阵P=(P
x,y
),其中,
[0021][0022]其中,N(x)表示x节点的邻接节点集合,ω
x,z
表示节点x和z的关联编码;
[0023]基于拓扑层级计算转移矩阵的特征集合以获取跳场景时节点i到节点j进行随机游走的转移概率,其中,j进行随机游走的转移概率,其中,为跳限值。
[0024]本方案中,所述将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新,具体包括:
[0025]基于图神经网络f
θ
对子图样本G进行特征提取,以得到节点Z;
[0026]基于图神经网络f
θ
更新所述随机游走转移矩阵,得到更新后的随机游走矩阵P=AttentionCoefficients
θ
(Z,G);
[0027]基于转移矩阵的特征集合提取目标链接相关量进行向量表示。
[0028]本方案中,所述基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征,具体包括:
[0029]基于更新后的转移矩阵获取节点级特征基于更新后的转移矩阵获取节点级特征
[0030]基于更新后的转移矩阵获取链接级特征基于更新后的转移矩阵获取链接级特征
[0031]基于更新后的转移矩阵获取子图级特征
[0032]本方案中,所述方法还包括提取高阶拓扑结构的注意力权重,通过注意力权重反复迭代转移矩阵,直至迭代次数完成后得到最终的转移矩阵。
[0033]本专利技术第二方面还提供一种基于转移矩阵的链接预测系统,包括存储器和处理器,所述存储器中包括基于转移矩阵的链接预测方法程序,所述基于转移矩阵的链接预测方法程序被所述处理器执行时实现如下步骤:
[0034]基于预设的知识图谱进行子图采样得到子图样本;
[0035]获取子图样本的随机游走画像以计算随机游走转移矩阵;
[0036]将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图
神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新;
[0037]基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征;
[0038]基于所述目标特征结合更新后的随机游走画像获取目标链接以完成链接预测作业。
[0039]本方案中,所述基于预设的知识图谱进行子图采样得到子图样本,具体包括:
[0040]获取所述知识图谱G
O
=(V,E
O
),其中,V是节点集合,E
O
是观测到的链接集合;
[0041]基于所述知识图谱进行k跳子图采样得到子图样本G=(V,E),其中,E是子图链接集合。
[0042]本方案中,所述获取子图样本的随机游走画像以计算随机游走转移矩阵,具体包括:
[0043]基于节点集合V识别子图样本中的节点Z,将节点Z编码为边权重;
[0044]获取两个节点Z的关联编码ω
x,y
,其中,
[0045][0046]其中,{x,y}∈E,Z
x
和Z
y
为节点x和y的向量表示,Q
θ
和K
θ
是两个多层感知机MLPs,F

是MLPs输出的向量维度;
[0047]计算随机游走转移矩阵P=(P
x,y
),其中,...

【技术保护点】

【技术特征摘要】
1.一种基于转移矩阵的链接预测方法,其特征在于,包括以下步骤:基于预设的知识图谱进行子图采样得到子图样本;获取子图样本的随机游走画像以计算随机游走转移矩阵;将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新;基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征;基于所述目标特征结合更新后的随机游走画像获取目标链接以完成链接预测作业。2.根据权利要求1所述的一种基于转移矩阵的链接预测方法,其特征在于,所述基于预设的知识图谱进行子图采样得到子图样本,具体包括:获取所述知识图谱G
O
=(V,E
O
),其中,V是节点集合,E
O
是观测到的链接集合;基于所述知识图谱进行k跳子图采样得到子图样本G=(V,E),其中,E是子图链接集合。3.根据权利要求2所述的一种基于转移矩阵的链接预测方法,其特征在于,所述获取子图样本的随机游走画像以计算随机游走转移矩阵,具体包括:基于节点集合V识别子图样本中的节点Z,将节点Z编码为边权重;获取两个节点Z的关联编码ω
x,y
,其中,其中,{x,y}∈E,Z
x
和Z
y
为节点x和y的向量表示,Q
θ
和K
θ
是两个多层感知机MLPs,F

是MLPs输出的向量维度;计算随机游走转移矩阵P=(P
x,y
),其中,其中,N(x)表示x节点的邻接节点集合,ω
x,z
表示节点x和z的关联编码;基于拓扑层级计算转移矩阵的特征集合以获取跳场景时节点i到节点j进行随机游走的转移概率,其中,随机游走的转移概率,其中,为跳限值。4.根据权利要求3所述的一种基于转移矩阵的链接预测方法,其特征在于,所述将所述随机游走画像输入到链接分类器中进行计算,基于所述链接分类器中的图神经网络对所述随机游走转移矩阵以及所述随机游走画像进行更新,具体包括:基于图神经网络f
θ
对子图样本G进行特征提取,以得到节点Z;基于图神经网络f
θ
更新所述随机游走转移矩阵,得到更新后的随机游走矩阵P;基于转移矩阵的特征集合提取目标链接相关量进行向量表示。5.根据权利要求4所述的一种基于转移矩阵的链接预测方法,其特征在于,所述基于更新后的转移矩阵获取目标特征,其中,所述目标特征包括节点级特征、链接级特征以及子图级特征,具体包括:
基于更新后的转移矩阵获取节点级特征基于更新...

【专利技术属性】
技术研发人员:张广志成立立于笑博
申请(专利权)人:北京融信数联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1