一种基于动态图表示学习的科研论文合作预测方法技术

技术编号:39412241 阅读:11 留言:0更新日期:2023-11-19 16:03
本发明专利技术属于信息技术领域,具体涉及一种基于动态图表示学习的科研论文合作预测方法。本发明专利技术通过图卷积神经网络,捕获科研论文合作关系网络中的结构信息生成节点的嵌入向量;通过全连接神经网络,捕获表示科研论文合作关系网络中历史时间相关信息的边嵌入向量。然后融合这两种向量进行未来科研论文合作关系的预测,解决了训练过程中会逐渐丢失一部分历史信息的问题。由于没有使用循环神经网络这种序列式训练的方法,本发明专利技术方法对于节点、边嵌入向量的生成均为静态的训练方式,模型的训练效率大幅提升,且准确率更高。且准确率更高。且准确率更高。

【技术实现步骤摘要】
一种基于动态图表示学习的科研论文合作预测方法


[0001]本专利技术属于信息
,具体涉及一种基于动态图表示学习的科研论文合作预测方法。

技术介绍

[0002]随着科技发展的全球化以及研究问题的多元化、精细化和复杂化,科研合作成为学术成果产出的重要途径之一。把学者看作网络的节点,学者之间的合作关系如论文的发表看作网络的边,那么学者的科研合作行为就构成了典型的科研合作网络。分析学者的科研合作网络有助于理清学者合作现状,提升学者科研合作效率,促进学科资源融合,是一个重要的研究课题。科研合作网络具有较高的稀疏性,其关系预测能够在稀疏网络中,实现潜在合作者的精准推荐,从而增强不同学者之间的联系,提高网络密度,促进学科发展和知识传播,最终有效推动科研合作效率。
[0003]对于未来科研论文合作预测任务,可以将其看作动态图的链路预测,目前国内外关于动态图链路预测的文献中,主要是以图神经网络模型和循环神经网络模型相结合的方式,一方面利用图神经网络模型对各个时间段的子图进行图结构信息的捕获,另一方面利用循环神经网络模型对图的时间相关新信息进行捕获,比如EloveGCN等。这类方法通过利用循环神经网络,将前面子图的历史信息用于下一个子图嵌入向量的训练,会存在两个问题,第一上述训练过程中会逐渐丢失一部分历史信息;第二,该方式在训练的时,其存在的时序信息传递的过程,会导致训练效率低。

技术实现思路

[0004]本专利技术的目的在于针对上述现有技术中存在的不足,提供一种基于动态图表示学习的科研论文合作预测方法,解决了训练过程中会逐渐丢失一部分历史信息的问题,并提升了训练效率。
[0005]为达到上述专利技术目的,本专利技术采用的如下技术方案:
[0006]一种基于动态图表示学习的科研论文合作预测方法,包括以下步骤
[0007]S1、获取数据并对数据进行处理,得到初始邻接矩阵、初始特征向量、初始科研论文合作的历史信息向量;获取的数据包括科研论文合作网络原始邻接矩阵、原始特征向量以及科研论文合作的历史信息向量;
[0008]S2、将初始邻接矩阵A
T
和初始特征向量X
T
输入图卷积神经网络,通过图卷积神经网络得到节点嵌入向量;将初始科研论文合作历史信息向量输入全连接神经网络,通过全连接神经网络得到边嵌入向量;
[0009]S3、构建并训练科研论文合作关系预测模型;将S2得到的节点嵌入向量和边嵌入向量输入训练好的科研论文合作关系预测模型中,预测未来的科研论文合作情况。
[0010]进一步的,所述S1包括如下子步骤
[0011]S1.1、获取数据:
[0012]以科研论文合作的作者为节点,以科研论文合作关系为无向边,通过过去各个时段的子图,构建科研论文合作网络其中t是时间快照的数量,G
t
表示t时间段的子图,ε={E1,E2,...,E
t
},表示这一组连续图快照的边集,表示这一组连续快照的节点集;
[0013]采用表示一组连续图快照的邻接矩阵,则该邻接矩阵对应的节点属性矩阵为对于邻接矩阵,若在某个时间段科研工作者之间有合作,则其对应节点之间存在连接,邻接矩阵对应位置为1,否则为0;对于节点属性矩阵,则采用one

hot编码人为对每个节点设置属性向量;
[0014]S1.2、数据预处理:
[0015]对S1.1中的原始邻接矩阵集及其对应的属性矩阵集进行处理,得到初始邻接矩阵A
T
和初始特征向量X
T

[0016]利用S1.1中各子图快照的边集代表各时间段合作关系的存在情况,并以此生成初始的科研论文合作历史信息向量S0。
[0017]更进一步的,S1.2中初始科研论文合作历史信息向量生成方法为:
[0018]S1.2.1整合各时间段存在过的边的集合,
[0019]E
T
=E1∪E2∪

∪E
t
‑1[0020]S1.2.2对于任意边e
ab
∈E
T
时间序列向量S
ab
=[s
1 s2…
s
t
‑1],初始化方式如下:
[0021][0022]S0={S
e
|e∈E
T
}。
[0023]进一步的,所述S3按如下步骤训练科研论文合作关系预测模型:
[0024]S3.1、对最后一个时间段的科研论文合作情况进行1:1正负采样,正采样指存在边的结果集E
pos
,负采样指不存在边的结果集E
neg

[0025]建立科研论文合作关系预测模型,该预测模型采用如下公式表示:
[0026][0027]其中,e
ij
表示边,E
T
表示历史边集,S
ij
为S中边e
ij
对应的训练好的嵌入向量,z
i
和z
j
表示训练好的节点的嵌入向量矩阵Z中节点i和节点j的嵌入向量,表示控制节点嵌入向量信息与边的嵌入向量提供的时间相关信息的权重控制参数,λ∈[0,1],表示预测的边e
ij
未来时间段中的存在概率,sigmoid(*)表示sigmoid函数,sum(*)表示sum函数;
[0028]S3.2、根据S2得到的节点嵌入向量和边嵌入向量、S3.1建立的科研论文合作关系预测模型,预测最后一个时间段的科研论文合作概率;
[0029]S3.3、采用交叉熵损失函数作为损失函数,将S3.2得到的正负采样结果集引入交叉熵损失函数中,计算科研论文合作关系预测模型的损失,具体计算如公式如下:
[0030][0031]其中,p
e
代表边e是否存在,代表预测边e存在的概率;
[0032]S3.4、以损失函数最小为目标,采用梯度下降法和Adam优化器对科研论文合作关系预测模型进行训练;
[0033]S3.5、判断损失函数值是否收敛,若是,则训练完成,否则返回步骤S3.4。
[0034]进一步的,所述S3利用训练好的科研论文合作关系预测模型,预测未来的科研论文合作情况的具体操作为:
[0035]对S2.得到的训练后的节点向量和边嵌入向量进行融合,获得未来科研合作关系的存在概率
[0036]判断得到研论文合作关系的存在概率是否大于0.5,若是,则判定科研工作者i与科研工作者j在未来会有合作,若否,则二者未来没有合作。
[0037]进一步的,所述S2的图卷积申请网络为两层图卷积神经网络,每层的公式如下:
[0038]H
(k+1)
=σ(H
k
,A
T
|W
k
)=σ(D

1/2
A
T
D
1/2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态图表示学习的科研论文合作预测方法,其特征在于,包括以下步骤:S1、获取数据并对数据进行处理,得到初始邻接矩阵、初始特征向量、初始科研论文合作的历史信息向量;获取的数据包括科研论文合作网络原始邻接矩阵、原始特征向量以及科研论文合作的历史信息向量;S2、将初始邻接矩阵和初始特征向量输入图卷积神经网络,通过图卷积神经网络得到节点嵌入向量;将初始科研论文合作历史信息向量输入全连接神经网络,通过全连接神经网络得到边嵌入向量;S3、构建并训练科研论文合作关系预测模型;将S2得到的节点嵌入向量和边嵌入向量输入训练好的科研论文合作关系预测模型中,预测未来的科研论文合作情况。2.根据权利要求1所述的一种基于动态图表示学习的科研论文合作预测方法,其特征在于,所述S1包括如下子步骤:S1.1、获取数据:以科研论文合作的作者为节点,以科研论文合作关系为无向边,通过过去各个时段的子图,构建科研论文合作网络其中t是时间快照的数量,G
t
表示t时间段的子图,ε={E1,E2,

,E
t
},表示这一组连续图快照的边集,表示这一组连续快照的节点集;采用表示一组连续图快照的邻接矩阵,则该邻接矩阵对应的节点属性矩阵为对于邻接矩阵,若在某个时间段科研工作者之间有合作,则其对应节点之间存在连接,邻接矩阵对应位置为1,否则为0;对于节点属性矩阵,则采用one

hot编码人为对每个节点设置属性向量;S1.2、数据预处理:对S1.1中的原始邻接矩阵集及其对应的属性矩阵集进行处理,得到初始邻接矩阵A
T
和初始特征向量X
T
;利用S1.1中各子图快照的边集ε代表各时间段合作关系的存在情况,并以此生成初始的科研论文合作历史信息向量S0。3.根据权利要求2所述的一种基于动态图表示学习的科研论文合作预测方法,其特征在于,S1.2中初始科研论文合作历史信息向量生成方法为:整合各时间段存在过的边的集合:E
T
=E1∪E2∪

∪E
t
‑1对于任意边e
ab
∈E
T
时间序列向量S
ab
=[s
1 s2ꢀ…ꢀ
s
t
‑1],初始化方式如下:S0={S
e
|e∈E
T
}。4.根据权利要求1所述的一种基于动态图表示学习的科研论文合作预测方法,其特征在于,所述S3按如下步骤训练科研论文合作关系预测模型:S3.1、对最后一个时间段的科研论文合作情况进行1:1正负采样,正采样指存在边的结果集E
pos
,负采样指不存在边的结果集E
neg
;建立科研论文合作关系预测模型,该预测模型采用如下公式表示:
其中,e
ij
表示边,E
T
表示历史边集,S
ij
为S中边e
ij
对应的训练好的嵌入向量,z
i
和z
j
表示训练好的节点的嵌入向量矩阵Z中节点i和节点...

【专利技术属性】
技术研发人员:刘震李仲意
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1