System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于动态图模型的引用目的分析方法技术_技高网

一种基于动态图模型的引用目的分析方法技术

技术编号:40074311 阅读:6 留言:0更新日期:2024-01-17 00:46
本发明专利技术涉及动态图分析领域,具体公开了一种基于动态图模型的引用目的分析方法,本发明专利技术通过构建动态的异构图,异构图包含节点集合以及边集合,以学者的引用数量、论文发表数量以及h指数为节点集合中学者节点的节点特征,以论文的引用数量以及论文的标题为节点集合中论文节点的节点特征,通过自注意力机制构建一条元路径下的异构图,并引入图Transformer注意力网络解决节点聚合问题,利用自动学习方法解释基于元路径的不同语义的重要程度并进行聚合,并对学者及论文的引用类型进行分类,能够准确地对被引用的论文的目的进行分类,且不使用论文内引用处的具体文本作为特征,而使用论文的标题作为特征,简化了在真实系统中的使用难度。

【技术实现步骤摘要】

本专利技术涉及动态图分析领域,更具体地说,本专利技术涉及一种基于动态图模型的引用目的分析方法


技术介绍

1、图是一种数据结构,由一个实体集合和一个关系集合构成,图中的节点和边蕴含了大量的信息,长期以来对图的信息的挖掘一直吸引着大量的研究人员的投入。现实生活中,大量的信息都可以用图来表示,图中蕴含着丰富的依赖信息和节点信息。近些年随着如谷歌学术等大型学术数据库的发展以及完善,在图中进行专家发掘和高潜力学者的预测也吸引着越来越多的研究学者,学者的学术活动构成学术网络。在学术网络中一条引用可以构成一条边,链接为两个图中的论文节点,然而这存在着一个问题,即无法衡量引用链接的质量。如何衡量引用的质量成为一个挑战,现有方法往往通过文本特征来进行分析,许多研究致力于分析引用文本以评估引用的质量。

2、虽然现有技术能够不同程度地从文本和图的视角对引用目的进行分析,并在一定程度上取得了一些效果,但仍然存在一些值得关注的不足之处需要深入思考:(1)在考虑文本分析的算法时,通常必须获取完整的论文内容并对其进行详尽解析,然而现实环境中,这些方法常常会受到版权问题的严重制约,此外,对大量文档展开解析和标注相当耗费时间和精力,这使得这些方法在真实世界大规模引用分析的应用方面难以进一步推广和应用。(2)基于网络的方法有时会忽视时间因素的重要性,科技的发展速度日新月异,如果不充分考虑时间因素,将很难准确地衡量引用的目的和意图,因为某篇论文的引用背景和意义可能会随着时间的推移而发生显著变化,这一点的忽略将导致分析结果的偏差,从而影响对引用关系的深刻理解。基于以上两点设计一个基于动态异构图神经网络的引用分类方法,不依赖于具体的文本,而是依赖动态的异构网络来判断引用的目的,为了解决上述问题,现提供一种技术方案。


技术实现思路

1、为了克服现有技术的上述缺陷,本专利技术提供一种基于动态图模型的引用目的分析方法,通过构建动态的异构图,异构图包含节点集合以及边集合,以学者的引用数量、论文发表数量以及h指数为节点集合中学者节点的节点特征,以论文的引用数量以及论文的标题为节点集合中论文节点的节点特征,通过自注意力机制构建一条元路径下的异构图,并引入图transformer注意力网络解决节点聚合问题,利用自动学习方法解释基于元路径的不同语义的重要程度并进行聚合,并对学者及论文的引用类型进行分类,能够准确的对被引用的论文的目的进行分类,且不使用论文内引用处的具体文本作为特征,而使用论文的标题作为特征,简化了在真实系统中的使用难度,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:

3、一种基于动态图模型的引用目的分析方法,包括如下步骤:

4、步骤一,构建动态的异构图:异构图包含节点集合以及边集合,其中节点集合中包含学者和论文两类节点类型,边集合中包含引用以及发表两类边类型,且两节点之间的边包含时间信息;

5、步骤二,特征构造:以学者的引用数量、论文发表数量以及h指数为节点集合中学者节点的节点特征,以论文的引用数量以及论文的标题为节点集合中论文节点的节点特征;

6、步骤三,图神经网络:通过自注意力机制构建一条元路径下的异构图,并引入图transformer注意力网络解决节点聚合问题,利用自动学习方法解释基于元路径的不同语义的重要程度并进行聚合,并对学者及论文的引用类型进行分类。

7、作为本专利技术进一步的方案,步骤三的图神经网络的构建步骤为:

8、步骤q1,节点映射:设计一个节点特征的映射器,将不同的节点特征映射至相同的向量空间中,节点映射的公式为:

9、

10、式中:h′i为节点i映射后的节点特征,hi为节点i的原始特征,φi为节点i的节点类型,为φi的特征变换矩阵;

11、步骤q2,图transformer聚合:通过自注意力机制构建一条元路径下的异构图,并引入图transformer注意力网络解决节点聚合问题;

12、步骤q3,语义聚合:通过自动学习方法解释基于元路径的不同语义的重要程度,并进行聚合;

13、步骤q4,引用类型的分类:通过异构图学习论文节点的最终的嵌入向量,将给定的引用视为两个节点的链接预测人物,将涉及的两个节点特征进行拼接,通过一个全连接层以及softmax函数学习至k维向量中,k维向量用于预测引用类型。

14、作为本专利技术进一步的方案,步骤q2中图transformer聚合,通过自注意力机制构建一条元路径下的异构图,并引入图transformer注意力网络解决节点聚合问题,其中,每个异构图中的元路径都具备相匹配的注意力函数,注意力函数的公式为:

15、

16、式中:为着节点j对于节点i的重要程度,h′j为节点j的原始特征,φ为元路径,节点j为节点i的邻居节点;

17、通过softmax对注意力函数进行归一化得到基于元路径的注意力函数:

18、

19、式中:为基于元路径的注意力系数,n为节点个数。

20、作为本专利技术进一步的方案,利用自注意力机制构建了一条元路径下的异构图,将时间信息作为位置编码,并将节点特征与位置编码相加来建模时间信息,时间信息的公式为:

21、

22、式中:为节点i的时间信息,pi为节点i的位置编码。

23、作为本专利技术进一步的方案,通过聚合函数以及基于元路径的注意力系数,聚合节点i周围的节点信息,聚合节点信息的公式为:

24、h′=g(aggregate(a(a1(g)hw1t,…an(g)hwnt+b);

25、式中:h′为聚合节点信息,aggregate函数为聚合函数,h为节点的特征向量矩阵,a1(g),a2(g),…,an(g)为参数,w1,w1,…wn为权重矩阵,b为偏置项,g为激活函数,t为转置。

26、作为本专利技术进一步的方案,步骤q3语义聚合,通过自动学习的方法解释基于元路径的不同语义的重要程度,并进行聚合,通过图transformer注意力网络学到的基于元路径的语义节点向量嵌入表示作为输入,其中语义注意力的学习可以用以下公式来进行表示:

27、

28、式中:为不同元路径的注意力系数集,attnsem为语义层级的注意力神经网络,为基于元路径的语义节点向量嵌入表示,n为不同元路径的注意力系数的个数。

29、作为本专利技术进一步的方案,将基于元路径的语义节点嵌入表示进行非线性变化,通过计算变换过后的节点嵌入表示与目标论文的语义注意力向量q的相似度,衡量不同元路径的重要程度,元路径重要程度的计算公式为:

30、

31、式中:为元路径的重要程度,w为权重矩阵,b为偏移量,q为语义注意力向量,为非线性变化后的基于元路径的语义节点嵌入表示;

32、对元路径重要程度进行归一化得到不同元路径的重要性权重以及节点的最终嵌入向量:

3本文档来自技高网...

【技术保护点】

1.一种基于动态图模型的引用目的分析方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于动态图模型的引用目的分析方法,其特征在于,步骤三的图神经网络的构建步骤为:

3.根据权利要求2所述的一种基于动态图模型的引用目的分析方法,其特征在于,步骤Q2中图Transformer聚合,通过自注意力机制构建一条元路径下的异构图,并引入图Transformer注意力网络解决节点聚合问题,其中,每个异构图中的元路径都具备相匹配的注意力函数,注意力函数的公式为:

4.根据权利要求3所述的一种基于动态图模型的引用目的分析方法,其特征在于,利用自注意力机制构建了一条元路径下的异构图,将时间信息作为位置编码,并将节点特征与位置编码相加来建模时间信息,时间信息的公式为:

5.根据权利要求3所述的一种基于动态图模型的引用目的分析方法,其特征在于,通过聚合函数以及基于元路径的注意力系数,聚合节点i周围的节点信息,聚合节点信息的公式为:

6.根据权利要求2所述的一种基于动态图模型的引用目的分析方法,其特征在于,步骤Q3语义聚合,通过自动学习的方法解释基于元路径的不同语义的重要程度,并进行聚合,通过图Transformer注意力网络学到的基于元路径的语义节点向量嵌入表示作为输入,其中语义注意力的学习可以用以下公式来进行表示:

7.根据权利要求6所述的一种基于动态图模型的引用目的分析方法,其特征在于,将基于元路径的语义节点嵌入表示进行非线性变化,通过计算变换过后的节点嵌入表示与目标论文的语义注意力向量q的相似度,衡量不同元路径的重要程度,元路径重要程度的计算公式为:

...

【技术特征摘要】

1.一种基于动态图模型的引用目的分析方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于动态图模型的引用目的分析方法,其特征在于,步骤三的图神经网络的构建步骤为:

3.根据权利要求2所述的一种基于动态图模型的引用目的分析方法,其特征在于,步骤q2中图transformer聚合,通过自注意力机制构建一条元路径下的异构图,并引入图transformer注意力网络解决节点聚合问题,其中,每个异构图中的元路径都具备相匹配的注意力函数,注意力函数的公式为:

4.根据权利要求3所述的一种基于动态图模型的引用目的分析方法,其特征在于,利用自注意力机制构建了一条元路径下的异构图,将时间信息作为位置编码,并将节点特征与位置编码相加来建模时间信息,时间信息的公式为:

5...

【专利技术属性】
技术研发人员:吴贻清张钊庄福振徐勇军
申请(专利权)人:中科厦门数据智能研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1