一种基于科学合作异质网络分析的作者会议推荐方法技术

技术编号:29757467 阅读:11 留言:0更新日期:2021-08-20 21:10
本发明专利技术公开了一种基于科学合作异质网络分析的作者会议推荐方法,包括以下步骤:获取科学合作数据,构建异质科学合作网络;在所述的异质科学合作网络上进行邻居节点采样;对采样的邻居节点进行邻居信息聚合;在所述的异构科学合作网络上进行训练,学习得到异质网络表示;计算作者节点的表示向量和会议节点的表示向量的相似度;根据所述的相似度,向作者推荐与该作者相似度大的会议。本发明专利技术方法在科学合作网络中的针对作者推荐相应的会议和预测作者来会在相应的会议上发表文章都具有较好的效果。

【技术实现步骤摘要】
一种基于科学合作异质网络分析的作者会议推荐方法
本专利技术属于社会网络科学
,涉及一种基于科学合作异质网络分析的作者会议推荐方法。
技术介绍
在现实世界中,个体之间的联系是普遍存在的,这些复杂的联系都可以用不同形式的网络(社交网络、引文网络、蛋白质分子作用网络、电力网络等)进行描述。作为一种常见的数据载体,网络形式的数据存在于社会的各个方面,深度挖掘网络中的有意义信息,具有非常高的学术价值和潜在应用价值。各种网络的结构、形态虽然复杂多样,但是其基本组件都是节点与连边,因此对复杂网络的分析和研究,具有普适性意义。由于网络包含大量节点和连边,因此获取每个节点在网络上的所有状态信息的时间消耗极大。网络嵌入(NetworkEmbedding)旨在找到一种映射函数,该函数将网络中的每个节点的结构和属性特征转换为低维度的潜在表示。图形神经网络作为一种强大的图形数据深度表示学习方法,在网络分析方面表现出了优异的性能,也引起了研究者的广泛关注。通过监督学习或非监督学习,算法挖掘网络的结构和属性信息,并将其转化为低维度的节点向量,进而应用到节点分类、节点聚类、链路预测等下游任务中去。虽然已经有很多图神经网络的方法被提出,但是主要的研究仍然集中在同质网络中,即网络中的每个节点属于同样的类型。然而,更多的真实网络的表现形式是异质图结构。异质图网络包含了丰富的结构信息和属性信息,其节点和连边均有多种不同的类型。然而,目前的网络表示研究中,仍然有一个关键问题:如何将目标节点的邻居的信息聚合在一起。大多数的图神经网络将节点的邻居定义为其直接相连的节点,并通过多层嵌套将距离大于2的邻居信息迭代聚合。有些方法通过随机游走拓展节点的邻居空间,并将路径上的节点都视为其邻居节点。这些方法都忽视了异质网络中连边是异质的,异质连边的组合本身具有特定的含义。科学合作网络科学家之间的交互合作是科学实践中长期存在的现象,研究过程的大多数阶段都存在着相当数量的沟通活动。科学的众多门类之间相互交叉渗透,现已发展成为一个结构复杂的大科学系统,科学家之间在相互交谈、写作、阅读论文和信件等过程中,不仅对研究结果和信息进行沟通,也常常一起合作产生或报告他们的研究结果。随着科学社会化程度的提高,科学研究中的合作也愈加频繁,其已逐步成为影响科学发展能力不可忽视的一股社会力量。科学合作网络显然在很大程度上是由科学家们组织的,同时大量的科技政策动议也促进了科学上的合作。当一篇科技文档由两个以上的作者完成时,本实施例说这些作者之间存在科学合作关系。在科学合作网络中,节点是作者,如果两个作者之间存在一篇以上的合著论文,则他们之间存在一个连接。科学合作网络是一类重要的社会网络,已经广泛地被用来判定科学合作的结构以及单个研究者的地位。研究科学合作网络未来可能存在的合作关系对于促进科学研发,形成团队优势,寻找优势平台等都具有非常重要的意义。
技术实现思路
本专利技术中涉及的一种基于科学合作异质网络分析的作者会议推荐方法,其技术方案如下。一种基于科学合作异质网络分析的作者会议推荐方法,包括以下步骤:步骤1,获取科学合作数据,构建异质科学合作网络;步骤2,在所述的异质科学合作网络上进行邻居节点采样;步骤3,对采样的邻居节点进行邻居信息聚合;步骤4,在所述的异质科学合作网络上进行训练,学习得到异质网络表示;步骤5,计算作者节点的表示向量和会议节点的表示向量的相似度;步骤6,根据所述的相似度,向作者推荐与该作者相似度大的会议;具体地,所述的异质科学合作网络表示为G=(V,E,A,R),中V表示节点集合,E表示连边集合,所述的节点与连边分别存在映射和,其中A表示节点类型集合,包括作者类型、论文类型和会议类型,R表示连边类型集合,包括作者-写-论文类型,论文-引用-论文类型和论文-发表-会议类型;所述的邻居节点采样是基于元路径的,所述的元路径是定义在图G=(V,E,A,R)上的一条路径,表示为以下形式:,定义了节点A1和Ak+1之间的复合关系R=R1oR2o…oRk,其中o表示关系间复合运算,这条元路径表示A1和Ak+1通过k+1个节点和k条连边形成的语义信息被连接在一起。更进一步地,所述的邻居节点采样包括以下步骤,步骤201,对所述的异质科学合作网络的节点进行直接属性和间接属性聚合,步骤202,对所述的异质科学合作网络的节点进行直接邻居和间接邻居采样;所述的直接属性是节点本身具有的属性,所述的间接属性则是从异质科学合作网络中的相互关系中获得的额外属性,是对直接属性的补充;论文节点的直接属性包括论文标题、论文摘要和预训练结构嵌入,论文节点的间接属性包括录取会议的结构嵌入、论文作者的结构嵌入、引用文献的结构嵌入及引用文献的标题向量;作者节点的直接属性包括作者节点的结构嵌入,作者节点的间接属性是作者撰写论文的标题和摘要的向量表示;会议节点的直接属性包括会议节点的结构嵌入,会议节点的间接属性包括会议录取论文的标题和摘要的向量表示;所述的直接邻居是目标节点在异质科学合作网络中通过连边直接相连的邻居节点,间接邻居是目标节点在异质科学合作网络中通过元路径相连的邻居节点。优选地,所述的直接属性和间接属性聚合采用BiLSTM聚合,然后再进行均值池化,获得具有表达能力的da维度初始特征向量,xi是通过BiLSTM获得的特征向量,表示向量维度为da×1维。更进一步地,所述的邻居信息聚合包括,步骤301,对同类采样邻居进行同质信息聚合,步骤302,对不同类型邻居采用注意力机制进行异质信息聚合;所述的同质信息聚合首先采用BiLSTM对采样邻居的信息向量进行聚合,然后经过均值池化,得到特定类型的信息聚合向量;所述的异质信息聚合中采用自注意力机制学习异质类型的聚合权重。优选地,在所述的同质信息聚合的BiLSTM中,通过将前向LSTM输出序列和后向LSTM的输出序列拼接来发现要素之间的顺序关联,节点m的i类型邻居的d维度的输出向量由下式获得:其中,为拼接操作,表示节点m的邻居节点集合,表示节点j由双向LSTM获得的前向表示向量,表示节点j由双向LSTM获得的后向表示向量,和由通过LSTM获得:其中,f,i,o分别是遗忘门、输入门、输出门,W,b为可学习参数,d=2da,表示激活函数sigmoid,xj表示通过BiLSTM获得的特征向量;所述的注意力机制的信息聚合中,给定类型目标节点和聚合向量,相应的注意力和自注意力系数为其中,为拼接操作,xk表示通过BiLSTM获得的特征向量,为可学习的注意力参数,为可学习的自注意力参数,表示节点类型l的自注意力参数向量的转置,节点类型为l的基于类型的聚合向量,为激活函数LeakyRelu,k类型节点的聚合向量为:注意力机制模型独立重复n次,并将学习到的嵌入的均值作为最终的聚合向量:其中,表示k类型节本文档来自技高网
...

【技术保护点】
1.一种基于科学合作异质网络分析的作者会议推荐方法,其特征在于,包括以下步骤:/n步骤1,获取科学合作数据,构建异质科学合作网络;/n步骤2,在所述的异质科学合作网络上进行邻居节点采样;/n步骤3,对采样的邻居节点进行邻居信息聚合;/n步骤4,在所述的异质科学合作网络上进行训练,学习得到异质网络表示;/n步骤5,计算作者节点的表示向量和会议节点的表示向量的相似度;/n步骤6,根据所述的相似度,向作者推荐与该作者相似度大的会议;/n所述的异质科学合作网络表示为

【技术特征摘要】
1.一种基于科学合作异质网络分析的作者会议推荐方法,其特征在于,包括以下步骤:
步骤1,获取科学合作数据,构建异质科学合作网络;
步骤2,在所述的异质科学合作网络上进行邻居节点采样;
步骤3,对采样的邻居节点进行邻居信息聚合;
步骤4,在所述的异质科学合作网络上进行训练,学习得到异质网络表示;
步骤5,计算作者节点的表示向量和会议节点的表示向量的相似度;
步骤6,根据所述的相似度,向作者推荐与该作者相似度大的会议;
所述的异质科学合作网络表示为G=(V,E,A,R),中V表示节点集合,E表示连边集合,所述的节点与连边分别存在映射和,其中A表示节点类型集合,包括作者类型、论文类型和会议类型,R表示连边类型集合,包括作者-写-论文类型,论文-引用-论文类型和论文-发表-会议类型;
所述的邻居节点采样是基于元路径的,所述的元路径是定义在图G=(V,E,A,R)上的一条路径,表示为以下形式:,定义了节点A1和Ak+1之间的复合关系R=R1oR2o…oRk,其中o表示关系间复合运算,这条元路径表示A1和Ak+1通过k+1个节点和k条连边形成的语义信息被连接在一起。


2.根据权利要求1所述的一种基于科学合作异质网络分析的作者会议推荐方法,其特征在于,所述的邻居节点采样包括以下步骤,步骤201,对所述的异质科学合作网络的节点进行直接属性和间接属性聚合,步骤202,对所述的异质科学合作网络的节点进行直接邻居和间接邻居采样;
所述的直接属性是节点本身具有的属性,所述的间接属性则是从异质科学合作网络中的相互关系中获得的额外属性,是对直接属性的补充;论文节点的直接属性包括论文标题、论文摘要和预训练结构嵌入,论文节点的间接属性包括录取会议的结构嵌入、论文作者的结构嵌入、引用文献的结构嵌入及引用文献的标题向量;作者节点的直接属性包括作者节点的结构嵌入,作者节点的间接属性是作者撰写论文的标题和摘要的向量表示;会议节点的直接属性包括会议节点的结构嵌入,会议节点的间接属性包括会议录取论文的标题和摘要的向量表示;
所述的直接邻居是目标节点在异质科学合作网络中通过连边直接相连的邻居节点,间接邻居是目标节点在异质科学合作网络中通过元路径相连的邻居节点。


3.根据权利要求2所述的一种基于科学合作异质网络分析的作者会议推荐方法,其特征在于,所述的直接属性和间接属性聚合采用BiLSTM聚合,然后再进行均值池化,获得具有表达能力的da维度初始特征向量,xi是通过BiLSTM获得的特征向量,表示向量维度为da×1维。


4.根据权利要求2或3所述的一种基于科学合作异质网络分析的作者会议推荐方法,其特征在于,所述的邻居信息聚合包括,步骤301,对同类采样邻居进行同质信息聚合,步骤302,对不同类型邻居采用注意力机制进行异质信息聚合;
所述的同质信息聚合首先采用BiLSTM对采样邻居的信息向量进行聚合,然后经过均值池化,得到特定类型的信息聚合向量;
所述的异质信息聚合中采用自注意力机制学习异质类型的聚合权重。


5.根据权利要求4所述的一种基于科学合作异质网络分析的...

【专利技术属性】
技术研发人员:黄金才许乃夫马扬梁星星程光权冯旸赫刘忠黄红蓝
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1