【技术实现步骤摘要】
一种基于作者著作树和图神经网络的论文合作者推荐方法
本专利技术主要涉及实体消歧,异质网络嵌入
,词向量嵌入
,具体是一种基于作者著作树和图神经网络的论文合作者推荐方法。
技术介绍
现代科学出现了综合化、交叉化的新趋势,单人完成科研活动正变得越来越困难,科研协作显得尤为重要。科研协作可以促进科研人员之间的交流、实现科研资源的整合和高效利用。因此,寻求合作者是科研工作者的重要学术活动之一,因为合适的合作者会有助于提升科研效率、科研创新能力和科研质量。对于科研人员来说,如何快速、高质量的找到合适的科研合作者成为目前亟待解决的一个问题。另一方面,随着我国高校科研管理信息化建设的不断推进,积累了丰富的科研数据资源,如何发掘并利用已有科研管理数据资源来解决这一问题是一个值得探讨的课题。随着信息技术的快速发展,科研平台已经广泛出现,并且吸引了大量的研究人员通过虚拟社区来开展科研合作。在这些科研平台上,研究者们可以发布自己的研究成果,浏览其他学者的公开信息,跟踪同行学者的科研进展,寻求潜在的合作机会。然而随着学术数据的大量增长, ...
【技术保护点】
1.一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:/n1)对于数据库中的每一个作者,收集该作者所著的论文并提取所收集论文中的关键词信息,构建该作者的著作树;/n2)对每个作者的著作树,基于图神经网络模型构建该作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;/n3)从该数据库中抽取出所有合作过的作者对集合,然后根据信息传播模型和交叉熵损失函数训练信息传播模型的参数,优化各初始表征向量,得到各作者最终的表征向量;/n4)对于一需要推荐合作者的论文A,遍历该数据库获取与该论文A的作者未曾合作过的作者集合N ...
【技术特征摘要】
1.一种基于作者著作树和图神经网络的论文合作者推荐方法,其步骤包括:
1)对于数据库中的每一个作者,收集该作者所著的论文并提取所收集论文中的关键词信息,构建该作者的著作树;
2)对每个作者的著作树,基于图神经网络模型构建该作者著作树的信息传播模型,将著作树上的论文信息和关键词信息传播到作者节点中,编码出对应作者初始的表征向量;
3)从该数据库中抽取出所有合作过的作者对集合,然后根据信息传播模型和交叉熵损失函数训练信息传播模型的参数,优化各初始表征向量,得到各作者最终的表征向量;
4)对于一需要推荐合作者的论文A,遍历该数据库获取与该论文A的作者未曾合作过的作者集合N;然后比较该作者A最终的表征向量与该作者集合N中每一作者最终的表征向量的余弦相似度,根据余弦相似度计算结果为该论文A的作者推荐论文合作者。
2.如权利要求1所述的方法,其特征在于,所述信息传播模型为其中ai代表著作树中作者的表征向量,pi代表著作树中论文的表征向量,ti代表著作树中关键词的表征向量;所述信息传播模型的传播方法为:首先任一与表征向量为pi的论文节点相连的关键词节点将自身的表征向量ti的信息传递给该论文节点,论文节点整合自身的信息和其所有关键词信息生成新的隐层表征向量p′i;然后任一与表征向量为ai的作者节点相连的论文节点将自身的隐层表征向量p′i的信息传递给该论文节点,作者节点整合自身的信息和其所有论文信息生成了作者的表征向量a′i;其中N(pi)表示所有与表征向量为pi的论文节点相连的关键词节点的表征向量的集合,W1是论文向自身传播信息所使用的传播矩阵,W2是关键词向论文传播信息所使用的传播矩阵,ReLU()为激活函数,N(ai)表示所有与表征向量为ai的作者节点相连的论文节点的隐层表征向量的集合,W3是作者向自身传播信息所使用的传播矩阵,W...
【专利技术属性】
技术研发人员:杜一,乔子越,周园春,宁致远,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。