基于图局部结构和文本语义相似性的学术论文推荐方法技术

技术编号：26689777 阅读：14 留言：0更新日期：2020-12-12 02:39

本发明专利技术公开了一种基于图局部结构和文本语义相似性的学术论文推荐方法。本方法为：1)基于论文库中论文的关键词、机构、作者特征构建包含论文和论文关系的异质网络；2)对于论文p

全部详细技术资料下载

【技术实现步骤摘要】
基于图局部结构和文本语义相似性的学术论文推荐方法
本专利技术涉及文本数据挖掘，图数据挖掘，神经网络，异质网络嵌入
，文本预训练模型
，具体是一种基于异质网络图局部结构和学术论文标题和摘要语义相似性的学术论文推荐技术。
技术介绍
近年来，随着互联网技术的高速发展,学术研究领域也发生着翻天覆地的变化,网络上学术论文的数量呈爆炸式增长。科研信息过载使得研究人员在网络上查找其所需要的学术论文信息时,往往需要花费大量的时间和精力,间接造成了科研浪费。因此如何快速、准确的为研究人员找到其感兴趣的学术论文信息成为亟待解决的问题。目前，推荐系统在电子商务、新闻和社交网络等领域有着广泛的应用，与传统的基于关键词的搜索技术相比，推荐系统对于海量数据更加有效和个性化。特别是在学术领域，一些研究人员不知道如何总结他们的需求，将导致输入不适当的关键词。相比之下，学术论文推荐系统通常会考虑研究者的兴趣、合著者关系和引用关系来设计推荐算法并提供推荐列表。随着信息技术的快速发展,科研信息服务平台已经广泛出现，这些平台包含了大量论文及其相关信息，例如论文名、摘要、关键词、作者、机构、引用关系等。因此，利用这些科研信息服务平台的数据库中的重要信息可以开发出高效的学术论文推荐系统，帮助研究人员快速检索到他们感兴趣或者领域相关的论文。目前已经有很多研究者针对学术论文推荐问题提出了解决方法，这些方法主要包括：针对一篇论文和它的候选论文，通过它们的关键词计算它们之间的相似性，相似性排序后，高相似性的论文将被推荐给用户；基于论文库构建一个图，其中作者...

【技术保护点】
1.一种基于图局部结构和文本语义相似性的学术论文推荐方法，其步骤包括：/n1)基于论文库中论文的关键词、机构、作者特征构建包含论文和论文关系的异质网络；/n2)对于一篇拟进行相似推荐的论文p

【技术特征摘要】
1.一种基于图局部结构和文本语义相似性的学术论文推荐方法，其步骤包括：
1)基于论文库中论文的关键词、机构、作者特征构建包含论文和论文关系的异质网络；
2)对于一篇拟进行相似推荐的论文pi，基于该异质网络计算与该论文pi有关联的论文相似度，基于论文相似度选取多个论文形成一推荐结果候选集；
3)对该异质网络进行基于设定元路径的随机游走策略生成包含论文id的路径集，并利用该路径集作为训练语料库训练得到论文库中每一论文的关系表征向量；
4)利用该论文库中论文的标题、摘要中的文本信息，使用文本预训练模型训练得到对应论文的语义表征向量；
5)将论文的关系表征向量和论文的语义表征向量加权求和，得到对应论文的最终表征向量；将该论文pi加入到该论文库中并生成该论文pi的最终表征向量；
6)计算该论文库中每一论文的最终表征向量与该论文pi的最终表征向量的相似性，并根据所得相似性选取多个论文作为该论文pi的待推荐候选论文；
7)将步骤2)所得推荐结果候选集与步骤6)所得待推荐候选论文进行融合，选取相似性最高的若干论文作为该论文pi的推荐论文。

2.如权利要求1所述的方法，其特征在于，形成所述推荐结果候选集的方法为：对于一篇拟进行相似推荐的论文pi，基于该异质网络找到与该论文pi存在关联边的论文pj，利用计算论文pi与论文pj的相似性Sij；其中，论文pi和论文pj在作者维度的相似性，为论文pi和论文pj在机构维度的相似性，为论文p...

【专利技术属性】
技术研发人员：杜一，宁致远，乔子越，周园春，
申请(专利权)人：中国科学院计算机网络信息中心，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人