【技术实现步骤摘要】
一种基于多相似度融合的科研合作者推荐方法
[0001]本专利技术属于社交网络分析
,尤其涉及一种基于多相似度融合的科研合作者推荐方法。
技术介绍
[0002]随着计算机科学技术的不断发展,人类随之进入大数据时代,海量的学术数据(论文、专利、期刊会议等)出现在互联网上,大量的学术实体和学术关系构成了复杂而庞大的学术网络,在各个学科领域建立科学有效的合作变得比以往任何时候都更具有挑战,科研人员通常很难找到和自己最匹配的合作者。随着各类学科的发展,科研工作者之间的合作变得越来越重要,学者之间合作的质量往往也决定了最终科研成果的质量,可以说没有科研人员之间的合作就无法取得如今众多的科学成果。但通常科研人员很难在大量的学术数据中找到和自己最匹配的合作者,而且传统的合作方式不仅效率低下,还浪费了学者们大量的时间和精力。因此,近年来对科研合作者的推荐得到了广泛的研究,如果能够帮助学者推荐和自己研究领域相近的其他科研人员,这将会提高最终科研成果的质量,合作的效率也会进一步提高,并且能够加快科研的进度。
技术实现思路
[ ...
【技术保护点】
【技术特征摘要】
1.一种基于多相似度融合的科研合作者推荐方法,其特征在于,步骤如下:步骤1:对DBLP引文网络数据集进行预处理,构建学术合作网络,节点代表学者,有合作关系的学者之间用边相连;步骤2:计算学者间的合作关系相似度,计算公式如下:其中,和分别代表学者a
m
和a
n
发表论文的总数量,是论文p
i
的发表年份,是两名学者第一篇合著论文的发表年份,t
c
是当前的年份;是两名学者合著论文的总数量;步骤3:使用Doc2vec模型计算学者之间论文摘要的内容相似度,从而得到学者间的研究领域相似度;步骤4:计算学者间的学术水平相似度;利用余弦相似度来计算两个学者学术水平特征向量之间的相似性,计算公式如下:其中,L
m
和L
n
分别为学者a
m
和a
n
的学术水平特征向量;步骤5:将合作关系相似度、研究领域相似度以及学术水平相似度三个维度进行线性组合,作为学术合作网络中边的权重,其公式如下:W(a
m
,a
n
)=α
×
C(a
m
,a
n
)+β
×
R(a
m
,a
n
)+γ
×
A(a
m
,a
n
)其中,C(a
m
,a
n
)表示两个科研工作者和之间的合作关系相似度,R(a
m
,a
n
)表示两个科研工作者之间的研究领域相似度,A(a
m
,a
n
)表示科研工作者之间的学术水平相似度,α、β、γ为权重参数,且α+β+γ=1;步骤6:将待推荐的学者作为目标节点,在学术网络上进行随机游走,直至各个节点的分数趋于稳定状态,将所有的分值进行降序排序,然后取TOPN的学者推荐给目标学者。2.根据权利要求1所述的一种基于多相似度融合的科研合作者推荐方法,其特征在于,步骤3具体包括以下步骤:3.1)对论文摘要构成的语料库进行数据预处理,包括大小写转换、拼写错误检查、去...
【专利技术属性】
技术研发人员:万良田,吴海南,孙璐,孔祥杰,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。