【技术实现步骤摘要】
科研社群划分及核心学者发现方法、系统、介质及终端
本专利技术属于科研学者分类
,特别是涉及一种科研社群划分及核心学者发现方法、系统、介质及终端。
技术介绍
近几年,国家计划对科研及科研人才重视程度逐步增加,每个重大科研成果背后是诸多科研学者合作的结果,例如论文、专利、著作等文献,在这些文献中记载了有关科研学者的相关信息。随着科学技术的发展和研究逐步深入,难度也逐步加大,完成高水平的科研成果需要科研学者之间的紧密合作,因此,在进行一次高水平科研成果之前,往往需要先建立一个科研团队,如何从科研学者中找到适合该项高水平科研的科研学者,以最大程度满足该项高水平科研的需求,成为目前迫切需要解决的问题。现有技术往往通过查找相关
、研究方向等找到一些科研学者,然后再从这些科研学者中筛选出适合此次科研的学者组成科研团队,这种方式存在查找范围大、建立团队时间长的问题。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种科研社群划分及核心学者发现方法、系统、介质及终端, ...
【技术保护点】
1.一种科研社群划分及核心学者发现方法,其特征在于,包括以下步骤:/n获取学者信息;/n构建学者网络图谱;所述学者网络图谱用于表征学者之间合作关系;/n从所述学者网络图谱中划分出科研社群;所述科研社群内部学者关系紧密、科研社群之间关系稀疏;/n基于所述科研社群和所述学者网络图谱,确定核心科研合作团体,以在所述核心科研合作团体中发现核心学者。/n
【技术特征摘要】
1.一种科研社群划分及核心学者发现方法,其特征在于,包括以下步骤:
获取学者信息;
构建学者网络图谱;所述学者网络图谱用于表征学者之间合作关系;
从所述学者网络图谱中划分出科研社群;所述科研社群内部学者关系紧密、科研社群之间关系稀疏;
基于所述科研社群和所述学者网络图谱,确定核心科研合作团体,以在所述核心科研合作团体中发现核心学者。
2.根据权利要求1所述的科研社群划分及核心学者发现方法,其特征在于,获取所述学者信息包括以下步骤:
收集文献源文件,并对所述文献源文件进行解析,以获取解析后的文献数据;
基于所述解析后的文献数据,获取所有的学者信息;
对所述所有的学者信息进行清洗,以获取所述学者信息。
3.根据权利要求1或2所述的科研社群划分及核心学者发现方法,其特征在于,所述学者信息包括学者姓名、学者所属机构、学者所属部门、学者文章关系和学者合作关系。
4.根据权利要求1所述的科研社群划分及核心学者发现方法,其特征在于,构建所述学者网络图谱包括以下步骤:
基于所述学者信息,区别同名学者,将不同的学者分别定义为不同的节点;
基于所述学者信息,获取两个所述节点之间的合作次数、合作时间和合作文章影响因子,以基于所述合作次数、所述合作时间和所述合作文章影响因子计算两个所述节点之间关系边的权重值;
将所有与所述节点相连的关系边的权重值相加,以获得用于衡量所述节点重要度的点权值;
基于所述点权值、所述节点和所述关系边的权重值构建所述学者网络图谱。
5.根据权利要求4所述的科研社群划分及核心学者发现方法,其特征在于,所述关系边的权重值的计算公式为:
其中,E表示关系边的权重值;n表示合作次数;s表示合作文章影响因子;x表示当前时间;t表示合作时间。
6.根据权利要求4所述的科研社群划分及核心学者发现方法,其特征在于,从所述学者网络图谱中划分出所述科研社群包括以下步骤:
定义社群模块度并初始化所述社群模块度为0,所述社群模块度用来作为衡量划分质量的标准;
从所述学者网络图谱上选取预设个节点作为初始中心,基于预设个所述节点,构建预设个最短路径值群;
分别计算所述学者网络图谱上除预设个所述节点外剩下的每一节点至预设个所述节点的路径长度,以获取剩下的每一所述节点至预设个所述节点的最短路径;所述路径长度为所述关系边的权重值的倒数;
将预设个所述节...
【专利技术属性】
技术研发人员:田欣,徐旻昕,翁泉飞,刘振宇,胡寅骏,
申请(专利权)人:上海科技发展有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。