一种基于学术大数据的对科研单位影响力进行评估的方法技术

技术编号:20842327 阅读:30 留言:0更新日期:2019-04-13 08:43
本发明专利技术公开了一种基于学术大数据对科研单位影响力进行评估的方法,主要利用学术论文数据库中的论文数据以及论文中所涉及的所有科研单位以及论文的引用数据,建立依赖科研单位的共引有向网络,以论文的共引权重衡量论文的重要性,并采用科研单位署名位置信息构建加权系数函数的方法定量评价所研究的科研单位的学术影响力。本发明专利技术根据学术论文引用数据建立有向网络,针对多个单位合作的论文采用加权系数的方法计算各个单位的影响力值,科学有效地评价各个科研单位的学术影响力,从而提供一种有效合理的科研单位学术影响力评价方法。

【技术实现步骤摘要】
一种基于学术大数据的对科研单位影响力进行评估的方法
本专利技术涉及数据处理
,具体涉及在学术领域中基于学术大数据的对科研单位影响力进行评估的方法,尤其涉及科研合著情况下,一种基于加权系数有向网络的科研单位学术影响力的评价方法。
技术介绍
当今社会,科研单位是科学研究的重要参与者,为学术研究作出了重大贡献。然而不同的科研单位有着不同的科研能力,科研单位的科研水平反映出一个科研单位的学术影响力。学术影响力的量化结果为国家科研项目的审批、人才的吸引、机构的排名等提供重要的依据。再者,随着社会问题的复杂性,科研单位之间合作越来越普遍,科研单位间合作趋向日常化,科研成果的分配问题就越来越明显。目前,现有的学术分配算法主要是根据被引频次来衡量论文重要性,平均分配文章价值给合著主体。然而一篇文章是否引用受到诸多因素影响,同时采用的均分的分配方式,其合理性仍有待商榷。
技术实现思路
针对现有技术的不足,本专利技术旨在提供一种基于学术大数据的对科研单位影响力进行评估的方法,通过网络结构和科研单位信息,构建论文间共引有向网络,运用论文的共引权重代替论文的被引次数,从科研单位角度去衡量论文的重要程度,同时考虑科研单位在论文中的署名次序因素,对合著情况下的科研单位学术影响力进行准确评估。为了实现上述目的,本专利技术采用的技术方案如下:一种基于学术大数据对科研单位影响力进行评估的方法,包括如下步骤:S1、采集待研究的科研单位发表的所有学术论文及其被引用的数据,记待研究的科研单位为Ii;S2、将步骤S1中收集的数据根据引用关系建立起被引数据集P={p1,p2,...,pm}、施引数据集C={c1,c2,...,cl}以及有向网络;被引数据集为待研究的科研单位发表的所有学术论文的集合,施引数据集为引用了被引数据集中的至少一篇的施引论文的集合,有向网络中包含被引数据集、施引数据集以及两者之间的引用和被引用的关系;S3、对被引数据集P={p1,p2,...,pm}中的每一篇论文均进行如下操作:S3.1、记pj中有a个署名机构,署名机构中包括待研究的科研单位Ii,j=1,2,...,m;从C={c1,c2,...,cl}找出引用论文pj的施引论文集合Cj={c1,c2,...,cb},并从P={p1,p2,...,pm}中筛选出被引论文集合Dj={d1,...,dc};Dj中包含的论文同时满足两个条件:第一是至少与论文pj有一个相同的署名机构,第二是同时被Cj中的至少一个施引论文引用;S3.2、按照下式计算待研究科研单位Ii在Dj集合中的第h篇论文中的贡献率与待研究科研单位Ii在Dj集合中的第h篇论文中的署名顺序r和第h篇论文中署名机构的总数k有关:S3.3、计算Dj集合中的第h篇论文被集合Cj中的论文引用的次数wj,h;S3.4、按下式计算待研究科研单位Ii从论文pj中获得的科研贡献量S4、步骤S3完成后将得到待研究科研单位Ii在m篇不同的论文中获得的科研贡献量将其按下式作累加计算,得到待研究的科研单位Ii的科研影响力进一步地,当对所有待研究的科研单位的科研影响力同时进行计算时,步骤S1中所述所有学术论文及其被引用的数据为所有待研究的科研单位所发表的所有学术论文及其被引用的数据,步骤S2中的被引数据集为指所有待研究的科研单位发表的所有学术论文的集合,步骤S3中对于每一篇论文pj,同时计算论文pj的署名机构中包含的所有待研究的科研单位从论文pj中获得的科研贡献量进一步地,当对所有待研究的科研单位的科研影响力分别进行计算时,步骤S1中所述所有学术论文及其被引用的数据为该次计算所针对的待研究的科研单位发表的所有学术论文及其被引用的数据,步骤S2中的被引数据集为指该次计算所针对的待研究的科研单位发表的所有学术论文的集合。本专利技术的有益效果在于:本专利技术基于加权系数有向网络对科研单位影响力进行评估,通过网络结构和科研单位信息,构建论文间共引有向网络,运用论文的共引权重代替论文的被引次数,从科研单位角度去衡量论文的重要程度,同时考虑科研单位在论文中的署名次序因素,对合著情况下的科研单位学术影响力进行准确评估。附图说明图1为本专利技术实施例2的总体实施流程示意图;图2为本专利技术实施例3中利用物理学期刊APS数据集,采用随机加边p1的加入噪声的方法对科研单位学术影响力判别能力结果图;图3为本专利技术实施例3中利用物理学期刊APS数据集,采用随机断边重连p2的加入噪声的方法对科研单位学术影响力判别能力结果图。具体实施方式以下将结合附图对本专利技术作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围并不限于本实施例。实施例1一种基于学术大数据对科研单位影响力进行评估的方法,包括如下步骤:S1、采集待研究的科研单位发表的所有学术论文及其被引用的数据,记待研究的科研单位为Ii;S2、将步骤S1中收集的数据根据引用关系建立起被引数据集P={p1,p2,...,pm}、施引数据集C={c1,c2,...,cl}以及有向网络;被引数据集为待研究的科研单位发表的所有学术论文的集合,施引数据集为引用了被引数据集中的至少一篇的施引论文的集合,有向网络中包含被引数据集、施引数据集以及两者之间的引用和被引用的关系;S3、从被引数据集P={p1,p2,...,pm}中选择一篇论文,记为pj;S4、记pj中有a个署名机构,包括待研究的科研单位Ii;从C={c1,c2,...,cl}找出引用论文pj的施引论文集合Cj={c1,c2,...,cb},并从P={p1,p2,...,pm}中筛选出被引论文集合Dj={d1,...,dc};Dj中包含的论文同时满足两个条件:第一是至少与论文pj有一个相同的署名机构,第二是同时被Cj中的至少一个施引论文引用;S5、按照下式计算待研究科研单位Ii在Dj集合中的第h篇论文中的贡献率与待研究科研单位Ii在Dj集合中的第h篇论文中的署名顺序r和第h篇论文中署名机构的总数k有关:S6、计算Dj集合中的第h篇论文被集合Cj中的论文引用的次数wj,h(即集合Cj中有多少篇论文引用了Dj集合中的第h篇论文);S7、按下式计算待研究科研单位Ii从论文pj中获得的科研贡献量在本实施例中还对进行标准化:标准化采用的方法如下式所示,标准化后的值为为第h篇论文中所有科研单位的总和;S8、对P={p1,p2,...,pm}中所有的论文均进行步骤S4-S7的处理,得到待研究科研单位Ii在m篇不同的论文中获得的科研贡献量,然后按下式作累加计算,得到待研究的科研单位Ii的科研影响力对所有待研究的科研单位同时或分别按照上述步骤S1-S8的方法,都可以得到所有科研单位的科研影响力的值并进行排名。实施例2如图1所示,本实施例所提供的一种基于学术大数据的对科研单位影响力进行评估的方法,是同时对所有待研究的科研单位的科研影响力的值进行计算,包括如下步骤:一、采集待研究的科研单位发表的所有学术论文及其被引用的数据,待研究的科研单位包括I1、I2、I3、I4;二、将步骤一中收集的数据根据引用关系建立起被引数据集、施引数据集,并建立有向网络。在本实施例中,被引数据集为P={p1,p2,p3,p4},施引数据集为C={c1,c2,c3,c4,c本文档来自技高网...

【技术保护点】
1.一种基于学术大数据对科研单位影响力进行评估的方法,其特征在于,包括如下步骤:S1、采集待研究的科研单位发表的所有学术论文及其被引用的数据,记待研究的科研单位为Ii;S2、将步骤S1中收集的数据根据引用关系建立起被引数据集P={p1,p2,...,pm}、施引数据集C={c1,c2,...,cl}以及有向网络;被引数据集为待研究的科研单位发表的所有学术论文的集合,施引数据集为引用了被引数据集中的至少一篇的施引论文的集合,有向网络中包含被引数据集、施引数据集以及两者之间的引用和被引用的关系;S3、对被引数据集P={p1,p2,...,pm}中的每一篇论文均进行如下操作:S3.1、记pj中有a个署名机构,署名机构中包括待研究的科研单位Ii,j=1,2,...,m;从C={c1,c2,...,cl}找出引用论文pj的施引论文集合Cj={c1,c2,...,cb},并从P={p1,p2,...,pm}中筛选出被引论文集合Dj={d1,...,dc};Dj中包含的论文同时满足两个条件:第一是至少与论文pj有一个相同的署名机构,第二是同时被Cj中的至少一个施引论文引用;S3.2、按照下式计算待研究科研单位Ii在Dj集合中的第h篇论文中的贡献率...

【技术特征摘要】
1.一种基于学术大数据对科研单位影响力进行评估的方法,其特征在于,包括如下步骤:S1、采集待研究的科研单位发表的所有学术论文及其被引用的数据,记待研究的科研单位为Ii;S2、将步骤S1中收集的数据根据引用关系建立起被引数据集P={p1,p2,...,pm}、施引数据集C={c1,c2,...,cl}以及有向网络;被引数据集为待研究的科研单位发表的所有学术论文的集合,施引数据集为引用了被引数据集中的至少一篇的施引论文的集合,有向网络中包含被引数据集、施引数据集以及两者之间的引用和被引用的关系;S3、对被引数据集P={p1,p2,...,pm}中的每一篇论文均进行如下操作:S3.1、记pj中有a个署名机构,署名机构中包括待研究的科研单位Ii,j=1,2,...,m;从C={c1,c2,...,cl}找出引用论文pj的施引论文集合Cj={c1,c2,...,cb},并从P={p1,p2,...,pm}中筛选出被引论文集合Dj={d1,...,dc};Dj中包含的论文同时满足两个条件:第一是至少与论文pj有一个相同的署名机构,第二是同时被Cj中的至少一个施引论文引用;S3.2、按照下式计算待研究科研单位Ii在Dj集合中的第h篇论文中的贡...

【专利技术属性】
技术研发人员:刘建国王江盼朱熹华李超然郭强江明珠
申请(专利权)人:上海财经大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1