一种考虑引用异常值的期刊学术影响力的评估方法技术

技术编号:22001730 阅读:19 留言:0更新日期:2019-08-31 05:48
本发明专利技术公开了一种考虑引用异常值的期刊学术影响力的评估方法,计算N年某期刊的学术影响力,该方法包括步骤:1)统计N‑1年和N‑2年期刊每篇论文引用量中的异常值:N‑1年期刊论文被引用数集合S1;N‑2年期刊论文被引用数集合S2;2)计算S1和S2中的异常值组成集合S3;3)从期刊中剔除在集合S3中的论文;4)计算剔除集合S3中论文后N‑1年收录论文数R1;N‑2年收录论文数R2;N年自引N‑1年论文数SC1;N年他引N‑1年论文数C1;N年自引N‑2年论文数SC2;N年他引N‑2年论文数C2;5)根据公式:

A Method for Evaluating the Academic Impact of Periodicals Considering the Reference Abnormal Value

【技术实现步骤摘要】
一种考虑引用异常值的期刊学术影响力的评估方法
本专利技术属于文献评估方法领域,特别是涉及一种考虑引用异常值的期刊学术影响力的评估方法。
技术介绍
影响因子(ImpactFactor,IF):是汤森路透(ThomsonReuters)出品的期刊引证报告(JournalCitationReports,JCR)中的一项数据。即某期刊前两年发表的论文在该报告年份(JCRyear)中被引用总次数除以该期刊在这两年内发表的论文总数。根据影响因子公式(以2018年IF的计算为例,M为该期刊2016年发表的文章数量,N为该期刊2017年发表的文章数量,C为该期刊2016和2017年两年发表的文章在2018年这一年被引用的总次数。)计算后的结果进行排序来评价期刊的影响力,虽然该公式目前是国际公认的标准,但是近年来的一些期刊利用公式漏洞(例如综述+减少学术文章比例+强制投稿者引用本期刊的文章)来提升自己期刊的影响力,也让该公式的权威性再次受到挑战。PageRank:网页排名,又称网页级别,是一种根据网页之间相互的超链接计算的技术,而作为网页排名的要素之一,。Google用它来体现网页的相关性和重要性,在搜索引擎优化操作中是经常被用来评估网页优化的成效因素之一。领域中还有根据Google对网页重要程度提出的PageRank算法来对期刊进行排序,该算法对于网页链接网络和对于期刊引用网络的作用有一些本质区别,网页链接网络中新加入的网页节点可以指向旧网页节点,旧网页节点也可以指向新网页节点,但是期刊引用网络中已存在节点是不能指向新加入节点的,所以直接利用PageRank算法有失偏颇。因此,如何解决上述问题成为本领域人员研究的重点。
技术实现思路
本专利技术的目的就是提供一种考虑引用异常值的期刊学术影响力的评估方法,能够弥补上述现有技术的不足之处。本专利技术的目的通过下述技术方案来实现:一种考虑引用异常值的期刊学术影响力的评估方法,计算N年一个期刊的学术影响力,N为任意年,该方法包括步骤:1)计算机的数据检索模块和数据处理模块从期刊数据信息中统计N-1年以及N-2年该期刊每篇论文引用量集合中的异常值:计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-1年该期刊每篇论文被引用数集合S1{m1,m2,,,mn},n为N-1年该期刊收录论文总数;计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-2年该期刊每篇论文被引用数集合S2{q1,q2,,,qx},x为N-2年该期刊收录论文总数;2)通过计算机数据处理模块计算S1和S2中的异常值组成集合S3{K1,K2,,,Ky},y为S1、S2的总异常值个数;3)通过计算机数据处理模块从该期刊中剔除在集合S3中的论文;4)通过计算机数据处理模块剔除集合S3中论文后该期刊收录论文数和引用数,包括:N-1年收录论文数R1;N-2年收录论文数R2;N年自引N-1年论文数SC1;N年他引N-1年论文数C1;N年自引N-2年论文数SC2;N年他引N-2年论文数C2;5)通过计算机数据处理模块计算该期刊N年的学术影响力Score:若Ki为N-1年该期刊收录论文的引用数,则R=R1,否则R=R2。作为优选,异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。作为优选,所述N年为2018年时,则N-1年为2017年,N-2年为2016年。与现有技术相比,本专利技术的有益效果在于:本专利技术综合考虑自引与他引的区别;对异常值单独处理也将降低利用漏洞提高期刊学术影响力的风险。具体实施方式下面结合具体实施例对本专利技术作进一步的说明。实施例一一种考虑引用异常值的期刊学术影响力的评估方法,计算N年一个期刊的学术影响力,N为任意年,该方法包括步骤:1)计算机的数据检索模块和数据处理模块从期刊数据信息中统计N-1年以及N-2年该期刊每篇论文引用量集合中的异常值:计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-1年该期刊每篇论文被引用数集合S1{m1,m2,,,mn},n为N-1年该期刊收录论文总数;计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-2年该期刊每篇论文被引用数集合S2{q1,q2,,,qx},x为N-2年该期刊收录论文总数;其中数据检索模块为基于大数据的信息检索系统,数据处理模块为计算机的处理器,通过互联网检索期刊的数据信息,再利用计算机的处理器,将需要信息组成集合。2)通过计算机数据处理模块计算S1和S2中的异常值组成集合S3{K1,K2,,,Ky},y为S1、S2的总异常值个数,异常值是指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值;3)通过计算机数据处理模块从该期刊中剔除在集合S3中的论文;4)通过计算机数据处理模块剔除集合S3中论文后该期刊收录论文数和引用数,包括:N-1年收录论文数R1;N-2年收录论文数R2;N年自引N-1年论文数SC1;N年他引N-1年论文数C1;N年自引N-2年论文数SC2;N年他引N-2年论文数C2;“自引”和“他引”的定义为:论文引用自己所投期刊的文章叫做“自引”;其他期刊论文引用该期刊论文叫做“他引”。5)通过计算机数据处理模块计算该期刊N年的学术影响力Score:若Ki为N-1年该期刊收录论文的引用数,则R=R1,否则R=R2。其中的N年可以为任意一年,例如:N为2018年的时候,则N-1年则为2017年,N-2年则为2016年。其中各个公式是由计算机建立的运算模型,通过输入相关期刊的信息,计算机就能够获取其公式模型所需的数据,然后通过公式模型最终运算得出结果。本实施例中,综合考虑自引与他引的区别;对异常值单独处理也将降低利用漏洞提高期刊学术影响力的风险。以上所述仅为本专利技术的较佳实施例而已,并不用以限制本专利技术,凡在本专利技术的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网
...

【技术保护点】
1.一种考虑引用异常值的期刊学术影响力的评估方法,计算N年一个期刊的学术影响力,N为任意年,其特征在于:该方法包括步骤:1)计算机的数据检索模块和数据处理模块从期刊数据信息中统计N‑1年以及N‑2年该期刊每篇论文引用量集合中的异常值:计算机的数据检索模块和数据处理模块从期刊数据信息中获取N‑1年该期刊每篇论文被引用数集合S1{m1,m2,,,mn},n为N‑1年该期刊收录论文总数;计算机的数据检索模块和数据处理模块从期刊数据信息中获取N‑2年该期刊每篇论文被引用数集合S2{q1,q2,,,qx},x为N‑2年该期刊收录论文总数;2)通过计算机数据处理模块计算S1和S2中的异常值组成集合S3{K1,K2,,,Ky},y为S1、S2的总异常值个数;3)通过计算机数据处理模块从该期刊中剔除在集合S3中的论文;4)通过计算机数据处理模块剔除集合S3中论文后该期刊收录论文数和引用数,包括:N‑1年收录论文数R1;N‑2年收录论文数R2;N年自引N‑1年论文数SC1;N年他引N‑1年论文数C1;N年自引N‑2年论文数SC2;N年他引N‑2年论文数C2;5)通过计算机数据处理模块计算该期刊N年的学术影响力Score:...

【技术特征摘要】
1.一种考虑引用异常值的期刊学术影响力的评估方法,计算N年一个期刊的学术影响力,N为任意年,其特征在于:该方法包括步骤:1)计算机的数据检索模块和数据处理模块从期刊数据信息中统计N-1年以及N-2年该期刊每篇论文引用量集合中的异常值:计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-1年该期刊每篇论文被引用数集合S1{m1,m2,,,mn},n为N-1年该期刊收录论文总数;计算机的数据检索模块和数据处理模块从期刊数据信息中获取N-2年该期刊每篇论文被引用数集合S2{q1,q2,,,qx},x为N-2年该期刊收录论文总数;2)通过计算机数据处理模块计算S1和S2中的异常值组成集合S3{K1,K2,,,Ky},y为S1、S2的总异常值个数;3)通过计算机数据处理模块从该期刊中剔除在集合S3中的论文;4)通...

【专利技术属性】
技术研发人员:周丰丰刘确旺李飞段镁钰马天放汪虹宇姚曌旻
申请(专利权)人:北京百奥知信息科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1