一种基于黄金引用算法的论文排序方法技术

技术编号:19511390 阅读:29 留言:0更新日期:2018-11-21 07:50
本发明专利技术公开了一种基于黄金引用算法的论文排序方法,包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;再次,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;然后,以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,并进行降序排列;最后,输出排序结果。通过标定论文的引用属性,排除论文引用关系中自引的干扰,再依据自引修订引用次数,逐层提取论文群体中的论文组合成新的论文群体,并进行依次排序,依据排序结果使得用户直观的获取论文群体的分布情况,实现用户快速、准确的检索到高质量论文。

【技术实现步骤摘要】
一种基于黄金引用算法的论文排序方法
本专利技术属于大数据论文检索推荐
,具体地说涉及一种基于黄金引用算法的论文排序方法。
技术介绍
学术论文的评价和学术论文的排序,作为论文检索和论文推荐系统的核心部分,一直以来都是研究人员非常关心的问题。因为,准确的学术论文评价和排序意义非常重大,例如,准确的学术论文评价和排序可以辅助量化研究人员的科研影响力,以及学术机构的科研影响力等,以及加快入门学者对于特定科学领域的学习速度。现有技术公开了一种引文数据库中主题文献学术影响力的分析与排序方法,包括:在引文数据库中进行主题检索,获取主题文献元数据信息及主题文献间引用关系;根据获取的主题文献元数据信息及主题文献间引用关系构建主题引文网络;基于主题引文网络构建包含文献学术影响力多因素的因子图模型;使用循环最大和算法在因子图上近似推理,确定因子图中所有变量的边缘概率值;根据边缘概率值的降序排序结果,获取并输出所有主题文献的学术影响力排序。该申请只考虑了论文之间的引用关系,但因自引论文的干扰并不能完全体现论文的质量。有鉴于此特提出本专利技术。
技术实现思路
本专利技术要解决的技术问题在于克服现有技术的不足,提供一种基于黄金引用算法的论文排序方法,通过黄金引用算法排除自引论文的干扰,进一步对论文群体进行筛选排序,实现用户快速、准确的检索到高质量论文。为解决上述技术问题,本专利技术采用技术方案的基本构思是:一种基于黄金引用算法的论文排序方法,包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;再次,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;然后,以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,并进行降序排列;最后,输出排序结果。本申请中的黄金引用算法模型,排除了引用次数中的自引,从而避免了自引在论文评价中的干扰,又以自引修订论文群体为初始群体,依据他引次数逐层迭代筛选出边缘论文,并将删除的论文组合成新的论文群体,并对这些论文群体按照降序排列,使得引用次数统计中他引情况更加直观,用户通过排序结果可准确的识别、并获取高质量论文,并且该算法简单、易于实行,用户运用本算法对论文群体中的高质量论文进行统计、计算较为方便。进一步,所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文与论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。进一步,引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为进一步,所述标定论文引用属性,步骤如下:根据论文作者判定论文的引用关系是自引还是他引,若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引。进一步,依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1,其中,λi,j为自引系数,i≥1,j≥1。进一步,论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1。进一步,依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。进一步,引入被引次数设定值k,k依次由小到大取值,采用迭代筛选的方式逐层缩小论文群体的范围,将每层筛选出的论文组成论文群体,并进行排序,直至输出全部的排序结果,其中,k为整数,且k≥0。进一步,第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为采用迭代筛选的方式缩小Gk的范围,筛选出Gk中被引次数等于k的论文及其引用关系,生成论文群体Gk,1,第i篇论文在论文群体Gk,1中的被引次数关系式为继续筛选出Gk,1中小于和/或等于k的论文及其引用关系,并生成论文群体Gk,2,继续迭代筛选,直至生成论文群体Gk,q,且Gk,q中论文被至少k+1篇Gk,q中的论文引用,形成第k+1层的初始论文群体,即Gk,q记作Gk+1;每层迭代筛选出的论文组成论文群体Dk,筛选后的论文群体Gk+1中含有|Vk+1|=Nk+1个节点,即含有Nk+1篇论文,|Ek+1|=Mk+1条边,第i篇论文在论文群体Gk+1中的被引次数关系式为且被引次数大于k,其中,k、q为整数,且k≥0,q≥1。进一步,以自引修订论文群体G'为初始论文群体,G0=G',对每层迭代筛选出的论文群体进行降序排列,直至输出全部的排序结果,具体步骤如下所示:S31.k=0,筛选出G0中自引修订引用次数等于0的论文及其引用关系,生成论文群体G0,1,第i篇论文在论文群体G0,1中的被引次数关系式为继续筛选出G0,1中等于0的论文及其引用关系,并生成论文群体G0,2,继续迭代筛选,直至生成论文群体G0,q,且G0,q中论文被其他至少1篇G0,q中的论文引用,其中G0,q记作G1,迭代筛选出的论文组成论文群体D0,论文群体缩小为G1,G1中含有|V1|=N1个节点,即含有N1篇论文,|E1|=M1条边,第i篇论文在论文群体G1中的被引次数关系式为其中,q为整数,且q≥1;S32.k=1,筛选出论文群体G1中自引修订引用次数等于1的论文及其引用关系,生成论文群体G1,1,第i篇论文在论文群体G1,1中的被引次数关系式为继续迭代筛选出G1,1中论文小于和/或等于1的论文及其引用关系,并生成论文群体G1,2,继续迭代筛选,直至生成论文群体G1,q,且G1,q中论文被其他至少2篇G1,q中的论文引用,其中G1,q记作G2,迭代筛选出的论文组成论文群体D1,论文群体缩小为G2,含有论文数量为|V2|=N2篇,第i篇论文在论文群体G2中的被引次数关系式为其中,q为整数,且q≥1;S33.k=2,筛选出G2中自引修订引用次数等于2的论文及其引用关系,生成论文群体G2,1,第i篇论文在论文群体G2,1中的被引次数关系式为继续筛选出G2,1中小于和/或等于2的论文及其引用关系,并生成论文群体G2,2,继续迭代筛选,直至生成论文群体G2,q,且G2,q中论文被其他至少3篇G2,q中的论文引用,其中G2,q记作G3,迭代筛选出的论文组成论文群体为D2,论文群体本文档来自技高网...

【技术保护点】
1.一种基于黄金引用算法的论文排序方法,其特征在于:包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;再次,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;然后,以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,进行降序排列;最后,输出排序结果。

【技术特征摘要】
1.一种基于黄金引用算法的论文排序方法,其特征在于:包括以下步骤:首先,在论文数据库中选定论文群体范围;其次,依据所选定论文群体中论文的相互引用关系构建初始引用网络模型;再次,标定初始引用网络模型中论文的引用属性,并通过自引系数修订引用次数,生成自引修订论文群体;然后,以自引修订论文群体为初始论文群体,采用迭代筛选的方式逐层缩小自引修订论文群体的范围,将每层筛选出的论文组成论文群体,进行降序排列;最后,输出排序结果。2.根据权利要求1所述的一种基于黄金引用算法的论文排序方法,其特征在于:所述初始引用网络模型为:G=(V,E),G=(V,E)是由|V|=N个论文节点和|E|=M条边所组成的一个有向网络;其中,G代表论文群体中论文以及论文间引用关系的集合,V代表论文群体G中的论文集合,E代表论文群体G中论文间的引用关系。3.根据权利要求1-2任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:引入引用变量ei,j,ei,j代表论文群体G中论文vi与论文vj的引用关系,若论文vi被论文vj引用,则ei,j等于1;若论文vi未被论文vj引用,则ei,j等于0,其中i≥1,j≥1;在论文群体G中以第i篇论文为节点的被引次数通过引用变量ei,j累加得到,则建立第i篇论文在论文群体G中的被引次数关系式为4.根据权利要求1-3任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:所述标定论文引用属性,步骤如下:根据论文作者判定论文的引用关系是自引还是他引,若论文vi被论文vj引用,当论文vi与论文vj中没有相同作者,则该次引用为他引;当论文vi与论文vj中至少有一个相同作者,则该次引用为自引。5.根据权利要求1-4任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:依据论文引用属性,引入自引系数λi,j,若论文vi与被引论文vj为自引关系,则λi,j等于0;若论文vi与被引论文vj为他引关系,则λi,j等于1;其中,λi,j为自引系数,i≥1,j≥1。6.根据权利要求1-5任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:论文vi被论文vj引用且为自引,则引用变量ei,j与自引系数λi,j的乘积为0;论文vi被论文vj引用且为他引,则引用变量ei,j与自引系数λi,j的乘积为1;通过对引用变量ei,j与自引系数λi,j的乘积相累加,排除了第i篇论文在初始引用网络模型中的自引用关系,则建立第i篇论文在论文群体中的自引修订引用次数公式为其中,i≥1,j≥1。7.根据权利要求1-6任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:依据自引修订引用次数为生成自引修订论文群体G',从而构建出自引修订网络模型G'=(V',E');G'=(V',E')是由|V'|=N个节点和|E'|=M'条边所组成的一个有向网络。8.根据权利要求1-7任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:引入被引次数设定值k,k依次由小到大取值,采用迭代筛选的方式逐层缩小论文群体的范围,将每层筛选出的论文组成论文群体,并进行排序,直至输出全部的排序结果,其中,k为整数,且k≥0。9.根据权利要求1-8任一所述的一种基于黄金引用算法的论文排序方法,其特征在于:第k层的初始论文群体为Gk时,Gk中含有|Vk|=Nk个节点,即含有Nk篇论文,|Ek|=Mk条边,第i篇论文在论文群体Gk中的被引次数关系式为采用迭代筛选的方式逐层缩小Gk的范围,筛选出Gk中被引次数等于k的论文及其引用关系,生成论文群...

【专利技术属性】
技术研发人员:吴晨生杜丽萍李梦辉刘静黄玉荣
申请(专利权)人:北京市科学技术情报研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1