基于节点重要性的论文引用网络推荐方法及系统技术方案

技术编号:35655472 阅读:13 留言:0更新日期:2022-11-19 16:52
本发明专利技术提供一种基于节点重要性的论文引用网络推荐方法及系统,该方法通过计算论文引用网络中各节点在全局范围内的节点重要程度GI(i);计算各节点在局部范围内的节点重要程度LI(i);使用信息熵加权法对节点的全局重要度GI(i)和局部重要度LI(i)做加权求和,得到节点最终重要度;对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户;本发明专利技术从全局结构和局部结构两个角度充分考量节点的重要性,能够从复杂论文引用网络中快速精准推荐出最重要的论文。准推荐出最重要的论文。准推荐出最重要的论文。

【技术实现步骤摘要】
基于节点重要性的论文引用网络推荐方法及系统


[0001]本专利技术涉及一种基于节点重要性的论文引用网络推荐方法及系统,属于数据挖掘


技术介绍

[0002]在以往的大多数引用统计研究中,用于量化论文重要性的指标是其引用次数,就底层引文网络而言,其节点代表论文,有向链接代表从施引文章到被引文章的引文,一篇文章的被引用次数转换为相应节点的入度。随着论文引用网络的规模和复杂性不断增长,如何从复杂网络中找出重要论文并推荐给用户成为研究热点。
[0003]针对该问题,Brin和Page提出了著名的PageRank算法。PageRank算法起初被设计用来衡量网页重要程度,它认为网络中某个网页的重要程度由两方面组成,一是指向该网页的网页数量,二是指向该网页的网页质量。某页面即使被少数网页指向,若来源网页的质量很高,那么这个网页的质量也很高。初始时刻每个节点拥有相同的PR值,每次迭代把当前节点的PR值均分给所有它指向的节点,节点新的PR值来源于其所获得的PR值之和,迭代各节点的PR值直到达到稳定状态。
[0004]虽然引用次数是衡量论文重要性的自然指标,但实际情况中,仅仅凭借引用数量无法全面的反映论文的影响力,因此,需要研究比只使用引用数量更真实的重要性衡量指标。
[0005]上述问题是在论文引用网络推荐过程中应当予以考虑并解决的问题。

技术实现思路

[0006]本专利技术的目的是提供一种基于节点重要性的论文引用网络推荐方法及系统解决现有技术中存在的仅考虑引用数量向用户推荐,导致推荐结果的精准性不足的问题。
[0007]本专利技术的技术解决方案是:
[0008]一种基于节点重要性的论文引用网络推荐方法,包括以下步骤,
[0009]S1、计算论文引用网络中各节点在全局范围内的节点重要程度GI(i);
[0010]S2、计算各节点在局部范围内的节点重要程度LI(i);
[0011]S3、使用信息熵加权法对节点的全局重要度GI(i)和局部重要度LI(i)做加权求和,得到节点最终重要度;
[0012]S4、对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。
[0013]进一步地,步骤S1中,计算论文引用网络中各节点在全局范围内的节点重要程度,具体为,
[0014]S11、对于论文引用网络中节点i,计算其接近中心性:
[0015][0016]其中,n表示网络中节点总数,d
ij
表示节点i、j之间的最短距离;
[0017]S12、计算节点i的接近中心性与其邻接节点的接近中心性之和,作为该节点i在全局范围内的节点重要度:
[0018][0019]其中,CC(i)、CC(u)分别为节点i、u的接近中心性,N(v)表示节点v的邻接节点集合。
[0020]进一步地,步骤S12中,邻接节点为入度节点集与出度节点集的并集,入度节点为以某节点为弧头的有向边的目标节点,出度节点为以某节点为弧尾的有向边的起始节点。
[0021]进一步地,步骤S2中,计算各节点在局部范围内的节点重要程度,具体为,
[0022]S21、节点的出度表示引用当前论文的其他论文,计算所有出度节点的入度和出度之和:
[0023][0024]其中,|out_import(u)|、|in_import(u)|表示节点u的出度值与入度值,out_degree(i)表示节点i的出度节点集合;
[0025]S22、节点的入度表示当前论文引用的其他论文,求出当前入度值|in_import(i)|,这两部分的积作为节点的局部重要度:
[0026]LI(i)=|out(i)|*|in_import(i)|
[0027]其中,|out(i)|为所有出度节点的入度值与出度值之和,|in_import(i)|为当前节点入度值。
[0028]进一步地,步骤S3中,使用信息熵加权法对节点的全局重要度GI(i)和局部重要度LI(i)做加权求和,得到节点最终重要度:
[0029]Rank(i)=w1*GI(i)+w2*LI(i)
[0030]其中,w1、w2为权重,i=1,2,其中,H
i
表示第i个参数的信息熵,r
ij
表示节点j对第i个参数的归一化值,式中只有GI、LI两个参数,i取1或2,r
1j
、r
2j
分别表示节点j对第一个参数即GI、第二个参数即LI的归一化值,n表示网络中节点总数,GI(j)为节点j的全局重要度,LI(j)为节点j的局部重要度。
[0031]一种实现上述任一项所述的基于节点重要性的论文引用网络推荐方法的系统,包括全局重要度计算模块、局部重要度计算模块、加权模块和重要度排序模块,
[0032]全局重要度计算模块:计算论文引用网络中各节点在全局范围内的节点重要程度GI(i);
[0033]局部重要度计算模块:计算各节点在局部范围内的节点重要程度LI(i);
[0034]加权模块:使用信息熵加权法对节点的全局重要度GI(i)和局部重要度LI(i)做加权求和,得到节点最终重要度;
[0035]重要度排序模块:对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。
[0036]本专利技术的有益效果是:
[0037]一、该种基于节点重要性的论文引用网络推荐方法及系统,能够在论文引用网络结构复杂、节点间引用关系众多等问题的场景下,从全局结构和局部结构两个角度充分考量节点的重要性,并将两种指标结合,推荐出重要的节点,能够从复杂论文引用网络中快速精准推荐出最重要的论文,以供用户使用,可适用于含权重或不含权重的有向图。
[0038]二、该种基于节点重要性的论文引用网络推荐方法及系统,考虑各节点在论文引用网络中所处的位置也是衡量节点重要性的一种重要途径,本专利技术将节点在网络中的位置和节点引用数量结合,能够使得推荐结果更加精准。
附图说明
[0039]图1是本专利技术实施例基于节点重要性的论文引用网络推荐方法的流程示意图。
[0040]图2是实施例基于节点重要性的论文引用网络推荐系统的说明示意图。
具体实施方式
[0041]下面结合附图详细说明本专利技术的优选实施例。
[0042]实施例
[0043]一种基于节点重要性的论文引用网络推荐方法,如图1,包括以下步骤,
[0044]S1、计算论文引用网络中各节点在全局范围内的节点重要程度GI(i);
[0045]步骤S1中,计算论文引用网络中各节点在全局范围内的节点重要程度,具体为,
[0046]S11、对于论文引用网络中节点i,计算其接近中心性:
[0047][0048]其中,n表示网络中节点总数,d
ij
表示节点i、j之间的最短距离。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于节点重要性的论文引用网络推荐方法,其特征在于:包括以下步骤,S1、计算论文引用网络中各节点在全局范围内的节点重要程度GI(i);S2、计算各节点在局部范围内的节点重要程度LI(i);S3、使用信息熵加权法对节点的全局重要度GI(i)和局部重要度LI(i)做加权求和,得到节点最终重要度;S4、对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。2.如权利要求1所述的基于节点重要性的论文引用网络推荐方法,其特征在于:步骤S1中,计算论文引用网络中各节点在全局范围内的节点重要程度,具体为,S11、对于论文引用网络中节点i,计算其接近中心性:其中,n表示网络中节点总数,d
ij
表示节点i、j之间的最短距离;S12、计算节点i的接近中心性与其邻接节点的接近中心性之和,作为该节点i在全局范围内的节点重要度:其中,CC(i)、CC(u)分别为节点i、u的接近中心性,N(v)表示节点v的邻接节点集合。3.如权利要求2所述的基于节点重要性的论文引用网络推荐方法,其特征在于:步骤S12中,邻接节点为入度节点集与出度节点集的并集,入度节点为以某节点为弧头的有向边的目标节点,出度节点为以某节点为弧尾的有向边的起始节点。4.如权利要求1所述的基于节点重要性的论文引用网络推荐方法,其特征在于:步骤S2中,计算各节点在局部范围内的节点重要程度,具体为,S21、节点的出度表示引用当前论文的其他论文,计算所有出度节点的入度和出度之和:其中,|out_import(u)|、|in_import(u)|表示节点u的出度值与入度值,out_degree(i)表示节点i的出度节点集合;S22、节点的入度表示当前论文引用的其他论文,求出当前入度值...

【专利技术属性】
技术研发人员:刘尚东洪程季一木王汝传
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1