当前位置: 首页 > 专利查询>杨宁专利>正文

一种引文耦合网络中的重叠社区探测方法技术

技术编号:14120691 阅读:84 留言:0更新日期:2016-12-08 13:39
本发明专利技术涉及一种引文耦合网络中的重叠社区探测方法,能够有效识别引文耦合网络中的社区结构,具有时间复杂度低,划分结果准确度高的特点,包括以下步骤:一、找出引文耦合网络中节点强度最大且不属于任何社区的点形成初始社区;二、将社区所有邻居节点加入初始社区并计算节点社区归属度,保留社区归属度≥0.5的节点,删除其余节点;三、重复步骤二,直到再没有符合条件的节点为止;四、计算具有重叠节点的两个社区之间的重叠度,将重叠度≥0.5的社区进行合并,从而得到对引文耦合网络进行社区探测的最终结果。

【技术实现步骤摘要】

本专利技术属于网络
,具体涉及一种引文耦合网络中的重叠社区探测方法
技术介绍
社区结构是复杂网络中存在的一种特性,在这种结构中,社区内的节点连接紧密,社区间的节点连接稀疏,它同时也代表了复杂网络的聚类特征。因此,对复杂网络中社区结构的划分和研究可以帮助我们更好地认识网络,发现网络中隐含的关系和知识。引文耦合网络是引文网络的一种,耦合关系是指两篇拥有相同参考文献的论文之间所存在的关系,而这两篇论文之间拥有共同的参考文献数量称为耦合强度。由论文及它们之间的耦合关系所组成的加权复杂网络就被称之为引文耦合网络。早期的引文耦合研究主要基于传统计量学的统计分析方法来完成,这种方法不但对于海量数据的处理能力有限,在知识自动发现和数据可视化方面也存在严重不足。当前的复杂网络社区算法多集中于无向无权网络的研究,虽然近年来陆续有学者开始在加权网络上进行研究,但这方面研究仍处于起步阶段,考虑的网络结构条件仍然较为单一。引文耦合网络的边信息具有极高的分析价值,与顶点同等重要,如果忽略边的信息,必定导致分析结果缺乏准确性和可用性。同时,引文耦合网络还存在重叠结构,这也是引文耦合网络分析的重要前提条件。因此,需要有一个有效的算法能够适应引文耦合网络的社区发现工作。
技术实现思路
为了解决上述问题,本专利技术公开了一种引文耦合网络重叠社区发现方法,能够有效的识别出引文耦合网络的重叠社区结构,具有较低的时间复杂度,识别准确率较高。本专利技术的目的是通过以下技术方案实现的:1)计算网络中所有不属于任何社区的节点的节点强度S(v1) S ( v i ) = Σ v J ∈ neigh ( v 1 ) w ij ]]>2)找出极大节点强度点并将其所有邻居节点加入形成初始社区c。3)对于每一个在社区c中的vi节点的邻居节点,计算这些节点的归属度B(vi,c),如果B(vi,c)≥0.5(如果一个节点超过一半的节点强度都在某个社区内,本文认为该节点可以确定属于该社区),则保留该节点在社区c中,否则在社区c中删除该节点,调整后的社区记为初始社区c’。归属度B(vi,c)的计算公式如下所示: B ( v i , c ) = Σ v J ∈ C w ij Σ v J ∈ neigh ( v 1 ) w ij ]]>4)将c’所有邻居节点分别加入,并计算与社区c’的归属度B(vj,c’),如果归属度B(vj,c’)≥0.5或节点度唯一,则将该邻居节点添加到社区c’中。通过不断重复迭代这个过程,将所有归属度B(vj,c’)≥0.5的节点全部添加到社区c’中。到此,一个社区暂时扩展完毕。5)重复2)-4)的步骤,直到网络中的所有社区全部划分完毕。6)合并社区。取出算法得到的所有重叠节点,分别计算重叠节点所属社区的重叠度,如果社区
重叠度超过本文设定的阈值条件(ε=0.5)则合并,否则不合并。重叠度的计算公式如下所示: | C 1 ∩ C 2 | min { | C 1 | , | C 2 |本文档来自技高网
...
一种引文耦合网络中的重叠社区探测方法

【技术保护点】
一种引文耦合网络中的重叠社区探测方法,包括以下步骤:1)计算网络中所有不属于任何社区的节点的节点强度D(vi)S(vi)=Σvj∈neigh(vi)wij]]>2)找出极大节点强度点并将其所有邻居节点加入形成初始社区c;3)对于每一个在社区c中的vi节点的邻居节点,计算这些节点的归属度B(vi,c),如果B(vi,c)≥0.5,如果一个节点超过一半的节点强度都在某个社区内,本专利技术认为该节点可以确定属于该社区,则保留该节点在社区c中,否则在社区c中删除该节点,调整后的社区记为初始社区c’。归属度B(vi,c)的计算公式如下所示:B(vi,c)=Σvj∈CwijΣvj∈neigh(vi)wij]]>4)将c’所有邻居节点分别加入,并计算与社区c’的归属度B(vj,c’),如果归属度B(vj,c’)≥0.5或节点度唯一,则将该邻居节点添加到社区c’中。通过不断重复迭代这个过程,将所有归属度B(vj,c’)≥0.5的节点全部添加到社区c’中。到此,一个社区暂时扩展完毕;5)重复2)‑4)的步骤,直到网络中的所有社区全部划分完毕;6)合并社区。取出算法得到的所有重叠节点,分别计算重叠节点所属社区的重叠度,如果社区重叠度超过本文设定的阈值条件(ε=0.5)则合并,否则不合并。重叠度的计算公式如下所示:|C1∩C2|min{|C1|,|C2|}≥ϵ]]>7)取得所有只有唯一节点的社区,计算这些节点与其所有邻居社区的归属度,将其加入邻居社区归属度最大的社区,如果归属度最大的邻居社区有n个,那该节点就作为一个重叠节点加入这些邻居社区,并删除只有唯一节点的社区。...

【技术特征摘要】
1.一种引文耦合网络中的重叠社区探测方法,包括以下步骤:1)计算网络中所有不属于任何社区的节点的节点强度D(vi) S ( v i ) = Σ v j ∈ neigh ( v i ) w ij ]]>2)找出极大节点强度点并将其所有邻居节点加入形成初始社区c;3)对于每一个在社区c中的vi节点的邻居节点,计算这些节点的归属度B(vi,c),如果B(vi,c)≥0.5,如果一个节点超过一半的节点强度都在某个社区内,本发明认为该节点可以确定属于该社区,则保留该节点在社区c中,否则在社区c中删除该节点,调整后的社区记为初始社区c’。归属度B(vi,c)的计算公式如下所示: B ( v i , c ) = Σ v j ∈ C w ij &S...

【专利技术属性】
技术研发人员:彭舰杨宁李梦诗刘唐陈瑜黎红友宁黎苗黄飞虎
申请(专利权)人:杨宁
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1