一种基于拓扑势的重叠复杂网络社区发现方法及系统技术方案

技术编号:9545349 阅读:150 留言:0更新日期:2014-01-08 21:37
本发明专利技术提供一种基于拓扑势的重叠复杂网络社区发现方法及系统,该方法包括:根据给定的重叠复杂网络,建立拓扑势场,计算网络中各个节点的拓扑势值;搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;以每个代表节点为中心按广度优先向外扩展,若扩展节点位于拓扑势场的谷位,则为该社区与其他社区的重叠节点,扩展停止;若扩展节点位于拓扑势场的斜坡位,则为该社区的内部节点,扩展继续;全部代表节点的扩展结束后,未被访问过的节点位于边缘位,是不属于任何社区的孤立节点。本发明专利技术考虑了节点质量的差异性,利用了拓扑势场的峰谷结构,根据节点在拓扑势场中的位置进行重叠复杂网络社区发现,社区划分准确,效率高。

【技术实现步骤摘要】
一种基于拓扑势的重叠复杂网络社区发现方法及系统
本专利技术属于网络识别
,涉及一种网络社区发现方法,特别是涉及一种基于拓扑势的重叠复杂网络社区发现方法及系统。
技术介绍
现实世界中的诸多系统都以复杂网络的形式存在,如科技系统中的因特网,社会系统中的人际关系网,生态环境中的食物链网,以及电力网络和交通网络。社区发现是复杂网络的一项重要研究内容,对于分析复杂网络的拓扑结构,理解复杂系统的功能,发现复杂网络中的隐藏规律、演化趋势以及预测复杂网络的行为都具有重要的意义。目前已存在多种复杂网络社区发现方法,拓扑势方法是这些方法中的一个重要分支,该类方法具有时间复杂度低,无需领域或专家知识等优势。淦文燕等人在发表于2009年《软件学报》期刊的文章“一种基于拓扑势的网络社区发现方法”中首次引入拓扑势描述复杂网络节点间的作用与联系,将每个社区视为拓扑势场的局部高势区,通过效益函数确定每个复杂网络节点的社区归属。该方法对重叠节点的确定条件比较严苛,从而导致重叠节点数量过于稀少,缺乏现实合理性。韩言妮等人在发表于2011年《FrontiersofComputerScienceofChina》期刊的文章“Identifyingdifferentcommunitymembersincomplexnetworksbasedontopologypotential”中提出基于拓扑势的复杂网络节点类型识别和重叠社区发现。该方法仅仅借助拓扑势找出社区代表节点,即局部极值点,在以局部极值节点为中心往外扩展划分社区过程中,判断节点社区归属的主要依据是节点度等有关节点连接关系的统计信息。张建沛等人在发表于2012年《电子学报》期刊的文章“基于归属不确定性的变规模网络重叠社区识别”中提出一种出基于归属不确定性的变规模网络重叠社区识别方法。该方法首先根据节点拓扑势值的构成定义重叠节点社区归属不确定性侧度公式,然后进行变规模社区发现。在该方法中,社区的规模及节点社区归属完全依赖于预设的调节参数ξ。对于实际的复杂网络,很难预先判断每个社区的规模,因此预设一个合理的调节参数ξ十分困难。综上所述,现有基于拓扑势理论的重叠复杂网络社区发现方法存在以下不足:(1)在节点拓扑势计算过程中,假设所有复杂网络节点质量相同,忽略节点间的质量差异,缺乏现实合理性;(2)在社区发现过程中,没有利用拓扑势场本身所呈现的峰谷结构这一固有特性,而是通过效益函数等额外手段进行判断,增加了社区发现的复杂性。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于拓扑势的重叠复杂网络社区发现方法及系统,用于解决现有基于拓扑势的网络社区发现方法忽略网络节点间的质量差异及没有利用拓扑势场本身所呈现的峰谷结构这一固有特性,而是通过效益函数等额外手段进行节点社区归属判断等问题。为实现上述目的及其他相关目的,本专利技术提供一种基于拓扑势的重叠复杂网络社区发现方法及系统。一种基于拓扑势的重叠复杂网络社区发现方法,包括:根据给定的重叠复杂网络,建立拓扑势场,计算网络中各个节点的拓扑势值;根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;依次访问各个代表节点,分别以每个代表节点为中心按广度优先向外扩展,确定扩展节点的社区归属;若扩展节点位于拓扑势场的谷位,则为该社区与其他社区的重叠节点,扩展停止;若扩展节点位于拓扑势场的斜坡位,则为该社区的内部节点,扩展继续;全部代表节点的扩展过程结束后,未被访问过的节点均位于拓扑势场的边缘位,是不属于任何社区的孤立节点。优选地,所述网络中各个节点υi的拓扑势值的计算过程为:其中,n为节点υi影响范围内的节点数,节点υi的最大影响距离为m(υi)为节点υi的质量;dij为节点υi与节点υj间的距离,用节点间的跳数进行度量;σ为影响因子,σ∈(0,+∞),用于控制节点的影响范围;影响因子σ的选取过程为:其中,N为所述复杂网络包含的节点总数;分别对应为节点υ1,υ2,...,υi,...,υN的拓扑势值;为标准化因子。优选地,所述节点υi的质量m(υi)的计算过程为:其中,υ'i是与节点υi直接相连的邻居节点;k为节点υi的邻居节点的个数;m(υ'i)是节点υ'i的质量;n(υ'i)是节点υ'i的邻居节点的个数;d是调节因子,0≤d≤1;当调节因子d为0时,节点质量均为1,节点间无质量差异;随着d值的增大,节点间质量差异逐渐增大;当调节因子d为1时,节点间质量差异为最大。优选地,所述峰位节点的搜索过程包括:比较每个节点的拓扑势值与自身下一跳邻居节点的拓扑势值的大小;若当前节点的拓扑势值大于自身所有邻居节点的拓扑势值,则当前节点位于拓扑势场的峰位,为峰位节点;若两个峰位节点的距离,即跳数,小于则在所述两个峰位节点中选择拓扑势值较大的节点作为社区的代表节点,另一个拓扑势值较小的节点称为合并峰位节点;否则每个峰位节点均为各自社区的代表节点。优选地,所述谷位和斜坡位的判断依据为当前节点与自身下一跳节点的拓扑势值的大小;具体判断过程包括:若当前节点的下一跳所有节点的拓扑势值均上升,且当前节点所属社区无合并峰位节点,则当前节点位于谷位;若当前节点的下一跳节点的拓扑势值部分上升部分下降,且当前节点在多个峰位节点的影响范围内,则当前节点位于谷位;若当前节点的下一跳所有节点的拓扑势值均下降,则当前节点位于斜坡位;若当前节点的下一跳所有节点的拓扑势值均上升,但当前节点所属社区存在合并峰位节点,且合并峰位节点是除代表节点外距离当前节点最近的峰位节点,则当前节点位于斜坡位;若当前节点的下一跳节点的拓扑势值部分上升部分下降,但当前节点只在自身所属社区的峰位节点的影响范围内,则当前节点位于斜坡位。一种基于拓扑势的重叠复杂网络社区发现系统,所述系统包括:拓扑势场建立模块,搜索模块,扩展模块,归属确定模块;所述拓扑势场建立模块根据给定的重叠复杂网络建立拓扑势场,并计算出网络中各个节点的拓扑势值;所述搜索模块与所述拓扑势场建立模块相连,根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;所述扩展模块与所述搜索模块相连,依次访问各个代表节点,分别以每个代表节点为中心按广度优先向外扩展,扩展到的节点称为扩展节点;所述归属确定模块与所述扩展模块相连,确定扩展节点的社区归属;若扩展节点位于拓扑势场的谷位,则为该社区与其他社区的重叠节点,扩展停止;若扩展节点位于拓扑势场的斜坡位,则为该社区的内部节点,扩展继续;全部代表节点的扩展过程结束后,未被访问过的节点均位于拓扑势场的边缘位,是不属于任何社区的孤立节点。优选地,所述拓扑势场建立模块包括:节点质量获取单元,拓扑势值获取单元;所述节点质量获取单元,计算获得网络中各个节点的质量;所述节点质量获取单元的数学模型为:其中,υ'i是与节点υi直接相连的邻居节点;k为节点υi的邻居节点的个数;m(υ'i)是节点υ'i的质量;n(υ'i)是节点υ'i的邻居节点的个数;d是调节因子,0≤d≤1;当调节因子d为0时,节点质量均为1,节点间无质量差异;随着d值的增大,节点间质量差异逐渐增大;当调节因子d为1时,节点间质量差异为最大;所述拓扑势值获取单元与所述节点本文档来自技高网
...
一种基于拓扑势的重叠复杂网络社区发现方法及系统

【技术保护点】
一种基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述基于拓扑势的重叠复杂网络社区发现方法包括:根据给定的重叠复杂网络,建立拓扑势场,计算网络中各个节点的拓扑势值;根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;依次访问各个代表节点,分别以每个代表节点为中心按广度优先向外扩展,确定扩展节点的社区归属;若扩展节点位于拓扑势场的谷位,则为该社区与其他社区的重叠节点,扩展停止;若扩展节点位于拓扑势场的斜坡位,则为该社区的内部节点,扩展继续;全部代表节点的扩展过程结束后,未被访问过的节点位于拓扑势场的边缘位,是不属于任何社区的孤立节点。

【技术特征摘要】
1.一种基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述基于拓扑势的重叠复杂网络社区发现方法包括:根据给定的重叠复杂网络,建立拓扑势场,计算网络中各个节点的拓扑势值;根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;所述峰位节点为自身拓扑势值大于所有邻居节点的拓扑势值的节点;若两个峰位节点的距离小于所述两个峰位节点中拓扑势值较大的节点为社区的代表节点,另一个拓扑势值较小的节点称为合并峰位节点;否则每个峰位节点均为各自社区的代表节点;其中,σ为影响因子,σ∈(0,+∞),用于控制节点的影响范围;依次访问各个代表节点,分别以每个代表节点为中心按广度优先向外扩展,确定扩展节点的社区归属;若扩展节点位于拓扑势场的谷位,则为该社区与其他社区的重叠节点,扩展停止;若扩展节点位于拓扑势场的斜坡位,则为该社区的内部节点,扩展继续;所述谷位和斜坡位的判断依据为当前待判断的节点与自身下一跳节点的拓扑势值的大小;具体判断过程包括:若当前节点的下一跳所有节点的拓扑势值均上升,且当前节点所属社区无合并峰位节点,则当前节点位于谷位;若当前节点的下一跳节点的拓扑势值部分上升部分下降,且当前节点在多个峰位节点的影响范围内,则当前节点位于谷位;若当前节点的下一跳所有节点的拓扑势值均下降,则当前节点位于斜坡位;若当前节点的下一跳所有节点的拓扑势值均上升,但当前节点所属社区存在合并峰位节点,且合并峰位节点是除代表节点外距离当前节点最近的峰位节点,则当前节点位于斜坡位;若当前节点的下一跳节点的拓扑势值部分上升部分下降,但当前节点只在自身所属社区的峰位节点的影响范围内,则当前节点位于斜坡位;全部代表节点的扩展过程结束后,未被访问过的节点位于拓扑势场的边缘位,是不属于任何社区的孤立节点。2.根据权利要求1所述的基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述网络中各个节点υi的拓扑势值的计算过程为:其中,n为节点υi影响范围内的节点数,节点υi的最大影响距离为m(υi)为节点υi的质量;dij为节点υi与节点υj间的距离,用节点间的跳数进行度量;影响因子σ的选取过程为:其中,N为所述复杂网络包含的节点总数;分别对应为节点υ1,υ2,…,υi,…,υN的拓扑势值;为标准化因子。3.根据权利要求2所述的基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述节点υi的质量m(υi)的计算过程为:其中,υi'是与节点υi直接相连的邻居节点;k为节点υi的邻居节点的个数;m(υ′i)是节点υ′i的质量;n(υ′i)是节点υ′i的邻居节点的个数;d是调节因子,0≤d≤1;当调节因子d为0时,节点质量均为1,节点间无质量差异;随着d值的增大,节点间质量差异逐渐增大;当调节因子d为1时,节点间质量差异为最大。4.根据权利要求1所述的基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述峰位节点的搜索过程包括:比较每个节点的拓扑势值与自身下一跳邻居节点的拓扑势值的大小;若当前节点的拓扑势值大于自身所有邻居节点的拓扑势值,则当前节点位于拓扑势场的峰位,为峰位节点;若两个峰位节点的距离,即跳数,小于则在所述两个峰位节点中选择拓扑势值较大的节点作为社区的代表节点,另一个拓扑势值较小的节点称为合并峰位节点。5.一种基于拓扑势的重叠复杂网络社区发现系统,其特征在于,所述系统包括:拓扑势场建立模块,根据给定的重叠复杂网络建立拓扑势场,并计算出网络中各个节点的拓扑势值;搜索模块,与所述拓扑势场建立模块相连,根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;所述峰位节点为自身拓扑势值大于所有邻居节点的...

【专利技术属性】
技术研发人员:王志晓赵亚陈昭彤
申请(专利权)人:中国矿业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1