【技术实现步骤摘要】
一种基于拓扑势的重叠复杂网络社区发现方法及系统
本专利技术属于网络识别
,涉及一种网络社区发现方法,特别是涉及一种基于拓扑势的重叠复杂网络社区发现方法及系统。
技术介绍
现实世界中的诸多系统都以复杂网络的形式存在,如科技系统中的因特网,社会系统中的人际关系网,生态环境中的食物链网,以及电力网络和交通网络。社区发现是复杂网络的一项重要研究内容,对于分析复杂网络的拓扑结构,理解复杂系统的功能,发现复杂网络中的隐藏规律、演化趋势以及预测复杂网络的行为都具有重要的意义。目前已存在多种复杂网络社区发现方法,拓扑势方法是这些方法中的一个重要分支,该类方法具有时间复杂度低,无需领域或专家知识等优势。淦文燕等人在发表于2009年《软件学报》期刊的文章“一种基于拓扑势的网络社区发现方法”中首次引入拓扑势描述复杂网络节点间的作用与联系,将每个社区视为拓扑势场的局部高势区,通过效益函数确定每个复杂网络节点的社区归属。该方法对重叠节点的确定条件比较严苛,从而导致重叠节点数量过于稀少,缺乏现实合理性。韩言妮等人在发表于2011年《FrontiersofComputerScienceofChina》期刊的文章“Identifyingdifferentcommunitymembersincomplexnetworksbasedontopologypotential”中提出基于拓扑势的复杂网络节点类型识别和重叠社区发现。该方法仅仅借助拓扑势找出社区代表节点,即局部极值点,在以局部极值节点为中心往外扩展划分社区过程中,判断节点社区归属的主要依据是节点度等有关节点连接关系的统计信息。张 ...
【技术保护点】
一种基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述基于拓扑势的重叠复杂网络社区发现方法包括:根据给定的重叠复杂网络,建立拓扑势场,计算网络中各个节点的拓扑势值;根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;依次访问各个代表节点,分别以每个代表节点为中心按广度优先向外扩展,确定扩展节点的社区归属;若扩展节点位于拓扑势场的谷位,则为该社区与其他社区的重叠节点,扩展停止;若扩展节点位于拓扑势场的斜坡位,则为该社区的内部节点,扩展继续;全部代表节点的扩展过程结束后,未被访问过的节点位于拓扑势场的边缘位,是不属于任何社区的孤立节点。
【技术特征摘要】
1.一种基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述基于拓扑势的重叠复杂网络社区发现方法包括:根据给定的重叠复杂网络,建立拓扑势场,计算网络中各个节点的拓扑势值;根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;所述峰位节点为自身拓扑势值大于所有邻居节点的拓扑势值的节点;若两个峰位节点的距离小于所述两个峰位节点中拓扑势值较大的节点为社区的代表节点,另一个拓扑势值较小的节点称为合并峰位节点;否则每个峰位节点均为各自社区的代表节点;其中,σ为影响因子,σ∈(0,+∞),用于控制节点的影响范围;依次访问各个代表节点,分别以每个代表节点为中心按广度优先向外扩展,确定扩展节点的社区归属;若扩展节点位于拓扑势场的谷位,则为该社区与其他社区的重叠节点,扩展停止;若扩展节点位于拓扑势场的斜坡位,则为该社区的内部节点,扩展继续;所述谷位和斜坡位的判断依据为当前待判断的节点与自身下一跳节点的拓扑势值的大小;具体判断过程包括:若当前节点的下一跳所有节点的拓扑势值均上升,且当前节点所属社区无合并峰位节点,则当前节点位于谷位;若当前节点的下一跳节点的拓扑势值部分上升部分下降,且当前节点在多个峰位节点的影响范围内,则当前节点位于谷位;若当前节点的下一跳所有节点的拓扑势值均下降,则当前节点位于斜坡位;若当前节点的下一跳所有节点的拓扑势值均上升,但当前节点所属社区存在合并峰位节点,且合并峰位节点是除代表节点外距离当前节点最近的峰位节点,则当前节点位于斜坡位;若当前节点的下一跳节点的拓扑势值部分上升部分下降,但当前节点只在自身所属社区的峰位节点的影响范围内,则当前节点位于斜坡位;全部代表节点的扩展过程结束后,未被访问过的节点位于拓扑势场的边缘位,是不属于任何社区的孤立节点。2.根据权利要求1所述的基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述网络中各个节点υi的拓扑势值的计算过程为:其中,n为节点υi影响范围内的节点数,节点υi的最大影响距离为m(υi)为节点υi的质量;dij为节点υi与节点υj间的距离,用节点间的跳数进行度量;影响因子σ的选取过程为:其中,N为所述复杂网络包含的节点总数;分别对应为节点υ1,υ2,…,υi,…,υN的拓扑势值;为标准化因子。3.根据权利要求2所述的基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述节点υi的质量m(υi)的计算过程为:其中,υi'是与节点υi直接相连的邻居节点;k为节点υi的邻居节点的个数;m(υ′i)是节点υ′i的质量;n(υ′i)是节点υ′i的邻居节点的个数;d是调节因子,0≤d≤1;当调节因子d为0时,节点质量均为1,节点间无质量差异;随着d值的增大,节点间质量差异逐渐增大;当调节因子d为1时,节点间质量差异为最大。4.根据权利要求1所述的基于拓扑势的重叠复杂网络社区发现方法,其特征在于,所述峰位节点的搜索过程包括:比较每个节点的拓扑势值与自身下一跳邻居节点的拓扑势值的大小;若当前节点的拓扑势值大于自身所有邻居节点的拓扑势值,则当前节点位于拓扑势场的峰位,为峰位节点;若两个峰位节点的距离,即跳数,小于则在所述两个峰位节点中选择拓扑势值较大的节点作为社区的代表节点,另一个拓扑势值较小的节点称为合并峰位节点。5.一种基于拓扑势的重叠复杂网络社区发现系统,其特征在于,所述系统包括:拓扑势场建立模块,根据给定的重叠复杂网络建立拓扑势场,并计算出网络中各个节点的拓扑势值;搜索模块,与所述拓扑势场建立模块相连,根据所述各节点的拓扑势值搜索获得拓扑势场中的所有峰位节点,从所有峰位节点中选取每个社区的代表节点;所述峰位节点为自身拓扑势值大于所有邻居节点的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。