一种基于模糊关系的重叠社区划分方法技术

技术编号:37783430 阅读:18 留言:0更新日期:2023-06-09 09:14
本发明专利技术涉及一种基于模糊关系的重叠社区划分方法,属于自然语言处理领域,包括以下步骤:S1:对获得的社区数据进行预处理,预设最小连接度,将低于最小连接度的节点过滤;S2:将给定节点的拥有最高中心度的最邻近节点命名为NGC节点,计算每个节点对应的NGC节点;S3:计算节点与其对应NGC节点间的模糊关系;S4:对社区进行划分,获得重叠社区。本方法将局部信息应用于传统的社区划分算法中与种子拓展原理结合,使用人工网络与真实网络数据得到重叠社区划分结果,是一种能在保证较低时间复杂度的前提下,如实反映社区结构的社区检测算法。如实反映社区结构的社区检测算法。如实反映社区结构的社区检测算法。

【技术实现步骤摘要】
一种基于模糊关系的重叠社区划分方法


[0001]本专利技术属于自然语言处理领域中的社区划分方法,涉及一种基于模糊关系的重叠社区划分方法

技术介绍

[0002]在现实世界中充斥着大量的网络,这些网络通常可以抽象为由节点和边组成,其中有些网络中的边包含权重属性,如工程施工问题中的最优路径;有些网络中的节点包含独特属性,如某些节点间存在更高的依赖关系,而另一些节点间则存在着互斥的倾向。但总而言之,只要是形如点和边组成的存在一定相互作用的网络结构,均可称之为复杂网络,并成为我们研究的内容。而复杂网络的所有属性中,最为重要也是最为值得研究的则是网络的社区检测,即将整个网络依据一定原则,划分为一个个我们称之为社区的具有某种相似性的节点集合,因为其蕴含着整个网络的拓扑结构,以及社区间节点的关系。
[0003]对于社区的概念,从来没有一个得到所有学者公认的定义,但是通常来说,可以将社区理解为一组节点的集合,其特征是社区的内部节点紧密相连,而社区之间的节点连接相对稀疏
[1]。揭示复杂网络中的社区并挖掘社区之间隐藏的关系对于复杂网络分析至关重要。社区检测是一个复杂而有意义的过程,它在研究复杂网络结构中起着重要作用,其目标是将网络划分为多个社区,并且获得的社区符合社区的一般定义,藉此可以对网络进行进一步的分析,如消费者行为的预测、作家写作风格的鉴定、未来一段时期发生某种周期性事件的概率等等。
[0004]以往的经典算法由于目标网络相对较小,往往注重了算法的性能而忽略了算法的效率,在现实网络逐渐增长的现在,许多算法暴露出了原来没有的缺陷:由于算法中使用过多的全局信息,导致计算成本过高。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于模糊关系的重叠社区发现方法,同时拥有局部信息的良好时间性能和重叠社区的划分准确性、覆盖率等性能,在较低的计算时间内产生模块化程度较高、与真实情况更为一致的社区。
[0006]为达到上述目的,本专利技术提供如下技术方案:
[0007]一种基于模糊关系的重叠社区划分方法,包括以下步骤:
[0008]S1:对获得的社区数据进行预处理,预设最小连接度,将低于最小连接度的节点过滤;
[0009]S2:将给定节点的拥有最高中心度的最邻近节点命名为NGC(Nearest node with Greater Centrality)节点,计算每个节点对应的NGC节点;
[0010]S3:计算节点与其对应NGC节点间的模糊关系;
[0011]S4:对社区进行划分,获得重叠社区。
[0012]进一步,步骤S1所述预处理具体包括以下步骤:
[0013]S11:找到网络中的最大二连通核;
[0014]S12:删去最大二连通核以外的须,并在社区划分步骤结束以后还原。
[0015]进一步,步骤S2具体包括以下步骤:
[0016]S21:计算节点邻居相似性,用于衡量两节点间的相似程度C(v
i
,v
j
):
[0017]C(v
i
,v
j
)=|n(v
i
)∩n(v
j
)|
[0018]其中,v
i
,v
j
分别为网络中两个不同节点,n(v
i
)与n(v
j
)分别用来表示节点v
i
和节点v
j
的邻居节点集合。
[0019]S22:计算节点对应的局部中心度:
[0020][0021]其中,deg(v
i
)表示节点v的度,Γ(v
i
)同样用来表示节点v的邻居节点集合;
[0022]S23:计算每个节点对应的NGC节点:
[0023]S231:对于节点v的NGC节点,首先从v的邻居中构成一个优先级队列Q;
[0024]S232:从Q中选择第一个节点u,如果u的中心性大于v,则搜索结束并返回u;否则,将u的邻居加入到Q中,重复步骤S232,直到找到具有更大的中心性的u。
[0025]进一步,步骤S3具体包括:
[0026]S31:由网络中所有节点与其对应的NGC节点,获得由节点到其NGC节点的所有路径集合P,用p代表其中一条路径,p的存储形式为一个有序节点集合,其以节点V开始,到NGC(V)结束;
[0027]S32:计算每条路径对应的R(V,NGC(V)),其中路径最短那一条对应R值即为模糊关系:
[0028][0029]计算μ
p
(N1,N
k
)需要先计算μ
p
(N
k
‑1,N
k
),计算方式如下:
[0030][0031]其中,
[0032]进一步,步骤S4具体包括以下步骤:
[0033]S41:得到初始化的C,N
in
,N
out
,vc和R
avg

[0034]其中,C指目标社区,N
in
表示只与社区内部有边连接的节点,N
out
指有边与社区外部连接的节点,vc指社区内的节点数,R
avg
指社区内节点的平均度。
[0035]S42:接着从N
in
中取出拥有最大模糊关系的节点v,若节点v符合以下条件,则将节点v从N
in
中移除并添加到C中:C改变后,更新N
in
,N
out
,vc和R
avg
,直到循环条件不再满足或者N
in
为空;
[0036]S43:返回C,即为得到的重叠社区。
[0037]进一步,步骤S41所述得到初始化的C,N
in
,N
out
,vc和R
avg
,具体包括以下步骤:
[0038]S411:领vc=v
i
,R
avg
=0,
[0039]S412:将v
i
放入C中;
[0040]S413:寻找v
i
的NGC节点,计算相应的模糊关系;
[0041]S414:更新N
in
,N
out

[0042]S415:v

N
in
中有最大模糊关系的节点;
[0043]S416:将v从N
in
中移出,并将其添加到C中;
[0044]S417:重复步骤S414;
[0045]S418:更新R
avg

[0046]进一步,所述更新N
in
,N
out
具体包括以下步骤:
[0047]S421:将N
out本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于模糊关系的重叠社区划分方法,其特征在于:包括以下步骤:S1:对获得的社区数据进行预处理,预设最小连接度,将低于最小连接度的节点过滤;S2:将给定节点的拥有最高中心度的最邻近节点命名为NGC节点,计算每个节点对应的NGC节点;S3:计算节点与其对应NGC节点间的模糊关系;S4:对社区进行划分,获得重叠社区。2.根据权利要求1所述的基于模糊关系的重叠社区划分方法,其特征在于:步骤S1所述预处理具体包括以下步骤:S11:找到网络中的最大二连通核;S12:删去最大二连通核以外的须,并在社区划分步骤结束以后还原。3.根据权利要求1所述的基于模糊关系的重叠社区划分方法,其特征在于:步骤S2具体包括以下步骤:S21:计算节点邻居相似性,用于衡量两节点间的相似程度C(v
i
,v
j
):C(v
i
,v
j
)=|n(v
i
)∩n(v
j
)|其中,v
i
,v
j
分别为网络中两个不同节点,n(v
i
)与n(v
j
)分别用来表示节点v
i
和节点v
j
的邻居节点集合;S22:计算节点对应的局部中心度:其中,deg(v
i
)表示节点v的度,Γ(v
i
)同样用来表示节点v的邻居节点集合;S23:计算每个节点对应的NGC节点:S231:对于节点v的NGC节点,首先从v的邻居中构成一个优先级队列Q;S232:从Q中选择第一个节点u,如果u的中心性大于v,则搜索结束并返回u;否则,将u的邻居加入到Q中,重复步骤S232,直到找到具有更大的中心性的u。4.根据权利要求1所述的基于模糊关系的重叠社区划分方法,其特征在于:步骤S3具体包括:S31:由网络中所有节点与其对应的NGC节点,获得由节点到其NGC节点的所有路径集合P,用p代表其中一条路径,p的存储形式为一个有序节点集合,其以节点V开始,到NGC(V)结束;S32:计算每条路径对应的R(V,NGC(V)),其中路径最短那一条对应R值即为模糊关系:计算μ
p
(N1,N
k
)需要先计算μ
p
(N
k
‑1,N
k
),计算方式如下:其中,Γ(N

【专利技术属性】
技术研发人员:刘洪涛张斌弛张岩武宁
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1