【技术实现步骤摘要】
一种基于模糊关系的重叠社区划分方法
[0001]本专利技术属于自然语言处理领域中的社区划分方法,涉及一种基于模糊关系的重叠社区划分方法
技术介绍
[0002]在现实世界中充斥着大量的网络,这些网络通常可以抽象为由节点和边组成,其中有些网络中的边包含权重属性,如工程施工问题中的最优路径;有些网络中的节点包含独特属性,如某些节点间存在更高的依赖关系,而另一些节点间则存在着互斥的倾向。但总而言之,只要是形如点和边组成的存在一定相互作用的网络结构,均可称之为复杂网络,并成为我们研究的内容。而复杂网络的所有属性中,最为重要也是最为值得研究的则是网络的社区检测,即将整个网络依据一定原则,划分为一个个我们称之为社区的具有某种相似性的节点集合,因为其蕴含着整个网络的拓扑结构,以及社区间节点的关系。
[0003]对于社区的概念,从来没有一个得到所有学者公认的定义,但是通常来说,可以将社区理解为一组节点的集合,其特征是社区的内部节点紧密相连,而社区之间的节点连接相对稀疏
[1]。揭示复杂网络中的社区并挖掘社区之间隐藏的关系对于复杂网络分析至关重要。社区检测是一个复杂而有意义的过程,它在研究复杂网络结构中起着重要作用,其目标是将网络划分为多个社区,并且获得的社区符合社区的一般定义,藉此可以对网络进行进一步的分析,如消费者行为的预测、作家写作风格的鉴定、未来一段时期发生某种周期性事件的概率等等。
[0004]以往的经典算法由于目标网络相对较小,往往注重了算法的性能而忽略了算法的效率,在现实网络逐渐增长的现在,许多算法 ...
【技术保护点】
【技术特征摘要】
1.一种基于模糊关系的重叠社区划分方法,其特征在于:包括以下步骤:S1:对获得的社区数据进行预处理,预设最小连接度,将低于最小连接度的节点过滤;S2:将给定节点的拥有最高中心度的最邻近节点命名为NGC节点,计算每个节点对应的NGC节点;S3:计算节点与其对应NGC节点间的模糊关系;S4:对社区进行划分,获得重叠社区。2.根据权利要求1所述的基于模糊关系的重叠社区划分方法,其特征在于:步骤S1所述预处理具体包括以下步骤:S11:找到网络中的最大二连通核;S12:删去最大二连通核以外的须,并在社区划分步骤结束以后还原。3.根据权利要求1所述的基于模糊关系的重叠社区划分方法,其特征在于:步骤S2具体包括以下步骤:S21:计算节点邻居相似性,用于衡量两节点间的相似程度C(v
i
,v
j
):C(v
i
,v
j
)=|n(v
i
)∩n(v
j
)|其中,v
i
,v
j
分别为网络中两个不同节点,n(v
i
)与n(v
j
)分别用来表示节点v
i
和节点v
j
的邻居节点集合;S22:计算节点对应的局部中心度:其中,deg(v
i
)表示节点v的度,Γ(v
i
)同样用来表示节点v的邻居节点集合;S23:计算每个节点对应的NGC节点:S231:对于节点v的NGC节点,首先从v的邻居中构成一个优先级队列Q;S232:从Q中选择第一个节点u,如果u的中心性大于v,则搜索结束并返回u;否则,将u的邻居加入到Q中,重复步骤S232,直到找到具有更大的中心性的u。4.根据权利要求1所述的基于模糊关系的重叠社区划分方法,其特征在于:步骤S3具体包括:S31:由网络中所有节点与其对应的NGC节点,获得由节点到其NGC节点的所有路径集合P,用p代表其中一条路径,p的存储形式为一个有序节点集合,其以节点V开始,到NGC(V)结束;S32:计算每条路径对应的R(V,NGC(V)),其中路径最短那一条对应R值即为模糊关系:计算μ
p
(N1,N
k
)需要先计算μ
p
(N
k
‑1,N
k
),计算方式如下:其中,Γ(N
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。