一种基于适应性函数和社区相似性的社团发现方法技术

技术编号:28838015 阅读:21 留言:0更新日期:2021-06-11 23:35
本发明专利技术公开了一种基于适应性函数和社区相似性的社团发现方法,属于社区发现领域。本发明专利技术采用的适应性函数着重考虑候选节点与待加入社区的三种联系,解决了可能在拓展过程中把一开始的种子节点排除在外,最后导致许多节点无法分配到社区的问题,并且利用特殊的数据结构优化了时间效率;然后社区相似性度量通过两个社团之间真实联系数和期望联系数之间的差值来有效地判断两个社区是否重复度过高,从而可以高效合并重复社区,让社区划分的结构更加紧密,模块度更高。本发明专利技术先利用适应性函数,把随机选择的种子节点拓展成一个个小社区,然后利用社区相似性度量把重复的小社区合并,从而得到最后的模块度较高的社区划分,从而快速有效地将复杂网络划分成一个个结构明显的社区。

【技术实现步骤摘要】
一种基于适应性函数和社区相似性的社团发现方法
本专利技术提供一种基于适应性函数和社区相似性的社团发现算法,属于网络社区划分领域。
技术介绍
网络社区划分在很多领域,比如计算机科学、社会学、生物学、交通学,获得了关注。因为大部分复杂系统可以被建模为复杂网络。网络中每个节点代表人们感兴趣要研究的实体,而边则代表不同实体之间的关系。发现网络中的社区可以更好地帮助我们研究网络的结构特征,比如社交网络同社区的人往往有共同的兴趣;把网页集合分为一个个社区,意味着这些网页往往都有同一个主题。传统的社区划分算法专注发现不相交的社区,而不是发现互相有重叠的社区;往往利用全局优化的手段,而不是局部优化的方法来得到社区划分。LFM(LocalFitnessMethod)作为一种基于本地拓展优化的算法,虽然能够较为快速地划分社区,但是容易出现在拓展社区的过程中把种子节点先加入后排除,再加入再排除的情况,严重影响了算法效率和准确度。因此,LFMEX(LocalFitnessMethodExtension)被我们提出来,采用了新的适应性函数和社区相似性度量。新的适本文档来自技高网...

【技术保护点】
1.一种基于适应性函数和社区相似性的社团发现算法,其特征在于,具体包括以下步骤:/nS1,输入图结构G(V,E),V代表节点集合,E代表边集合。/nS2,随机选择一个未分配社区的节点作为种子节点,形成初始社区。/nS3,不断优化适应性函数,从社区周围的待选节点中选择适应性最大的节点加入待拓展社区,形成一个新的社区。/nS4,重复S2、S3过程,直到所有节点都分配到社区,得到一个原始社区划分,这些社区可能相互之间包含过多相同的节点,从而使社区划分的模块度较低。/nS5,利用社区相似性度量计算每个社区i和周围社区j之间的相似性,大于阈值∈,并且相似性最大的社区j被标记为i的最相似社区,合并两两互为...

【技术特征摘要】
1.一种基于适应性函数和社区相似性的社团发现算法,其特征在于,具体包括以下步骤:
S1,输入图结构G(V,E),V代表节点集合,E代表边集合。
S2,随机选择一个未分配社区的节点作为种子节点,形成初始社区。
S3,不断优化适应性函数,从社区周围的待选节点中选择适应性最大的节点加入待拓展社区,形成一个新的社区。
S4,重复S2、S3过程,直到所有节点都分配到社区,得到一个原始社区划分,这些社区可能相互之间包含过多相同的节点,从而使社区划分的模块度较低。
S5,利用社区相似性度量计算每个社区i和周围社区j之间的相似性,大于阈值∈,并且相似性最大的社区j被标记为i的最相似社区,合并两两互为最相似社区的社区对。
S6,不断重复S5,直到不再有社区需要合并,得到最终的社区划分。


2.如权利要求1所述的基于适应性函数和社区相似性的社团发现算法,其特征在于,所述步骤S3中“不断优化适应性函数”,包括:
适应性函数公式为:



s.t.0<θ<1
x+y+z=ki
0<α<1
0<β<1
0<α+β<1
其中代表的是社区C的全部内度之和,是社区C的全部外都之和,所谓内度就是贡献度的边两端节点都在社区C之内,而外度则是一端在社区内,另一端在社区外。x代表的是节点i和社区C直接相连的边数,z代表的是i和其他社区相连的边数,y则是剩下的边数,因此x,y,z的和是节点i的度数。α,β作为权重,动态调节x,y,z的重要性。Θ控制最后拓展成的社区大小,θ越小,则最后生成的社区越大。<...

【专利技术属性】
技术研发人员:张凌筱燕雪峰
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1