一种基于极大团与强连通分量的社区发现方法技术

技术编号:29156727 阅读:31 留言:0更新日期:2021-07-06 22:56
本发明专利技术公开了一种基于极大团与强连通分量的社区发现方法,适用于有向网络中底图是团且顶点间连边满足强连通的社区结构,通过预处理、分步枚举、结果判重三大步骤,最终得到所有顶点数量不小于给定阈值的极大有向团社区。本发明专利技术采用上述社区发现方法,在大规模图数据处理中,减少枚举的冗余计算量,实现了并行化计算,效率较高。

【技术实现步骤摘要】
一种基于极大团与强连通分量的社区发现方法
本申请属于数据挖掘
,具体涉及一种有向网络中的特定社区结构发现方法。
技术介绍
随着数字技术的飞速发展,图模型已经被广泛应用于表示大量的信息和数据间的复杂关系,现实世界的许多复杂系统都能被抽象表示为复杂网络的形式。不同于随机生成的图数据,实际网络往往包含许多子网络结构,同一子网络内的个体关系紧密,而不同子网络间的个体关系较为稀疏。通过网络的连边情况,不同性质、类型的节点组成了关系丰富的社区结构。在现实世界中,节点经常隶属于多个社区,例如生物网络中大部分蛋白质有多种生物功能,人际交往网络中每个人可以依据工作、教育、家庭等方面分为多个社会团体。因此重叠社区发现在真实世界更具有普遍性,其允许节点同时属于多个社区,对复杂网络不完全严格划分,有着重要的应用价值。同时,现实世界中抽象出的复杂网络往往为有向网络,节点间的联系具有方向性。在保留边方向的抽象网络中进行社区发现,更能有效反映出复杂网络的真实结构。2017年Conte等人提出有向网络中具有团的性质和连通性约束的社区结构,但其给出的输出敏本文档来自技高网...

【技术保护点】
1.一种基于极大团与强连通分量的社区发现方法,其特征在于,包括如下步骤:/nS1:图数据预处理,根据阈值参数与有向团的性质对输入数据进行预处理,缩减顶点集合的大小,并且将原图分成互不相交的若干个子图,再分别进行顶点排序;/nS2:分步枚举,对每个子图分别使用枚举算法,寻找原图的极大有向团;/nS3:结果判重,通过对寻找到的所有极大有向团进行比较,去除重复的极大有向团并存储。/n

【技术特征摘要】
1.一种基于极大团与强连通分量的社区发现方法,其特征在于,包括如下步骤:
S1:图数据预处理,根据阈值参数与有向团的性质对输入数据进行预处理,缩减顶点集合的大小,并且将原图分成互不相交的若干个子图,再分别进行顶点排序;
S2:分步枚举,对每个子图分别使用枚举算法,寻找原图的极大有向团;
S3:结果判重,通过对寻找到的所有极大有向团进行比较,去除重复的极大有向团并存储。


2.根据权利要求1所述的基于极大团与强连通分量的社区发现方法,其特征在于,所述S1步骤具体包括:
S11:缩图删点,基于k核心算法,删去所有度数小于k或者入度出度任一为零的顶点;
S12:划分子图,对原图的每一个强连通分量进行缩点,从而将原图变成一张有向无环图;然后,将上述有向无环图根据强连通分量个数,划分为对应个数的不相交子图;
S13:顶点排序,将每个子图中的顶点按照degeneracy顺序重新编号。


3.根据权利要求1所述的基于极大团与强连通分量的社区发现方法,其特征在于,所述S2步...

【专利技术属性】
技术研发人员:陈久健李荣华王国仁金福生秦宏超
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1