The present invention relates to a densely overlapping community partitioning method for large-scale complex networks, which comprises the following steps: S1. abstracting a large-scale network into an undirected graph, initializing system parameters, including setting the initial community circle subset as an empty set, setting iteration stopping conditions; S2. traversing nodes that have not been visited, and Set the node as the seed of the community circle, and expand the circle from the node; and use the priority queue to maintain the node's extensible node set, which maintains the neighbor nodes and keeps updating; S3. Continuously expand the node, when the community circle's derivative can no longer reduce or has reached iteration. When the stop condition is finished, the community expands and adds the community circle to the community circle subset; S4. Judges whether all nodes have been accessed, if not, jumps to S2, otherwise enters S5; S5. Outputs the community circle subset, and the algorithm ends.
【技术实现步骤摘要】
一种面向大规模复杂网络的密集可重叠社区划分方法
本专利技术涉及并行计算与社交网络领域,更具体地,涉及一种面向大规模复杂网络的密集可重叠社区划分方法。
技术介绍
近年来,随着大型社交网络的兴起(比如Facebook,Twitter和微博),社区挖掘(CommunityDetection)逐渐引起了学术界和产业界的广泛关注。社区挖掘的目标在于从抽象的网络之中,挖掘出具有高内聚低耦合的社交圈子,这些圈子可能是稠密的并且是可重叠的。目前,Facebook已经有着超过20亿的每月活跃用户,如此之多的用户构建了一个庞大的社交网络。社区挖掘可以带来很多收益,比如Facebook可以给有着相同兴趣爱好的圈子内的成员推荐朋友;Amazon可以根据其货物与用户组成的网络,挖掘出具有相似购买兴趣的圈子,给圈子内用户推荐商品;在金融银行之中,可以进行社区挖掘,对圈子内的用户进行风险评估和用户信用评测。但是,目前社区挖掘研究之中,还存在着许多的挑战和不足。一是要解决大型网络的计算复杂度问题,已有的研究认为,在庞大的社交网络之中挖掘出具有高内聚低耦合的社区圈子,需要设计具有较低复杂度的算法,因此需要设计良好的启发式算法;二是在密集的可重叠社区的挖掘研究之中,已有的研究经常要假设已经知道挖掘的社区的数目,但是这个数目一般是很难估计的,只能凭经验预估,具有很大的随意性;三是已有的研究之中,研究者经常将网络抽象的大型图,切割成若干个小图,这样会丢失原有图的信息,虽然有一些研究探索如何最小化图的丢失信息,切割成若干分离的图,但是总会丢失原有图的有用信息。
技术实现思路
本专利技术提供了一种面向大 ...
【技术保护点】
1.一种面向大规模复杂网络的密集可重叠社区划分方法,其特征在于:包括以下步骤:S1.将大型网络抽象成一个无向图,初始化系统参数,包括设置初始社区圈子集合为空集,设置迭代停止条件;S2.遍历还没有被访问过的节点,并将该节点设置为社区圈子的种子,从该节点出发进行扩展圈子;并使用优先队列来维护该节点的可扩展的节点集合,该优先队列维护邻居节点,并且不断更新;S3.不断扩展该节点,当社区圈子的导率无法再减小或者已达到迭代停止条件时,社区扩展完毕,将社区圈子加入到社区圈子集合;S4.判断所有节点是否都已经访问完毕,如果没有,跳到步骤S2,否则进入S5;S5.输出社区圈子集合,算法结束。
【技术特征摘要】
1.一种面向大规模复杂网络的密集可重叠社区划分方法,其特征在于:包括以下步骤:S1.将大型网络抽象成一个无向图,初始化系统参数,包括设置初始社区圈子集合为空集,设置迭代停止条件;S2.遍历还没有被访问过的节点,并将该节点设置为社区圈子的种子,从该节点出发进行扩展圈子;并使用优先队列来维护该...
【专利技术属性】
技术研发人员:吴迪,叶国桥,吴展鹏,陈润源,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。