【技术实现步骤摘要】
一种复杂网络中基于聚类系数的并行图摘要算法
[0001]本专利技术涉及一种复杂网络中基于聚类系数的并行图摘要算法,属于计算机
技术介绍
[0002]随着互联网等信息技术的发展,图结构作为一种表示复杂信息的数据结构,能够简洁的表示现实生活中对象间各种各样的复杂关系,被广泛应用于计算生物学和化学的分子分析、道路网络、超大规模集成电路、社交网络和语义网等领域。随着数据量的爆发式增长,图数据的规模也在以指数级的规模变大。使用一般的方法来处理如此庞大的数据,会产生较高的时间复杂度和空间复杂度。
[0003]为了解决上述问题,人们提出了一种图摘要算法,将原始图简化为摘要图,使得规模要远小于原始图,在摘要图中,每一个顶点都代表一个顶点集合,每条边代表两个顶点集合之间所有的连接。传统的图摘要算法在计算效率方面较为低下,造成了计算资源的极大的浪费,不能满足实际应用的需求。
技术实现思路
[0004]为了解决现有图摘要算法中存在的问题,本专利技术本考虑了复杂网络的幂律分布特点,提出了一种复杂网络中基于聚类系数的 ...
【技术保护点】
【技术特征摘要】
1.一种复杂网络中基于聚类系数的并行图摘要算法,其特征在于:以顶点的聚类系数作为图摘要生成修正边集合的标准,包括以下步骤:步骤1,图分区阶段:将图的原始顶点集合划分为不同的分区;步骤2,并行压缩阶段:对于每个不同的分区,分别建立图摘要集合,并且将分区图的原始顶点集Vs和边集Es作为图摘要的初始顶点集合Vs
′
和边集合Es
′
,计算每个分区图中顶点集合所有顶点的度,对于每个分区顶点,根据顶点选择策略从Vs
′
中选择初始点,计算聚类系数,并合并该顶点与其所有一跳邻居顶点并生成新顶点;步骤3,生成修正阶段:更新图摘要顶点集合Vs
′
,同时根据聚类系数生成修正边集合,并更新图摘要的边集合Es
′
;步骤4,输出阶段:继续遍历各个分区中图摘要顶点集合,重复执行上述合并过程,直至各分区摘要图顶点总数小于阈值时停止,最终合并输出总的摘要图和修正边集合。2.根据权利要求1所述的复杂网络中基于聚类系数的并行图摘要算法,其特征在于:所述步骤1中,采用Hash算法将图的原始顶点集合划分为不同的分区。3.根据权利要求1所述的复杂网络中基于聚类系数的并行图摘要算法,其特征在于:所述步骤2中,对于每个不同的分区,分别建立图摘要集合,初始化图摘要顶点集合Vs...
【专利技术属性】
技术研发人员:刘强,刘浩,魏佳星,季一木,刘尚东,吴飞,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。