【技术实现步骤摘要】
一种基于图压缩的社区发现方法
[0001]本专利技术涉及社交网络领域,尤其是涉及一种基于图压缩的社区发现方法。
技术介绍
[0002]信息爆炸时代,随着电子设备的普及,社交网络的应用越来越广泛,其规模也在不断增大。社交网络的核心在于参与其中的用户,可以用节点表示用户(实体),用边表示用户(实体)之间的关系,构建社交网络图。了解社交网络的底层数据结构对于研究社交网络非常重要。通过挖掘和识别社区结构,可以获取网络中的丰富信息,了解社区的发展规律以及社区结构之间的关系。这不仅有助于对社区用户进行推荐,实施个性化服务,还有利于特定信息的传播。然而,随着社交网络规模的不断增大,社交网络图往往非常庞大,数据量也很大。这些海量数据存在着冗余度高、处理困难等问题,这不仅占据大量的存储空间,而且还存在一些干扰信息。
[0003]由于社交网络图的规模较大,这给一些社区发现算法带来了挑战。因此,降低社交网络图的规模成为一个亟待解决的问题。一些压缩图的方法采用暴力的方式将度为1和2的节点压缩到它们的邻居中,这可以在一定程度上去除一些干扰信息 ...
【技术保护点】
【技术特征摘要】
1.一种基于图压缩的社区发现方法,其特征在于,包括以下步骤:步骤1)获取初始图信息,并对图节点重要性进行排序,选择待压缩节点;步骤2)将待压缩节点压缩后得到压缩图,利用压缩图重新构建邻接矩阵,并基于图卷积网络对压缩图进行社区检测;步骤3)对压缩图检测的社区进行扩展,还原初始图的社区检测状态,得到社区发现结果。2.根据权利要求1所述的一种基于图压缩的社区发现方法,其特征在于,所述步骤1)包括以下步骤:步骤11)获取初始图信息;步骤12)为初始图中的每个节点计算节点度中心性、特征向量中心性、中介中心性,作为节点重要性指标,并根据节点重要性对节点进行排序;步骤13)根据排序结果和选择标准,选择待压缩节点。3.根据权利要求2所述的一种基于图压缩的社区发现方法,其特征在于,所述度中心性的计算方法为:其中,DC(v
i
)表示节点v
i
的度中心性,n是社交网络的节点数量,d(v
i
)表示节点v
i
的度。4.根据权利要求2所述的一种基于图压缩的社区发现方法,其特征在于,所述中介中心性的计算方法为:其中,BC(v
i
)表示节点v
i
的中介中心性,d
st
表示节点s到节点t的最短路径的数量,d
st
(v
i
)表示最短路径中经过节点v
i
的数量。5.根据权利要求2所述的一种基于图压缩的社区发现方法,其特征在于,所述特征向量中心性的计算方法为:其中,EC(v
i
)和x
i
均表示节点v
i
的特征向量中心性,x
j
表示节点v
j
的特征向量中心性,c是比例常数,n是社交网络的节点数量,a
ij
是邻接矩阵中的元素,如果节点i和节点j之间有边,a
ij
=1,否则a
ij
=0。6.根据权利要求2所述的一种基于图压缩的社区发现方法,其特征在于,所述选择标准为:Set(target)=bottom
p
(DC)∪bottom
p
(BC)∪bottom
p
(EC)
‑
top
p
(DC)∪top
p
(BC)∪top
p
(EC)其中,bottomp(DC)表示所有节点的度中心性大小排序后p%的集合,topp(DC)表示所有节点的度中心性大小排序前p%的集合;bottom
p
(BC)表示所有节点的中介中心性大小排序后p%的集合,top...
【专利技术属性】
技术研发人员:赵勤,苗亚茹,寇祖亮,杨茹,张波,
申请(专利权)人:上海新致软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。