The invention belongs to the social network analysis technology field, discloses a discovery method based on the seed node expansion overlapping community, the network community system, filters the nodes, removes the edge graph structure, uses the seed selection algorithm to select the well guided seed set; the seed expansion uses the PPR vector expansion to form the core. Overlapping the community structure; using the communication algorithm to eliminate the edge graph structure and rejoin the core overlapping community. The invention can be used for friends recommendation, commodity recommendation and advertising for large social networks, with the features of large social networks, combination of edge graph filtering, seed selection, seed expansion and the final propagation algorithm to realize the good results of large social network overlapping community discovery.
【技术实现步骤摘要】
基于种子节点扩展重叠社区的发现方法、网络社区系统
本专利技术属于社交网络分析
,尤其涉及一种基于种子节点扩展重叠社区的发现方法、网络社区系统。
技术介绍
网络社区发现是当代网络分析科学中最热门的话题之一。许多感兴趣的网络,如社交网络,商品网络等呈现出社区结构的特点。社区结构一般来说是相比于外部群组的成员节点,内部有更高几率产生联系的群组节点。现有的基于全局网络的重叠社区发现算法存在开销较大的情况,没有针对社交网络所特有的性质进行深入挖掘,社区发现结果往往存在社区传导率较高的情况,导致全局性的重叠发现算法在社交网络重叠社区发现中结果并不理想。随着网络规模的扩大,基于全局网络的重叠社区发现算法的开销不断增大,算法性能下降明显,这是由于其算法本身需要综合网络所有节点或者边的某些特征的特性决定的。因此,基于全局网络的重叠社区发现算法不适合大型网络的重叠社区发现。综上所述,现有技术存在的问题是:目前现有的全局性重叠社区发现算法存在开销大的情况,在社交网络重叠社区发现中结果并不理想。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于种子节点扩展重叠社区的发现方法、网络社区系统。本专利技术是这样实现的,一种基于种子节点扩展重叠社区的发现方法,所述基于种子节点扩展重叠社区的发现方法包括:对节点进行过滤,去除边缘须图结构,运用种子选区算法选取传导性良好的种子集;种子扩展使用PPR向量扩展,形成核心重叠社区结构;使用传播算法剔除边缘须图结构重新加入核心重叠社区。进一步,所述基于种子节点扩展重叠社区的发现方法具体包括以下步骤:步骤一,边缘须图过滤;输入:原图G= ...
【技术保护点】
1.一种基于种子节点扩展重叠社区的发现方法,其特征在于,所述基于种子节点扩展重叠社区的发现方法包括:对节点进行过滤,去除边缘须图结构,运用种子选区算法选取传导性良好的种子集;种子扩展使用PPR向量扩展,形成核心重叠社区结构;使用传播算法剔除边缘须图结构重新加入核心重叠社区。
【技术特征摘要】
1.一种基于种子节点扩展重叠社区的发现方法,其特征在于,所述基于种子节点扩展重叠社区的发现方法包括:对节点进行过滤,去除边缘须图结构,运用种子选区算法选取传导性良好的种子集;种子扩展使用PPR向量扩展,形成核心重叠社区结构;使用传播算法剔除边缘须图结构重新加入核心重叠社区。2.如权利要求1所述的基于种子节点扩展重叠社区的发现方法,其特征在于,所述基于种子节点扩展重叠社区的发现方法具体包括以下步骤:步骤一,边缘须图过滤;输入:原图G=(V,E);输出:核心网络G′=(V′,E′);步骤二,种子集选取;输入:核心网络G′=(V′,E′),预期重叠社区数k;输出:种子集S;步骤三,种子扩展;输入:核心网络G′=(V′,E′),种子集S,参数α,ε(0<α<1,ε→0);输出:核心重叠社区;步骤四,核心社区传播;输入:原图G=(V,E),核心网络G′=(V′,E′),核心社区Ci(i=1,2,......,k);输出:重叠社区。3.如权利要求2所述的基于种子节点扩展重叠社区的发现方法,其特征在于,所述步骤一具体包括:(1)桥组件发现,初始化桥组件集合对图G所有的边ei(i=1,2,......)进行遍历,如果删除ei后产生两个子图,将ei加入Q,对所有的桥组件进行标记;(2)边缘须图过滤,通过移除桥组件获取边缘须图结构,节点数量设置固定值为10;遍历桥组件集合,检测桥组件两端结构节点个数,如果一端节点数量少于10个,则删除结构,如果节点数量大于10个,则桥组件标记清除。4.如权利要求2所述的基于种子节点扩展重叠社区的发现方法,其特征在于,所述步骤二具体包括:(1)初始化种子集(2)使用Graclus算法对核心网络G′=(V′,E′)进行划分;通过Graclus算法本发明可以得到k个互不相交的集合Gi(i=0,1......,k);(3)...
【专利技术属性】
技术研发人员:裴庆祺,张皓旭,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。