当前位置: 首页 > 专利查询>南京大学专利>正文

一种网络中基于节点相似度的网络社区划分方法技术

技术编号:8532994 阅读:425 留言:0更新日期:2013-04-04 16:07
本发明专利技术公开了一种网络中基于节点相似度的网络社区划分方法,包括以下步骤:抽取用户对于网络社区划分的偏好信息并确定属性权重;从网络中的用户配置文件中获取数据集;以每个节点为一个网络社区,计算不同网络社区间的相似度,并将网络社区对按照相似度生成最大堆;选择具有最大相似度的节点对进行合并;计算新网络社区与其它网络社区间的相似度,插入至最大堆,并从最大堆中删除被合并网络社区的相关记录;计算新的网络社区划分的Q值;重复上述步骤直至所有节点都被合并至同一网络社区中,并找出Q值极值点及其相应划分;修改各属性权重,重复算法;汇总不同权重取值时的Q值极值及相应网络划分,将其中Q值较高的多个划分推荐给用户。

【技术实现步骤摘要】

本专利技术涉及计算机软件
,特别是,通过对网络中节点及链接属性的分析实现对复杂网络中节点的网络社区划分。
技术介绍
网络结构广泛存在于自然界和现实生活中,如通讯网络、交通网络、电力网络、航空网络、食物链网络及蛋白质交互网络等,虽然上述网络结构来自于不同领域, 具有不同背景,但具有相似的结构特征,如网络的“无尺度特性(Power-Law) ”、“小世界特性(Small-World) ”、“高聚集系数(High Clustering Coeff icient) ”、“ 自相似性 (Self-Similarity) ”等;同时,网络连接结构可能会随时间而不断变化,且连接间可能具有不同的权重或方向。现实社会中人也不是孤立的,人与人之间的亲戚关系、朋友关系、上下级关系、同时关系等不同的社会交互构成了一种重要的社会关系网络,简称社会网络。社会网络具有广泛的应用价值,目前已被引入各种领域,如广告传播与市场营销、计算机病毒与犯罪网络及IT与通信行业等。由于社会网络中含有众多个体及个体间的关联信息,具有重要的研究 与分析价值,因而社会网络分析成为数据挖掘的一个重要分支,如何从复杂网络结构中挖掘出潜在的模式和知识成为数据挖掘中一个新兴的热点研究领域。随着对实际网络拓扑结构和物理意义的深入研究,研究人员逐渐发现除了典型的 “无尺度”、“小世界”及“高聚集系数”等特征外,现实世界的网络还具有“网络社区结构”,即网络社区内节点之间的连接相对非常紧密,但各网络社区之间的连接相对较为稀疏,这些网络社区结构代表了社会网络中具有相同兴趣或偏好的团体。如何快速有效地发现网络中的网络社区结构对于揭示网络的局部功能与其自身的拓扑结构之间的相互影响的关系具有十分重要的推动作用。对于社会网络中网络社区结构的探测,学术界已经进行了大量的研究。例如,Μ. E. J. Newman 等人 在“Finding and evaluating community structure in networks (Physical Review E, Vol. 69, No. 2, pp. 026113, 2003) ” 中提出了 一种基于层次聚类算法的边消去算法,算法利用最短路径求出每条边的“betweenness”值,然后每次去掉网络中“betweenness”值最大的边,并引入“模块化度”作为评价网络社区划分结果的评价指标;之后 Μ. E. J. Newman 在 “Fast algorithm for detecting community structure in networks (Physical Review E, Vol. 60,No. 6,pp. 066133,2004),,中提出了效率更高的基于每条边“betweenness”值的网络社区发现算法;Ye, Z.等人在“Adaptive clustering algorithm for community detection in complex networks (Physical Review E, Vol. 78,No. 4,pp. 046115,2008) ”中根据自适应及自组织动力学特征提出7 一种网络社区发现算法,能避免节点误划分入不正确网络社区后不能重新加入正确网络社区的情况;Nan Du 等人在 “Overlapping community structure detection in networks (Proceedings of the 17th ACM conference on Information and knowledge managem ent(CIKM’ 08), pp. 1371-1372,2008) ”中提出了一种基于局部算法的重叠网络社区发现算法;Liu Xu 等人在 “Community detection by neighborhood similarity (CHIN. PHYS. LETT.,Vol. 29,No. 4,pp. 048902,2012),,中;Tore Opsahl 等人在 “Clustering in weightednetworks (Social Networks, Vol. 31, No. 2, pp. 155-163,2009) ” 中对带权重的网络社区发现进行了探讨;Μ. E. J. Newman 在“Analysis of weighted networks (Physical ReviewE, Vol. 70,No. 5,pp. 056131,2004) ”中提出了一种将加权网络转化为不加权网络的映射方法。但我们发现在已有的研究方法都是利用网络的拓扑结构对网络中的网络社区进行探索,并没有综合利用网络中的节点信息,从而可能会造成网络社区结构划分的不精确,达不到用户的理想要求;同时,随着网络社区结构探测研究的不断深入,用户对网络社区结构的需求也趋于多样化,不同用户之间对于网络社区结构探测的出发点或偏好不同,因此,以往只向用户提供单一划分结果的研究方法逐渐不能满足用户的需求
技术实现思路
专利技术目的本专利技术所要解决的技术问题是针对现有技术的不足,提供。本专利技术公开了一种互联网基于节点相似度的网络社区划分方法,包括以下步骤步骤1,从网络中的用户配制文件和用户日志文件中抽取用户对于网络社区划分的偏好息;步骤2,从网络中的用户配置文件中获取数据集,所述数据集包含所有节点的属性值及节点之间的链接属性值;设定节点总属性权重与链接属性权重取值集合,节点总属性权重值的取值集合为{O. O, O.1, O. 2,O. 3,O. 4,O. 5,O. 6,O. 7,O. 8,O. 9,1. 0},链接属性权重值MV£的取值集合为{O. O, O.1, O. 2,O. 3,O. 4,O. 5,O. 6,O. 7,O. 8,O. 9,1. 0};初始状态下,节点总属性权重值wIV为0. 5,链接属性权重值Wrjr为0. 5 ;根据节点属性数量,设定节点属性权重值的集合,每个节点属性权重值为0.1的整数倍,且所有节点属性权重值之和为1,初始状态下,每个节点属性权重值相等;步骤3,以每个节点为一个网络社区,计算不同网络社区间的相似度,并将网络社区对按照相似度生成最大堆,选择具有最大相似度的节点对进行合并得到新网络社区;计算新网络社区与其它网络社区间的相似度,插入至最大堆,并从最大堆中删除被合并网络社区的对应记录;步骤4,计算网络社区划分的模块度Q值;重复步骤3直至所有节点都被合并至同一网络社区中,找出模块度Q值极值点;步骤5,根据步骤2中的节点属性权重值的集合,修改节点属性权重值,重复步骤3 步骤4,直至遍历所有节点属性权重值;汇总模块度Q值极值点处的网络社区划分,并将网络社区划分方案按照Q值极值大小排列;步骤6,根据步骤2中的节点总属性权重值的集合与链接属性权重值的集合修改节点总属性权重值K,.与链接属性权重值%+;.,重复步骤3 步骤5,直至遍历所有节点总属性权重值与链接属性权重值;汇总所得模块度Q值极值点处的网络社区划分,将网络社区划分方案按照Q值极值大小排列输出。用户配制文件、用户日志文件以及用户配置文件一般存储于网络服务器中。本文档来自技高网
...

【技术保护点】
一种网络中基于节点相似度的网络社区划分方法,其特征在于,包括以下步骤:步骤1,从网络中的用户配制文件和用户日志文件中抽取用户对于网络社区划分的偏好信息;步骤2,从网络中的用户配置文件中获取数据集,所述数据集包含所有节点的属性值及节点之间的链接属性值;设定节点总属性权重与链接属性权重取值集合,节点总属性权重值的取值集合为{0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0},链接属性权重值的取值集合为{0.0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0};初始状态下,节点总属性权重值为0.5,链接属性权重值为0.5;根据节点属性数量,设定节点属性权重值的集合,每个节点属性权重值为0.1的整数倍,且所有节点属性权重值之和为1,初始状态下,每个节点属性权重值相等;步骤3,以每个节点为一个网络社区,计算不同网络社区间的相似度,并将网络社区对按照相似度生成最大堆,选择具有最大相似度的节点对进行合并,得到新网络社区;计算新网络社区与其它网络社区间的相似度,插入至最大堆,并从最大堆中删除被合并网络社区的对应记录;步骤4,计算网络社区划分的模块度Q值;重复步骤3直至所有节点都被合并至同一网络社区中,找出模块度Q值极值点;步骤5,根据步骤2中的节点属性权重值的集合,修改节点属性权重值,重复步骤3~步骤4,直至遍历所有节点属性权重值;汇总模块度Q值极值点处的网络社区划分,并将网络社区划分方案按照Q值极值大小排列;步骤6,根据步骤2中的节点总属性权重值的集合与链接属性权重值的集合修改节点总属性权重值与链接属性权重值重复步骤3~步骤5,直至遍历所有节点总属性权重值与链接属性权重值;汇总所得模块度Q值极值点处的网络社区划分,将网络社区划分方案按照Q值极值大小排列输出。FDA00002468222400011.jpg,FDA00002468222400012.jpg,FDA00002468222400013.jpg,FDA00002468222400014.jpg,FDA00002468222400015.jpg,FDA00002468222400016.jpg...

【技术特征摘要】
1.一种网络中基于节点相似度的网络社区划分方法,其特征在于,包括以下步骤 步骤1,从网络中的用户配制文件和用户日志文件中抽取用户对于网络社区划分的偏好息; 步骤2,从网络中的用户配置文件中获取数据集,所述数据集包含所有节点的属性值及节点之间的链接属性值;设定节点总属性权重与链接属性权重取值集合,节点总属性权重值巧,-的取值集合为{0. 0,0.1, 0. 2,0. 3,0. 4,0. 5,0. 6,0. 7,0. 8,0. 9,1. 0},链接属性权重值wVf 的取值集合为{0. 0,0.1, 0. 2,0. 3,0. 4,0. 5,0. 6,0. 7,0. 8,0. 9,1. 0};初始状态下,节点总属性权重值%、'为0. 5,链接属性权重值⑷^为0. 5 ;根据节点属性数量,设定节点属性权重值的集合,每个节点属性权重值为0.1的整数倍,且所有节点属性权重值之和为1,初始状态下,每个节点属性权重值相等; 步骤3,以每个节点为一个网络社区,计算不同网络社区间的相似度,并将网络社区对按照相似度生成最大堆,选择具有最大相似度的节点对进行合并,得到新网络社区;计算新网络社区与其它网络社区间的相似度,插入至最大堆,并从最大堆中删除被合并网络社区的对应记录; 步骤4,计算网络社区划分的模块度Q值;重复步骤3直至所有节点都被合并至同一网络社区中,找出模块度Q值极值点; 步骤5,根据步骤2中的节点属性权重值的集合,修改节点属性权重值,重复步骤3 步骤4,直至遍历所有节点属性权重值;汇总模块度Q值极值点处的网络社区划分,并将网络社区划分方案按照Q值极值大小排列; 步骤6,根据步骤2中的节点总属性权重值的集合与链接属性权重值的集合修改节点总属性权重值wW.与链接属性权重值力£ ,重复步骤3 步骤5,直至遍历所有节点总属性权重值与链接属性权重值;汇总所得模块度Q值极值点处的网络社区划分,将网络社区划分方案按照Q值极值大小排列输出。2.根据权利要求1所属的一种基于节点相似度的网络社区划分方法,其特征在于,步骤I中,用...

【专利技术属性】
技术研发人员:窦万春张绍谦
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1