基于节点影响力的重叠社区发现方法技术

技术编号:15822761 阅读:53 留言:0更新日期:2017-07-15 04:57
本发明专利技术提供的是一种基于节点影响力的重叠社区发现方法。在k‑shell分解算法的基础上,通过综合并全面考虑节点的全局影响力、局部影响力以及邻居节点的贡献度共三类因素而提出。依据影响力降序顺序更新节点,符合社会网络信息传播特性,降低算法的随机性,并在计算归属系数的时候,不仅仅考虑了邻居节点影响力的影响,还将节点本身的归属倾向及节点本身影响力考虑在内。在设定重叠阈值等方面,融合了节点影响力,为每个节点设置了合理的阈值。能够降低原算法的随机性,挖据出高质量的社区结构。

【技术实现步骤摘要】
基于节点影响力的重叠社区发现方法
本专利技术涉及一种重叠社区发现方法。
技术介绍
在大自然界与人类社会中,有很多的真实的网络都可以被描述为复杂网络。例如信息流动的网络、生物界中的代谢系统网络与蛋白质网络。最常见的复杂网络就是用户个体及其之间关系(这种关系可能是亲属、同事、朋友等)形成的社会网络,简而言之,社会网络就是网络中的用户、用户与用户之间的关系构成的网络。人们都希望通过对其进行有效的、定量的数据挖掘与分析,能够揭示出隐藏在背后的信息与规律,这样极大地推进了社会网络的研究热潮。随着研究的深入,人们逐渐发现了社会网络不仅具有小世界特性与无尺度特性,还具有网络簇结构特性。网络簇结构特性表明社会网络具有一定的社区结构,社区结构是一个团体,由一群相似的节点组成的,同一社区内部节点之间的连接较为紧密,不同社区之间的连接较为稀疏。这一特点符合人类行为的高聚集性与社会性,使得挖掘社会网络的社区结构成为近几年社会网络研究的一个重点与热点。研究社区发现问题具有很多的现实意义,例如,在营销方法中,可以将用户划分为特定的社区,根据特定的社区进行特定的商品推荐,在一定程度上实现个性化推荐。这种推荐方式现本文档来自技高网...
基于节点影响力的重叠社区发现方法

【技术保护点】
一种基于节点影响力的重叠社区发现方法,其特征是:步骤一、将节点影响力按照降序排序;步骤二、节点编号设置为节点的最初标签,完成标签初始化;步骤三、每一次更新过程中,对于每一个节点,统计该节点周围的邻居节点所携带的标签及邻居影响力;步骤四、确定节点x对标签c的归属系数,计算为:

【技术特征摘要】
1.一种基于节点影响力的重叠社区发现方法,其特征是:步骤一、将节点影响力按照降序排序;步骤二、节点编号设置为节点的最初标签,完成标签初始化;步骤三、每一次更新过程中,对于每一个节点,统计该节点周围的邻居节点所携带的标签及邻居影响力;步骤四、确定节点x对标签c的归属系数,计算为:其中,b(x,c)是节点x对社区c的归属系数,N+(x)是节点x及其邻居节点的集合,Z(c)是保留标签的节点集合,C代表节点x及其邻接节点拥有的标签种类的集合,Inf(y)代表节点y的影响力;根据公式,统计该节点本身的携带的标签及归属系数,作为节点本身的归属倾向,结合其本身影响力和邻居节点的影响力,计算该节点对于每一个种类标签的归属系数;步骤五、确定重叠阈值,计算公式为:其中,t(x)代表了节点x的重叠阈值,Inf(x)节点x的影响力,Infm代表了节点影响力的最大值;根据上述公式计算重叠阈值,根据重叠阈值决定保留或者删除标签,如果所有种类的标签的归属系数都小于重叠阈值,就选择归属系数最大的标签作为最终的结果,若有多个则随机选择一个,最后对节点保留下来的标签做归一化处理,更新完毕;步骤六、检查是否满足...

【专利技术属性】
技术研发人员:董宇欣印桂生张载熙王红滨杨楠陈福坤侯莎兰方合冯梦园刘红丽
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1