【技术实现步骤摘要】
基于节点影响力的重叠社区发现方法
本专利技术涉及一种重叠社区发现方法。
技术介绍
在大自然界与人类社会中,有很多的真实的网络都可以被描述为复杂网络。例如信息流动的网络、生物界中的代谢系统网络与蛋白质网络。最常见的复杂网络就是用户个体及其之间关系(这种关系可能是亲属、同事、朋友等)形成的社会网络,简而言之,社会网络就是网络中的用户、用户与用户之间的关系构成的网络。人们都希望通过对其进行有效的、定量的数据挖掘与分析,能够揭示出隐藏在背后的信息与规律,这样极大地推进了社会网络的研究热潮。随着研究的深入,人们逐渐发现了社会网络不仅具有小世界特性与无尺度特性,还具有网络簇结构特性。网络簇结构特性表明社会网络具有一定的社区结构,社区结构是一个团体,由一群相似的节点组成的,同一社区内部节点之间的连接较为紧密,不同社区之间的连接较为稀疏。这一特点符合人类行为的高聚集性与社会性,使得挖掘社会网络的社区结构成为近几年社会网络研究的一个重点与热点。研究社区发现问题具有很多的现实意义,例如,在营销方法中,可以将用户划分为特定的社区,根据特定的社区进行特定的商品推荐,在一定程度上实现个性化 ...
【技术保护点】
一种基于节点影响力的重叠社区发现方法,其特征是:步骤一、将节点影响力按照降序排序;步骤二、节点编号设置为节点的最初标签,完成标签初始化;步骤三、每一次更新过程中,对于每一个节点,统计该节点周围的邻居节点所携带的标签及邻居影响力;步骤四、确定节点x对标签c的归属系数,计算为:
【技术特征摘要】
1.一种基于节点影响力的重叠社区发现方法,其特征是:步骤一、将节点影响力按照降序排序;步骤二、节点编号设置为节点的最初标签,完成标签初始化;步骤三、每一次更新过程中,对于每一个节点,统计该节点周围的邻居节点所携带的标签及邻居影响力;步骤四、确定节点x对标签c的归属系数,计算为:其中,b(x,c)是节点x对社区c的归属系数,N+(x)是节点x及其邻居节点的集合,Z(c)是保留标签的节点集合,C代表节点x及其邻接节点拥有的标签种类的集合,Inf(y)代表节点y的影响力;根据公式,统计该节点本身的携带的标签及归属系数,作为节点本身的归属倾向,结合其本身影响力和邻居节点的影响力,计算该节点对于每一个种类标签的归属系数;步骤五、确定重叠阈值,计算公式为:其中,t(x)代表了节点x的重叠阈值,Inf(x)节点x的影响力,Infm代表了节点影响力的最大值;根据上述公式计算重叠阈值,根据重叠阈值决定保留或者删除标签,如果所有种类的标签的归属系数都小于重叠阈值,就选择归属系数最大的标签作为最终的结果,若有多个则随机选择一个,最后对节点保留下来的标签做归一化处理,更新完毕;步骤六、检查是否满足...
【专利技术属性】
技术研发人员:董宇欣,印桂生,张载熙,王红滨,杨楠,陈福坤,侯莎,兰方合,冯梦园,刘红丽,
申请(专利权)人:哈尔滨工程大学,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。