【技术实现步骤摘要】
一种基于随机游走的社会网络社区划分方法
本专利技术涉及社会网络领域,是一种基于随机游走的社会网络社区划分方法。
技术介绍
根据网络节点的连接关系可以将其划分为若干社区,社区内部节点连接相对紧密,社区间连接则较为稀疏。社区发现对于网络舆情监测、安全预警、电子商务等有非常重要的应用价值。如聊天软件推荐的好友都归属同一社区,购物网站向不同社区的用户推荐不同风格的商品,公安系统监测邪教社区“游行”等词语频率升高时立即采取行动。对社区发现的研究,可以获取大量可靠有价值的信息。社区发现的研究近年来取得了相当大的进展,很多学者提出了新理论和新方法。这些方法主要可以分为四类:图分割方法、W-H算法、层次聚类法以及标签传播算法。图分割方法通常应用于计算机领域,它基于迭代对分技术:每次划分都将网络分为最优的两个子图,子图再继续迭代对分,直至数量达到要求。图分割法大体可以分为两类:基于拉普拉斯矩阵的谱平分法和Kerninghan-Lin算法。其缺点是每次只能将网络对分,为了获取结果需要不断迭代。为解决这一问题,Wu和Huberman提出了W-H算法:选取不同社区的两个节点,分别设为电压 ...
【技术保护点】
一种基于随机游走的社会网络社区划分方法,其特征在于,所述方法包括以下步骤:步骤A:读取社会网络数据,构造以网络个体为节点、个体之间相互关系为边的社会网络图;步骤B:随机游走算法改进,根据改进后的叠加算法计算节点相似度矩阵;步骤C:初始化社区:打乱节点顺序,为每一个用户节点分配一个标签值,标签值标识节点所属社区;步骤D:标签更新,计算节点x的邻接节点中各标签出现频率,将x的标签更新为:出现频率最高的标签,若标签频率存在多个最高,则比较邻接节点的相似度矩阵中该节点所在行的相似值,选取相似度最大的节点所拥有的标签进行更新,若存在多个最大相似值,则随机选取一个;步骤E:判断是否满足 ...
【技术特征摘要】
1.一种基于随机游走的社会网络社区划分方法,其特征在于,所述方法包括以下步骤:步骤A:读取社会网络数据,构造以网络个体为节点、个体之间相互关系为边的社会网络图;步骤B:随机游走算法改进,根据改进后的叠加算法计算节点相似度矩阵;步骤C:初始化社区:打乱节点顺序,为每一个用户节点分配一个标签值,标签值标识节点所属社区;步骤D:标签更新,计算节点x的邻接节点中各标签出现频率,将x的标签更新为:出现频率最高的标签,若标签频率存在多个最高,则比较邻接节点的相似度矩阵中该节点所在行的相似值,选取相似度最大的节点所拥有的标签进行更新,若存在多个最大相似值,则随机选取一个;步骤E:判断是否满足停止条件:达到规定的迭代次数或者若干次迭代后标签值达到稳定;否则,返回步骤2继续更新标签;步骤F:将所有具有相同标签的节点归为一个社区。2.根据权利要求1所述的一种基于随机游走的社会网络社区划分方法,其特征在于:在上述步骤B中,原始随机游走算法中只存在一个游走的walker,结果不稳定。为消除随机游走过程中的随机性造成的误差,在给定的时间段t内以Δt=1接连不断的释放walker,直至第一个被释放的walker步数为t,根据改进的算法求得两节点间相似度。3.根据权利要求1所述的一种基于随机游走的社会网络社区划分方法,其特征在于:在上述步骤B中,对随机游走相似度的计算提出了新的衡量标准;相似度矩阵第x行第y列的值axy表示节点x和节点y的相似程度,其值越大,代表这两个节点所代表的个体在同一个社区的可能性越大,对于步骤A中构造的社交网络图,抽象成一个简单的无向图G(N,E),其中,N表示节点的集合,E表示边的集合;节点之间相似度的具体求解过程如下:用Pxy表示wal...
【专利技术属性】
技术研发人员:张贤坤,宋琛,牛渊博,高新雅,任静,熬阳月,
申请(专利权)人:天津科技大学,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。