一种基于标签传播的拓扑势社区检测方法技术

技术编号:23163909 阅读:57 留言:0更新日期:2020-01-21 22:25
本发明专利技术公开了一种基于标签传播的拓扑势社区检测方法,具体按照以下步骤实施:步骤1,根据节点间的链接属性和节点的信息属性,利用标签传播的思想,计算节点间的链接权重R;步骤2,将链接权重加入拓扑势域公式中,计算每个节点的拓扑势值;步骤3,利用每个节点拓扑势值进行社区划分,以局部最高拓扑势值的节点作为社区的核心节点,从核心节点出发进行社区的划分;步骤4,对划分好的子群社区根据核心节点间的距离以及属性特征,将子群社区进行合并。本发明专利技术的目的是提供一种基于标签传播的拓扑势社区检测方法,解决了现有技术中存在的社区划分数量过多、社区包含节点过少的问题。

A topological potential community detection method based on label propagation

【技术实现步骤摘要】
一种基于标签传播的拓扑势社区检测方法
本专利技术属于网络数据处理方法
,具体为涉及一种基于标签传播的拓扑势社区检测方法。
技术介绍
在现实世界中,很多复杂的系统都可以抽象为一个复杂网络,如计算机网络、信息网络、社会网络和生物网络等。由此,社区检测问题对于研究复杂网络以及我们生活有着重要的意义。通常来说,社区检测就是将链接最为紧密的节点划分为同一个社区。通过社区检测可以帮助我们更好的了解整个社交网络,进而更好的利用资源。而且实际上例如Facebook这类朋友关系的社交网络上,利用社区检测我们可以进行朋友推荐。另外我们也可以用社区检测对具有链接关系并且同兴趣的用户进行兴趣推送。甚至我们也可以用于交通网络中分析交通对城市功能社区(商业区、居民区、学校等)分布之间的关系。目前,社区检测的方法被提出很多,基于图分割的社区检测是需要提前定义分割社区的个数和社区的体积,通过最小化社区间的链接边的数量实现社区划分,如Kemighan-Lin方法和谱划分方法。基于聚类的社区检测是通过节点间的关系利用聚类的思想将其进行社区检测,如GN方法、Newman贪心方法和k-means方法等。基于模块度最大化的社区检测是利用模块度获取最优的网络社区划分,如Louvain方法。基于非负矩阵的社区检测是利用非负矩阵的思想将节点的链接矩阵进行分解得到节点社区归属矩阵,如SACluster方法和BAGC方法和LANMF方法。基于标签的社区检测方法是每个节点随机生成标签,然后逐轮刷新所有节点的标签,直到所有节点的标签不再发生变化为止,如SLPA方法、CORP方法和LPPB方法等。而基于拓扑势域的社区检测是利用节点的链接信息构造拓扑势场,在拓扑势场里进行社区的划分。很多研究人员也根据拓扑势原理提出了很多改进方法。如DOCET方法就是在山谷结构的拓扑势场下基于节点位置的分析。但是DOCET方法在实验过程中发现,虽然模块度值高,但是社区的划分数量大。而且社区网络越来越复杂,真实数据集出现了很多少量节点为一组与大社区孤立的情况。利用拓扑势原理进行社区划分,会造成很多3、4节点孤立为一个社区的现象出现,这种孤立社区的出现为现实的推送,社区的扩展问题等带来影响。
技术实现思路
本专利技术的目的是提供一种基于标签传播的拓扑势社区检测方法,解决了现有技术中存在的社区划分数量过多、社区包含节点过少的问题。本专利技术所采用的技术方案是,一种基于标签传播的拓扑势社区检测方法,具体按照以下步骤实施:步骤1,根据节点间的链接属性和节点的信息属性,利用标签传播的思想,计算节点间的链接权重R;步骤2,将步骤1得到的链接权重加入拓扑势域公式中,计算每个节点的拓扑势值;步骤3,利用步骤2计算的每个节点拓扑势值进行社区划分,以局部最高拓扑势值的节点作为社区的核心节点,从核心节点出发进行社区的划分;步骤4,对步骤3划分好的子群社区根据核心节点间的距离以及属性特征,将子群社区进行合并。本专利技术的特征还在于,步骤1具体为:步骤1.1,利用LeaderRank算法计算网络G=(V,E)中每个节点的LR值,其中,aji表示节点vj到节点vi是否有链接,有为1,无为0;表示节点vj的出度个数,N表示节点的总个数,LRi(t)表示vi节点在t时刻的得分,LRi(t+1)表示vi节点在t+1时刻的得分,LRi(tc)表示tc时刻节点vi的得分,g为LeaderRank算法中引入的背景节点,LRg(tc)为节点g在tc时刻的得分,LRi表示vi节点最终的得分;步骤1.2,设传播特性为k,计算标签从节点vj到节点vi的传播特性度量值ki←j,其中,LRi表示vi节点最终的得分,LRj表示vj节点最终的得分;步骤1.3,计算节点间的标签传播概率,即就是边的权值,节点vj到节点vi的标签传播概率P(i←j)为:P(i←j)=Si,j×ki←j×δ(i,j)其中,Si,j为节点vi和vj的相似性度量,ki←j为标签从节点vj到节点vi的传播特性度量,δ(i,j)为邻接矩阵;节点j到节点i的标签传播概率体现了标签从节点j传播到节点i的能力,即就是节点j到节点i的有向边的权值,即节点间的链接权重,即Rij=P(j←i)。步骤2中每个节点的拓扑势值计算公式如下:其中,n为节点数,dij表示节点vi与节点vj之间的网络距离或跳数,σ为影响因子,用于控制每个节点的影响范围,m(j)表示节点vj的质量,用来描述每个节点的固有属性,P(j→i)为标签从节点vj传播到节点vi的概率,rij为节点vi和节点vj的环境影响因子。步骤3具体为:步骤3.1,将每个节点与其邻居节点的拓扑势值作比较,将拓扑势局部最大值的节点作为子群社区的核心节点;步骤3.2,将步骤3.1确定的核心节点的邻居节点进行节点的划分,划分为该子群的重叠节点、内部节点、边缘节点;步骤3.3,对所有内部节点的邻居节点进行节点的划分;步骤3.4,重复步骤3.3,直到内部节点的所有邻居节点都被划分或不满足重叠节点、内部节点、边缘节点的定义为止,完成社区的划分。步骤3.1的核心节点确定方法为:在一个社交网络G=(V,E)中,存在节点vi,其邻居节点的集合为Ni,若φ(i)>φ(j),则节点vi是拓扑势域的局部最高点,拓扑势局部的最高点,也就是当前子群社区的核心节点,即节点vi为子群社区的核心节点。重叠节点的确定方法为:在一个社交网络G=(V,E)中,存在节点vi,其邻居节点的集合为Ni,如果φ(i)<φ(j),且节点vi处在两个不同核心节点的社区的山谷的位置,则节点vi是拓扑势域的重叠节点,也就是山谷节点。内部节点的确定方法为:在一个社交网络G=(V,E)中,某节点vi的邻居节点为Ni,内部节点满足下面任意一种情况成立:(1)如果φ(vi)<φ(vj)并且如果φ(vi)>φ(vj),则节点vi处于斜波位置,也就是拓扑势域的内部节点;(2)如果φ(vi)<φ(vj)并且节点vi处在两个同核心节点的社区的山谷的位置,这该节点是社区的内部节点。边缘节点的确定方法为:在一个社交网络G=(V,E)中,某节点vi的邻居节点为Ni,Coverlap是重叠节点的集合,Cno-overlap是不重叠节点的集合;(1)如果vi∈Coverlap,则节点vi是边缘节点;(2)如果vi∈Cno-overlap,而并且则节点vi是边缘节点。步骤4具体为:步骤4.1,计算核心节点间的距离在子群社区划分中,拓扑势值为局部最大值的节点核心节点视为山峰节点,而一个山峰节点对应一个社区;(1)若两个子群社区不重叠但边缘节点相连接当两个子群社区没有重叠节点,但它们之间的边缘节点是相互连接的时,选取边缘节点到到其自身归属的子群社区的核心节点的最短距离为两个子群社区不重叠但边缘节点相连本文档来自技高网
...

【技术保护点】
1.一种基于标签传播的拓扑势社区检测方法,其特征在于,具体按照以下步骤实施:/n步骤1,根据节点间的链接属性和节点的信息属性,利用标签传播的思想,计算节点间的链接权重R;/n步骤2,将步骤1得到的链接权重加入拓扑势域公式中,计算每个节点的拓扑势值;/n步骤3,利用步骤2计算的每个节点拓扑势值进行社区划分,以局部最高拓扑势值的节点作为社区的核心节点,从核心节点出发进行社区的划分;/n步骤4,对步骤3划分好的子群社区根据核心节点间的距离以及属性特征,将子群社区进行合并。/n

【技术特征摘要】
1.一种基于标签传播的拓扑势社区检测方法,其特征在于,具体按照以下步骤实施:
步骤1,根据节点间的链接属性和节点的信息属性,利用标签传播的思想,计算节点间的链接权重R;
步骤2,将步骤1得到的链接权重加入拓扑势域公式中,计算每个节点的拓扑势值;
步骤3,利用步骤2计算的每个节点拓扑势值进行社区划分,以局部最高拓扑势值的节点作为社区的核心节点,从核心节点出发进行社区的划分;
步骤4,对步骤3划分好的子群社区根据核心节点间的距离以及属性特征,将子群社区进行合并。


2.根据权利要求1所述一种基于标签传播的拓扑势社区检测方法,其特征在于,所述步骤1具体为:
步骤1.1,利用LeaderRank算法计算网络G=(V,E)中每个节点的LR值,






其中,aji表示节点vj到节点vi是否有链接,有为1,无为0;表示节点vj的出度个数,N表示节点的总个数,LRi(t)表示vi节点在t时刻的得分,LRi(t+1)表示vi节点在t+1时刻的得分,LRi(tc)表示tc时刻节点vi的得分,g为LeaderRank算法中引入的背景节点,LRg(tc)为节点g在tc时刻的得分,LRi表示vi节点最终的得分;
步骤1.2,设传播特性为k,计算标签从节点vj到节点vi的传播特性度量值ki←j,



其中,LRi表示vi节点最终的得分,LRj表示vj节点最终的得分;
步骤1.3,计算节点间的标签传播概率,即就是边的权值,节点vj到节点vi的标签传播概率P(i←j)为:
P(i←j)=Si,j×ki←j×δ(i,j)
其中,Si,j为节点vi和vj的相似性度量,ki←j为标签从节点vj到节点vi的传播特性度量,δ(i,j)为邻接矩阵;
节点j到节点i的标签传播概率体现了标签从节点j传播到节点i的能力,即就是节点j到节点i的有向边的权值,即节点间的链接权重,即Rij=P(j←i)。


3.根据权利要求2所述的一种基于标签传播的拓扑势社区检测方法,其特征在于,所述步骤2中每个节点的拓扑势值计算公式如下:



其中,n为节点数,dij表示节点vi与节点vj之间的网络距离或跳数,σ为影响因子,用于控制每个节点的影响范围,m(j)表示节点vj的质量,用来描述每个节点的固有属性,P(j→i)为标签从节点vj传播到节点vi的概率,rij为节点vi和节点vj的环境影响因子。


4.根据权利要求3所述的一种基于标签传播的拓扑势社区检测方法,其特征在于,所述步骤3具体为:
步骤3.1,将每个节点与其邻居节点的拓扑势值作比较,将拓扑势局部最大值的节点作为子群社区的核心节点;
步骤3.2,将步骤3.1确定的核心节点的邻居节点进行节点的划分,划分为该子群的重叠节点、内部节点、边缘节点;
步骤3.3,对所有内部节点的邻居节点进行节点的划分;
步骤3.4,重复步骤3.3,直到内部节点的所有邻居节点都被划分或不满足重叠节点、内部节点、边缘节点的定义为止,完成社区的划分。


5.根据权利要求4所述的一种基于标签传播的拓扑势社区检测方法,其特征在于,所述步骤3.1的核心节点确定方法为:
在一个社交网络G=(V,E)中,存在节点vi,其邻居节点的集合为Ni,若φ(i)>φ(j),则节点vi是拓扑势域的局部最高点,拓扑势局部的最高点,也就是当前子群社区的核心节点,即节点vi为子群社区的核心节点。


6.根据权利要求5所述的一种基于标签传播的拓扑势社区检测方法,其特征...

【专利技术属性】
技术研发人员:费蓉李莎莎王战敏李爱民吴昊铮赵佳瑜
申请(专利权)人:西安理工大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1