System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种多粒度特征融合的社交网络社区划分方法技术_技高网

一种多粒度特征融合的社交网络社区划分方法技术

技术编号:41331251 阅读:7 留言:0更新日期:2024-05-20 09:52
本发明专利技术提供一种多粒度特征融合的社交网络社区划分方法,该方法融合节点局部影响信息和社区信息这两种不同的粒度特征得到节点综合嵌入向量,捕捉到节点在多个不同层面上的特点,从而提供更丰富的节点表征。另外,在低维向量空间中根据节点的密度分布选择峰值密度较高的节点作为K‑means的初始聚类中心,弥补K‑means算法选择初始聚类中心敏感的缺陷,能够提高社交网络社区划分的准确性。

【技术实现步骤摘要】

本专利技术涉及网络社区划分,特别是涉及一种多粒度特征融合的社交网络社区划分方法


技术介绍

1、社区划分是指将网络划分为若干个社区,其中社区内节点相对密集,而社区之间节点相对稀疏。社区划分将网络中相互关联、相似性较高的节点聚集到同一个社区中。通过对网络进行社区划分,可以识别和提取出具有相似性质或相互关联的数据群体。这有助于深入分析节点之间的联系、信息传播的路径、群体行为的特征等。社区划分已成功应用于各个领域,例如,在社交好友推荐方面,通过识别网络中的社区,找到具有相似兴趣爱好或行为模式的用户群体,提供精准的好友推荐服务;在商品推荐系统中,社区划分可以帮助发现相似的消费者群体,根据其购买行为进行个性化的商品推荐。因此,对社交网络进行社区划分不仅能够挖掘网络的内在结构和功能,还能够为科研和商业应用提供有力支持。

2、目前的传统的社区划分方法存在划分结果不太稳定、计算复杂度较高等问题,现有的基于网络嵌入的社交网络社区划分方法也面临着保留信息的挑战,针对传统的网络嵌入方法在单一粒度上难以有效表征节点向量的问题。


技术实现思路

1、为此,本专利技术的一个实施例提出一种多粒度特征融合的社交网络社区划分方法,以解决现有方法大多考虑单一粒度的网络拓扑结构,而忽略节点局部信息和全局社区信息的问题,从而提供更丰富的节点表征,并针对k-means算法选择初始聚类中心敏感的问题,提出根据节点的密度分布选择峰值密度较高的节点作为k-means的初始聚类中心,提高社交网络社区划分的准确性。

2、根据本专利技术一实施例的多粒度特征融合的社交网络社区划分方法,包括以下步骤:

3、步骤1,计算社交网络中每个节点的度中心性dci和局部聚集系数lcci,计算网络中每个节点的局部平均连边密度laedi,确定dci、lcci、laedi的权重,从而构建节点的局部影响值lii;

4、步骤2,在保留社交网络拓扑信息的基础上,引入节点的局部影响值lii,定义节点间转移概率函数,结合alias采样得到节点采样序列,输入到skip-gram模型中进行训练并采用负采样方法进行优化,当目标函数收敛时,获得节点的局部嵌入向量φnode;

5、步骤3,对网络进行初步划分,计算社区之间的相似度jcc,定义社区转移概率函数,将每个社区抽象成为节点,将节点游走序列输入到skip-gram模型中进行训练并采用负采样方法进行优化,获得融合社区信息的全局社区嵌入向量φcommunity;

6、步骤4,将节点的局部嵌入向量φnode和全局社区嵌入向量φcommunity进行拼接得到节点综合嵌入向量φcombine;

7、步骤5,将节点综合嵌入向量φcombine作为k-means聚类算法的输入,根据节点的密度分布选择峰值密度高于阈值的节点作为k-means的初始聚类中心,然后进行社区扩展,获得社交网络的最终社区结构。

8、根据本专利技术实施例的多粒度特征融合的社交网络社区划分方法,融合节点局部影响信息和社区信息这两种不同的粒度特征得到节点综合嵌入向量,捕捉到节点在多个不同层面上的特点,从而提供更丰富的节点表征。另外,在低维向量空间中根据节点的密度分布选择峰值密度较高的节点作为k-means的初始聚类中心,弥补k-means算法选择初始聚类中心敏感的缺陷,能够提高社交网络社区划分的准确性。

9、另外,根据本专利技术上述实施例的多粒度特征融合的社交网络社区划分方法,还可以具有如下附加的技术特征:

10、进一步地,步骤1中,节点的局部平均连边密度laedi的计算公式如下:

11、

12、其中,ki、kj、kw分别为节点i、节点j、节点w的度数,γ(i)表示节点i的邻居节点集合,节点j为γ(i)中的任意节点,γ(j)表示节点j的邻居节点集合,节点w为γ(j)中的任意节点。

13、进一步地,lii=αdci+βlcci+γlaedi

14、其中,α、β、γ分别为dci、lcci、laedi的权重系数,满足α+β+γ=1。

15、进一步地,步骤2具体包括:

16、根据节点的局部影响值lii,node2vec节点嵌入模型中的节点间转移概率函数αp,q(j,i)定义如下:

17、

18、其中,p表示用于控制是否返回已经走过的参数,q表示用于控制游走方向的参数,dij表示节点i和节点j之间的欧式距离;

19、采用node2vec模型中的alias采样得到节点采样序列,输入到skip-gram模型中进行训练并采用负采样方法进行优化,当目标函数收敛时,获得节点的局部嵌入向量φnode。

20、进一步地,步骤3具体包括:

21、采用louvain算法对网络进行初步划分,计算社区之间的相似度jcc,公式如下:

22、

23、其中,γ(ci)和γ(cj)分别表示社区ci和社区cj的邻居节点集合,n(ci)和n(cj)分别表示社区ci和社区cj中的节点集合;

24、将每个社区抽象成为节点,根据社区之间的相似度jcc,node2vec节点嵌入模型中的社区转移概率函数定义如下:

25、

26、其中,pc是用于控制是否返回已经走过的参数,qc用于控制游走方向的参数,表示社区ci和社区cj之间的欧式距离;

27、结合alias采样法确定下一个游走的社区,并从下一个游走的社区中选取局部影响值最大的节点加入到游走序列中,将节点游走序列输入到skip-gram模型中进行训练并采用负采样方法进行优化,获得融合社区信息的全局社区嵌入向量φcommunity。

28、进一步地,步骤4中,节点综合嵌入向量φcombine的表达式为:

29、

30、其中,表示拼接操作。

31、进一步地,步骤5具体包括:

32、根据k最近邻和共同最近邻思想计算节点的局部密度和相对距离,然后计算决策值γi并绘制γ决策图,选择决策图中拐点左边的点对应的所有节点作为k-means的初始聚类中心,具体包括:

33、对于网络中的节点i和节点j,节点i和节点j的共同最近邻集合snn(i,j)的定义如下:

34、snn(i,j)=knn(i)∩knn(j)

35、其中,knn(i)和knn(j)分别表示节点i和节点j的k最近邻集合;

36、对于网络中的节点i,节点i的k最近邻平均距离定义如下:

37、

38、其中,节点j为knn(i)中的节点,k为节点最近邻数;

39、对于网络中的节点i,得到snn(i,j)和之后,计算节点i的局部密度ρi,定义如下:

40、

41、其中,|snn(i,j)|为节点i和节点j的共同邻居集合snn(i,j)中的节点数,和分别为节点i和节点j的k最近邻平均距离;

...

【技术保护点】

1.一种多粒度特征融合的社交网络社区划分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤1中,节点的局部平均连边密度LAEDi的计算公式如下:

3.根据权利要求2所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤1中,节点的局部影响值LIi的计算公式如下:

4.根据权利要求3所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤2具体包括:

5.根据权利要求4所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤3具体包括:

6.根据权利要求5所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤4中,节点综合嵌入向量Φcombine的表达式为:

7.根据权利要求6所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤5具体包括:

【技术特征摘要】

1.一种多粒度特征融合的社交网络社区划分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤1中,节点的局部平均连边密度laedi的计算公式如下:

3.根据权利要求2所述的多粒度特征融合的社交网络社区划分方法,其特征在于,步骤1中,节点的局部影响值lii的计算公式如下:

4.根据权利要求3所述的多粒度特征融...

【专利技术属性】
技术研发人员:梁瑶舒坚舒馨
申请(专利权)人:南昌航空大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1