System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多视图下融合信息的社区划分系统及方法技术方案_技高网

多视图下融合信息的社区划分系统及方法技术方案

技术编号:40982765 阅读:6 留言:0更新日期:2024-04-18 21:28
本发明专利技术涉及一种多视图下融合信息的社区划分系统及方法,属于社区网络领域。其针对于深度聚类主要关注单视图下的网络属性信息和结构信息,但往往存在单一视图信息匮乏和多模块信息融合不充分的问题。为了得到更健壮的图信息并充分融合各个模块,该模型包括:选取公开数据集作为初始数据,利用数据增强技术获得多个视图;原始图下通过AE和GAE模块分别获取图的属性和结构信息;多视图下利用GAE编码获得图结构信息,全局领域自适应地选择信息,得到增强后的图结构信息,并与原始图结构信息相互学习;探索了各模块中相同数据的相似潜在信息,引导两个模块信息相互学习,从而产生更佳的聚类分布;最后直接从聚类分布输出聚类结果R。

【技术实现步骤摘要】

本专利技术属于社区网络领域,涉及一种多视图下融合信息的社区划分系统及方法


技术介绍

1、社区揭示了其成员不同于网络中其他社区成员的特征和联系。在网络分析中,社区发现具有重要意义。除了经典的谱聚类和统计推断方法,凭借处理高维网络数据方面的优势,用于社区发现的深度学习技术近年来有了显著的发展。深度聚类下的社区划分工作往往使用自编码器和图自编码器两个技术寻找网络不同的内在信息。然而,目前基于深度学习的社区划分领域中,大多数工作是在单视图下关注网络特征信息和拓扑信息,存在单一视图信息匮乏的问题。其次,多模块信息融合不充分,往往只是机械地对齐或拼接,这导致最终的聚类分布不够健壮。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种多视图下融合信息的社区划分系统及方法,以解决深度聚类算法存在的单一视图信息匮乏和多模块信息融合不充分的问题。

2、为达到上述目的,本专利技术提供如下技术方案:

3、多视图下融合信息的社区划分系统,该系统包括图增强模块、图属性信息模块、图结构信息模块、多视图增强信息模块和信息融合模块;

4、所述图增强模块采用丢弃顶点的策略,对于特征矩阵采取如下操作:将部分顶点的部分特征或全部特征进行丢弃;利用伯努利分布进行随机删除顶点,相当于对图添加噪声,生成多个视图;

5、所述图属性信息模块采用自动编码器ae对原始图进行编码和解码,获得图属性信息;

6、所述图结构信息模块采用图形自动编码器gae对原始图进行编码和解码,获得图结构信息;

7、所述多视图增强信息模块采取全局捕获策略,在数据增强后的多个视图下,利用gae获取各个视图下的图结构信息,然后采取全局捕获策略捕捉各视图最佳信息,生成更健壮的图结构信息;再与原始图结构信息在同一个框架下相互学习;

8、所述信息融合模块采用动态信息融合策略,探究两个模块同一个数据的相似的潜在信息,指导两个模块的相互依赖学习,产生更加有指导性的聚类分布。

9、多视图下融合信息的社区划分,该方法包括以下步骤:

10、s1:建立统一的多视图模型,明确多视图模型的输入输出;

11、多视图模型包括图增强模块、图属性信息模块、图结构信息模块、多视图增强信息模块和信息融合模块;

12、所述图增强模块采用丢弃顶点的策略,对于特征矩阵采取如下操作:将部分顶点的部分特征或全部特征进行丢弃;利用伯努利分布进行随机删除顶点,相当于对图添加噪声,生成多个视图;

13、所述图属性信息模块采用自动编码器ae对原始图进行编码和解码,获得图属性信息;

14、所述图结构信息模块采用图形自动编码器gae对原始图进行编码和解码,获得图结构信息;

15、所述多视图增强信息模块采取全局捕获策略,在数据增强后的多个视图下,利用gae获取各个视图下的图结构信息,然后采取全局捕获策略捕捉各视图最佳信息,生成更健壮的图结构信息;再与原始图结构信息在同一个框架下相互学习;

16、s2:选取公开数据集作为初始数据,通过图增强模块利用顶点属性扰动策略生成多个视图;

17、s3:对初始数据集进行预训练,得到属性和结构两个模块的初始聚类中心;

18、s4:通过ae自编码器对原始视图进行图编码获取图属性信息;

19、s5:通过gae图自编码器对原始视图进行图编码获取图结构信息;

20、s6:通过多视图增强信息模块,得到每个视图下的图结构信息,利用全局捕获策略获取最佳图结构信息,再和图原始结构信息相互依赖学习,生成最终的图结构信息;

21、s7:通过信息融合模块引导两个模块信息相互学习,充分融合网络属性和结构信息,从而得到更好的聚类结果;用于下游任务。

22、进一步,所述s1中,多视图模型的输入如下:

23、给定一个属性图g=(v,e,x),其中是有n个顶点的顶点集,e是边集,x=[x1,x2,…,xn]t为特征矩阵;图g的拓扑结构可以用邻接矩阵表示,如果vij=1,表示顶点vi到顶点vj之间存在一条边;表示a的度矩阵,其中表示顶点vi的度。

24、进一步,所述s2中,将部分顶点的部分特征或全部特征进行丢弃;利用伯努利分布对特征矩阵x进行属性扰动;进行多次扰动生成s个视图具体包括以下步骤:

25、s21:对顶点特征采用全部丢弃方法为:

26、

27、其中,θij服从伯努利分布(1-δ);x为特征矩阵,为经过数据增强后的特征矩阵。

28、进一步,所述s3中,利用ae和gae对原始图进行预训练,得到有意义的初始聚类中心;具体包括以下步骤:

29、s31:将数据通过ae,仅考虑重构损失进行训练;在损失收敛的情况下,再进行k-means聚类获得初始的聚类中心k=1,2...k;

30、s32:将数据通过gae,仅考虑重构损失进行训练;在损失收敛的情况下,再进行k-means聚类获得初始的聚类中心

31、进一步,所述s4中,利用ae自动编码器对原始特征矩阵x进行编码与解码,获得图属性信息;具体包括以下步骤:

32、s41:将原始图的特征矩阵x输入到ae的编码器,公式如下:

33、

34、其中,z(0)=x是原始特征矩阵,是编码器第l层学习的参数矩阵;是类似于relu的激活函数;

35、s42:将编码器的输出输入到解码器,公式如下:

36、

37、其中是解码器第l层可学习的参数矩阵,是类似于relu的激活函数,编码器的输出为重构的特征矩阵

38、s43:计算ae模块的重构损失,公式如下:

39、

40、s44:在ae获得足够的训练后,获得关注属性的顶点表示信息,获得每个顶点属于簇信息的软分类结果;使用学生分布来度量数据表示第i个样本和第j个簇中心向量之间的相似性,公式如下:

41、

42、其中,ai是下述的第l行,表示顶点属性信息映射到低维空间的顶点表示;μk是预训练下聚类中心k的向量表示信息;qik表示第i个顶点属于聚类中心k的可能性;

43、s45:在获得软分类结构后,通过从高置信度分配中学习来优化数据表示;计算一个目标分布,公式如下:

44、

45、其中qik为软分类结果,在目标分布pa中,对软分类的结果是进行平方归一化的,使赋值具有更高的置信水平;

46、s46:使用kl散度用于比较两个分布之间的差异程度,通过最小化两个聚类分类的kl散度损失来进行比较;公式如下:

47、

48、其中,目标分布pa帮助自编码器模块更好地学习聚类任务的表示,即使数据表示更接近聚类中心;目标分布pa是根据分布qa计算的,并且目标分布pa依次监督更新分布qa;

49、s47:整个图属性信息模块的最终损失如下所本文档来自技高网...

【技术保护点】

1.多视图下融合信息的社区划分系统,其特征在于:该系统包括图增强模块、图属性信息模块、图结构信息模块、多视图增强信息模块和信息融合模块;

2.多视图下融合信息的社区划分,其特征在于:该方法包括以下步骤:

3.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述S1中,多视图模型的输入如下:

4.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述S2中,将部分顶点的部分特征或全部特征进行丢弃;利用伯努利分布对特征矩阵X进行属性扰动;进行多次扰动生成s个视图具体包括以下步骤:

5.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述S3中,利用AE和GAE对原始图进行预训练,得到有意义的初始聚类中心;具体包括以下步骤:

6.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述S4中,利用AE自动编码器对原始特征矩阵X进行编码与解码,获得图属性信息;具体包括以下步骤:

7.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述S5中,利用GAE图自动编码器对原始特征矩阵X和邻接矩阵A进行编码与解码,获得图结构信息;具体包括以下步骤:

8.根据权利要求6所述的多视图下融合信息的社区划分方法,其特征在于:所述S6中,多视图增强信息模块的实现步骤如下:

9.根据权利要求6所述的多视图下融合信息的社区划分方法,其特征在于:在所述S7中,信息融合模块的实现步骤如下:

...

【技术特征摘要】

1.多视图下融合信息的社区划分系统,其特征在于:该系统包括图增强模块、图属性信息模块、图结构信息模块、多视图增强信息模块和信息融合模块;

2.多视图下融合信息的社区划分,其特征在于:该方法包括以下步骤:

3.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述s1中,多视图模型的输入如下:

4.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述s2中,将部分顶点的部分特征或全部特征进行丢弃;利用伯努利分布对特征矩阵x进行属性扰动;进行多次扰动生成s个视图具体包括以下步骤:

5.根据权利要求1所述的多视图下融合信息的社区划分方法,其特征在于:所述s3中,利用ae和gae对原始图进行预训...

【专利技术属性】
技术研发人员:刘洪涛许添溢
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1