System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于社区意识的图掩蔽自编码学习方法、系统及存储介质技术方案_技高网

基于社区意识的图掩蔽自编码学习方法、系统及存储介质技术方案

技术编号:41247996 阅读:4 留言:0更新日期:2024-05-09 23:57
本发明专利技术属于神经网络模型技术领域,公开了一种基于社区意识的图掩蔽自编码学习方法、系统及存储介质,所述基于社区意识的图掩蔽自编码学习方法将社区结构信息引入GAE框架,并在学习过程中保持社区的影响力;采用社区引导的边缘掩蔽和节点特征掩蔽;在自动编码器中使用GNN进行多任务解码,并辅以动态损失函数,从原始数据中提取额外的有价值信息,用于增强图重建;在节点分类、链接预测和图分类等多个下游任务上,ComMGAE在学习图表示时保留图拓扑结构和语义信息。本发明专利技术的目标是识别现有GAE设计的弱点,并在图表示学习中完善相关工作,以应用于下游任务,如链接预测以及节点或图分类。

【技术实现步骤摘要】

本专利技术属于神经网络模型,尤其涉及一种基于社区意识的图掩蔽自编码学习方法、系统及存储介质


技术介绍

1、目前,图掩蔽自编码器gae是一种先进的图神经网络模型,专门用于解决图形数据的自动编码任务。相比传统的自动编码器,gae更加注重处理复杂的图结构数据,例如社交网络、生物信息学和推荐系统中常见的图形数据。其核心目标在于学习图中节点的潜在表示,以便抓取节点之间的关系和整个图的全局特征。gae的应用领域涉及广泛,包括社交网络分析、生物信息学中的蛋白质相互作用预测、以及推荐系统中用户和物品之间关系的建模等。通过捕捉图的隐藏模式,gae为研究人员和工程师提供了一个有力的工具,以更深入地理解和充分利用图结构数据中的信息。通过采用掩码机制来执行图形数据的编码过程可以使模型能够有效地处理具有复杂拓扑结构的图,模型也可以有选择性地关注图中的特定关系,从而更加精准地学习节点之间的表示。这种灵活的方法使得gae能够适应各种规模和复杂度的图形数据,为图学习任务提供了一种强大而可调节的解决方案。

2、最近,图学习中探索了一些基于gae的技术。例如,mgae在边上设置了较高的掩码率,并采用了交叉相关解码器,这是对抗图对比学习的一种新型竞争对手。graphmae提出了一种更复杂的解码器和重新掩码机制,以优于图对比学习的性能。此外,maskgae是第一个采用路径掩码来学习长程依赖的方法,以在下游任务中实现高精度,例如链接预测和节点或图分类。尽管这些模型展示了强大的性能,但它们在很大程度上忽视了社区结构对图学习的影响。

3、社区广泛应用于社交网络和各种大规模复杂网络中。这是因为它们可以极大地提高模型的可解释性,由于从图数据中挖掘出的丰富信息。社区表示图的高阶结构,其特征是一组密集连接的节点。社区内的边密度通常远大于社区外部的边密度。由于社区的结构是语义的具体体现,其底层结构具有很高的信息量。例如,在社交网络中,社区可以表示不同朋友群体;在购物网络中,社区可以展示客户在多种类型中的共同兴趣。一些其他模型尝试在图表示学习中整合社区的影响以提高准确性,但在学习过程中未充分保护社区信息,模型仍主要参与本地化学习。

4、通过上述分析,现有技术存在的问题及缺陷为:自监督学习技术,特别是在图形分析领域,已经见证了图形自动编码器(gae)的出现所推动的重大进步。即使不使用图形增强方法,这些模型也显示出显著的功效。然而,现有的gae架构对属性重构和解码策略的主要关注往往忽略了图的社区结构中封装的丰富语义信息。这种关键的监督强调了将社区语义无缝集成到图的自监督学习范式中的新方法的必要性。


技术实现思路

1、针对现有技术存在的问题,本专利技术提供了一种基于社区意识的图掩蔽自编码学习方法、系统及存储介质。

2、本专利技术是这样实现的,一种基于社区意识的图掩蔽自编码学习方法,包括以下步骤:

3、第一步,将社区结构信息引入gae框架,并在学习过程中保持社区的影响力;采用社区引导的边缘掩蔽和节点特征掩蔽;

4、第二步,在自动编码器中使用gnn进行多任务解码,并辅以动态损失函数,从原始数据中提取额外的有价值信息,用于增强图重建;

5、第三步,在节点分类、链接预测和图分类等多个下游任务上,commgae在学习图表示时保留图拓扑结构和语义信息。

6、进一步,所述基于社区意识的图掩蔽自编码学习方法使用社区检测算法对社区结构进行划分,并计算社区强度;通过从图数据中有效挖掘社区信息,提升模型的可解释性。

7、进一步,所述基于社区意识的图掩蔽自编码学习方法采用社区感知掩码图自动编码器commgae,新的掩码策略破坏社区的链接和属性,同时对边和节点属性进行掩码和重构;使用图神经网络gnn;利用缩放余弦误差sce作为特征重建的损失函数。

8、进一步,所述基于社区意识的图掩蔽自编码学习方法的commgae模型将社区结构的影响纳入图表示学习中,实现对社区结构的保留,并在图表示学习中完善相关工作,以应用于下游任务,链接预测以及节点或图分类。

9、进一步,所述基于社区意识的图掩蔽自编码学习方法的commgae模型由四个组件组成;

10、掩码:通过社区检测得到的结果计算社区强度,并指导图的属性和结构进行遮盖;

11、编码:将掩码后的属性和图编码成低微向量;

12、解码:包括属性解码和结构解码,属性解码器将编码后得到向量解码回到原始属性,结构解码器通过掩码后的图和属性信息解码原始图,都将编码器的输出作为输入;

13、重构:将解码后的属性和结构与原始信息进行对比并计算损失,不断更新编码器和解码器直到能最大程度恢复出被掩码的信息。

14、进一步,掩码模块,包括:

15、社区检测,社区结构在图数据中普遍存在,社区检测算法评估节点组的聚类或划分程度,以及它们的内聚或分离倾向;选择模块度h来评估社区划分的效果,定义如下:

16、

17、其中,ec 是属于社区c的边的集合,η>0是分辨率参数,η越大,得到的社区越多,使用combo来检测社区,根据模块度来划分社区;

18、社区连通强度,社区c的社区连通性强度sc定义为:

19、

20、由整个图中社区c的边的比例和社区c的度数的比例组成;

21、图数据遮蔽,根据社区连通性来计算整个图的边权重和节点权重,如下所示:

22、wn=φ(norm(xis),τ),

23、

24、we=norm(iits),

25、其中,norm(x)=(x-xmin)/(xmax-xmin)是最大最小归一化操作,i是指示矩阵,如果则i(i,c)=1,否则i(i,c)=0,τ为节点遮蔽设置的阈值,遮蔽策略是按照伯努利分布从原始图中采样一部分边和节点

26、

27、将从原始图中移除采样的边并使用剩余的边构造一个新的图同时,将采样的节点属性设置为零或用其他节点的属性覆盖它们,得到了遮蔽的节点属性遮蔽的图

28、编码模块,包括:

29、编码器,通过gnn网络将掩码的图结构和节点属性映射到包含更多压缩信息的低维表示,如下所示:

30、

31、同时,编码器会使用多头注意力机制来捕获更多的语义信息;

32、解码模块,包括:

33、属性解码器,属性解码器试图将潜在代码映射回原始属性,其公式为:

34、

35、选择了一个单层gnn作为属性解码器;

36、结构解码器,结构解码器试图通过潜在特征z重构掩码的边,使用链接预测作为执行边预测的代理任务,结构解码器也有多种类型可供选择,将结构解码器定义为:

37、

38、其中mlp表示一个多层感知机;

39、在对边进行随机采样后获得图中存在的正边集e+和图中没有的负边集e-,然后在学习到的节点本文档来自技高网...

【技术保护点】

1.一种基于社区意识的图掩蔽自编码学习方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,所述基于社区意识的图掩蔽自编码学习方法使用社区检测算法对社区结构进行划分,并计算社区强度;通过从图数据中有效挖掘社区信息,提升模型的可解释性。

3.如权利要求1所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,所述基于社区意识的图掩蔽自编码学习方法采用社区感知掩码图自动编码器ComMGAE,新的掩码策略破坏社区的链接和属性,同时对边和节点属性进行掩码和重构;使用图神经网络GNN;利用缩放余弦误差SCE作为特征重建的损失函数。

4.如权利要求1所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,所述基于社区意识的图掩蔽自编码学习方法的ComMGAE模型将社区结构的影响纳入图表示学习中,实现对社区结构的保留,并在图表示学习中完善相关工作,以应用于下游任务,链接预测以及节点或图分类。

5.如权利要求1所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,所述基于社区意识的图掩蔽自编码学习方法的ComMGAE模型由四个组件组成;

6.如权利要求5所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,掩码模块,包括:

7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~6任意一项所述基于社区意识的图掩蔽自编码学习方法。

8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1~6任意一项所述基于社区意识的图掩蔽自编码学习方法。

9.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现权利要求1~6任意一项所述基于社区意识的图掩蔽自编码学习方法。

10.一种实施权利要求1~6任意一项所述基于社区意识的图掩蔽自编码学习方法的基于社区意识的图掩蔽自编码学习系统,其特征在于,所述基于社区意识的图掩蔽自编码学习系统包括:

...

【技术特征摘要】

1.一种基于社区意识的图掩蔽自编码学习方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,所述基于社区意识的图掩蔽自编码学习方法使用社区检测算法对社区结构进行划分,并计算社区强度;通过从图数据中有效挖掘社区信息,提升模型的可解释性。

3.如权利要求1所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,所述基于社区意识的图掩蔽自编码学习方法采用社区感知掩码图自动编码器commgae,新的掩码策略破坏社区的链接和属性,同时对边和节点属性进行掩码和重构;使用图神经网络gnn;利用缩放余弦误差sce作为特征重建的损失函数。

4.如权利要求1所述的基于社区意识的图掩蔽自编码学习方法,其特征在于,所述基于社区意识的图掩蔽自编码学习方法的commgae模型将社区结构的影响纳入图表示学习中,实现对社区结构的保留,并在图表示学习中完善相关工作,以应用于下游任务,链接预测以及节点或图分类。

5.如权利要求1所述的基于社区意识的图...

【专利技术属性】
技术研发人员:陈建峡姜高航金旭罗梦宇肖亮李超甘海涛
申请(专利权)人:湖北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1