当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于深度对抗学习的大规模图生成方法技术

技术编号:37110963 阅读:12 留言:0更新日期:2023-04-01 05:08
本发明专利技术公开了一种基于深度对抗学习的大规模图生成方法,包括,对于图G,给定其邻接矩阵A与特征矩阵X,对其进行采样后,输入图注意力编码器以获得图的结构信息,应用社区检测算法得到社区标签的真实值;将所述图注意力编码器输出的社区信息和图表示馈送至社区解码器,生成各节点对应的社区标签;利用反向传播调整所述图注意力编码器与社区解码器的参数,将其引导至社区保持的潜在空间;将所述图注意力编码器输出的社区信息和图表示馈送至图解码器,生成边概率;利用所述边概率模拟图分数矩阵,最终采样得到模型生成的新图;本发明专利技术提出的模型可以在图模拟的质量和效率(可扩展性)之间实现良好的平衡。实现良好的平衡。实现良好的平衡。

【技术实现步骤摘要】
一种基于深度对抗学习的大规模图生成方法


[0001]本专利技术涉及大规模图生成模型的
,尤其涉及一种基于深度对抗学习的大规模图生成方法。

技术介绍

[0002]对图生成模型的研究由来已久,传统方法如B

A模型、Chung

Lu模型、Kronecker图模型、BTER模型、指数随机图和随机块模型等,都经过精心设计,以模拟特定的图族;例如,指数随机图模型(ERGM)依赖于一种表达性概率模型,该模型学习节点特征上的权重来建模图中边的可能性;但在实践中,这种方法在一定程度上受到了限制,因为它只能捕获具有充分统计信息的图结构,Kronecker图模型依赖于Kronecker矩阵积来有效地生成大型邻接矩阵,虽然这种方法是可伸缩的,并且能够从数据中学习部分图属性(例如度分布),但就其能够表示的图结构而言,它仍然受到了很大程度的限制;BTER模型用来校正每个社区中的平均聚类系数,并通过两级边缘采样过程校正度分布,BTER通过将图显式建模为两级E

R图来考虑其社区结构;值得注意的是,SBM及其变体DCSBM和MMSB也考虑到了图的社区结构,但它们受到随机模型简单性的限制,导致在现实生活中的图生成任务的社区结构保持方面表现不佳,具体而言,其只有一个参数用于捕获每个社区(即该社区内的边),一个参数用来表示每对社区的连通概率(即这两个社区之间的边)。
[0003]近年来,提出了一些基于深度神经网络的技术(例如VGAE、DeepGMG、GraphRNN、Graphite、GRAN、CondGen),以解决图生成问题,与传统方法相比,它们显著提高了图生成的质量;例如,Graphite和VGAE使用变分自动编码器(VAE)技术,其中图神经网络用于推理(编码)和生成(解码),由于Graphite和VGAE假设一组固定的顶点,因此它们只能从单个图中学习,NetGAN通过学习图上的随机游走,比VGAE执行得更有效,但由于生成固定大小的图,因此它不可伸缩;在DeepGMG中,图神经网络用于表示图的节点和边之间的概率依赖关系,它可以正确地学习任意图上的分布,然而,生成具有m条边、n个顶点且直径为D(G)的图需要复杂度为O(mn2D(G))的操作,这也存在可伸缩性较差的问题。
[0004]目前,GraphRNN通过递归神经网络(RNN)顺序生成图,但它不是置换不变的,因为计算似然需要边缘化邻接矩阵的节点序的可能置换,GRAN通过在自回归方法中的每一步生成一个节点块和相关边,改进了GraphRNN的可伸缩性,这仍然不是置换不变的,CondGen通过利用GCN作为编码器并处理嵌入空间中的图生成问题,克服了这种置换不变性挑战,GraphU

Nets选择特定节点来实现对图的上采样和下采样,以获得图表示,然而,他们在学习过程中没有考虑观察到的图的社区结构,SBMGNN是SBM的一种变体,配备了深度学习技术,但其图形神经网络用于推断重叠随机块模型的参数,该参数与社区保持性质不直接相关,因此,与其他基于深度学习的图生成模型相比,在社区保持方面没有性能改进。
[0005]生成对抗网络(GAN)在图像生成、图像翻译、超分辨率成像和多媒体合成等各种任务中都显示出了显著的效果,GAN最近也被用于网络科学任务,如网络嵌入、半监督学习和图生成,对于图生成任务,样本数据集指定的先验结构知识对于图生成至关重要,特别是在
社区结构保持的情况下;对于图的社区结构,一些使用池化策略的模型能够训练以表示社区(集群),但将这些社区结构同时进行表示和生成仍然是一项挑战,例如,NetGAN通过随机游动生成图,这对于保持社区结构来说是非常重要的。

技术实现思路

[0006]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0007]鉴于上述现有存在的问题,提出了本专利技术。
[0008]因此,本专利技术解决的技术问题是:受限于复杂度,深度学习模型的伸缩性往往较差,传统方法并没有关注图的社区保持特性,故图生成的相关性能也较差。
[0009]为解决上述技术问题,本专利技术提供如下技术方案:包括,
[0010]对于图G,给定其邻接矩阵A与特征矩阵X,对其进行采样后,输入图注意力编码器以获得图的结构信息,应用社区检测算法得到社区标签的真实值;
[0011]将所述图注意力编码器输出的社区信息和图表示馈送至社区解码器,生成各节点对应的社区标签;
[0012]利用反向传播调整所述图注意力编码器与社区解码器的参数,将其引导至社区保持的潜在空间;
[0013]将所述图注意力编码器输出的社区信息和图表示馈送至图解码器,生成边概率;
[0014]利用所述边概率模拟图分数矩阵,最终采样得到模型生成的新图。
[0015]作为本专利技术所述的基于深度对抗学习的大规模图生成方法的一种优选方案,其中:在进行采样之前还需要增强图结构的重建,包括,
[0016]对所述图G,给定所述邻接矩阵A和所述特征矩阵X,将其输入梯形编码器以获得图的结构信息,应用所述社区检测算法得到社区标签的真实值;
[0017]将所述梯形编码器输出的社区信息和图表示馈送至鉴别器,以确定输入图是否为区别于真实图的假图;
[0018]同时,每个级别的粗化图将通过可微分层消息传递过程将其社区结构特征分布到原始节点;
[0019]对每个所述原始节点的一系列社区信息进行解码,以增强图结构的重建。
[0020]作为本专利技术所述的基于深度对抗学习的大规模图生成方法的一种优选方案,其中:所述梯形编码器包括图卷积、图池化、图读出和图转置池化。
[0021]作为本专利技术所述的基于深度对抗学习的大规模图生成方法的一种优选方案,其中:包括,
[0022]利用解码节点特征前的变分推理生成具有观察到的分层社区结构分布的新图;
[0023]选择多层感知器作为推理模型进行推理,完成从重构特征到先验分布的映射。
[0024]作为本专利技术所述的基于深度对抗学习的大规模图生成方法的一种优选方案,其中:所述鉴别器包括,
[0025]鉴别任务需要所述梯形编码器获得的图特征,根据图读出层输出矩阵;
[0026]对所述鉴别器进行优化,通过博弈进行形式计算,结合训练,通过递增梯度更新参
数。
[0027]作为本专利技术所述的基于深度对抗学习的大规模图生成方法的一种优选方案,其中:包括,
[0028]通过从A
out
的第i行参数化的类别分布采样,为节点i生成一条边;
[0029]选择A
out
的前k个条目,直到边的数目达到预定义的数目;
[0030]生成新图的总时间复杂度为O(n2)。
[0031]作为本专利技术所述的基于深度对抗学习本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度对抗学习的大规模图生成方法,其特征在于:包括,对于图G,给定其邻接矩阵A与特征矩阵X,对其进行采样后,输入图注意力编码器以获得图的结构信息,应用社区检测算法得到社区标签的真实值;将所述图注意力编码器输出的社区信息和图表示馈送至社区解码器,生成各节点对应的社区标签;利用反向传播调整所述图注意力编码器与社区解码器的参数,将其引导至社区保持的潜在空间;将所述图注意力编码器输出的社区信息和图表示馈送至图解码器,生成边概率;利用所述边概率模拟图分数矩阵,最终采样得到模型生成的新图。2.根据权利要求1所述的基于深度对抗学习的大规模图生成方法,其特征在于:在进行采样之前还需要增强图结构的重建,包括,对所述图G,给定所述邻接矩阵A和所述特征矩阵X,将其输入梯形编码器以获得图的结构信息,应用所述社区检测算法得到社区标签的真实值;将所述梯形编码器输出的社区信息和图表示馈送至鉴别器,以确定输入图是否为区别于真实图的假图;同时,每个级别的粗化图将通过可微分层消息传递过程将其社区结构特征分布到原始节点;对每个所述原始节点的一系列社区信息进行解码,以增强图结构的重建。3.根据权利要求2所述的基于深度对抗学习的大规模图生成方法,其特征在于:所述梯形编码器包括图卷积、图池化、图读出和图转置池化。4.根据权利要求2或3所述的基于深度对抗学习的大规模图生成方法,其特征在于:包括,利用解码节点特征前的变分推理生成具有观察到的分层社区结构分布的新图;选择多层感知器作为推理模型进行推理,完成从重构特征到先验分布的映射。5.根据权利要求4所述的基于深度对抗学习的大规模图生成方法,其特征在于:所述鉴别器包括,鉴别任务需要所述梯...

【专利技术属性】
技术研发人员:程大伟许辰昊蒋昌俊
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1