【技术实现步骤摘要】
一种基于多尺度图对比学习的图神经网络方法
[0001]本专利技术涉及一种神经网络技术,尤其涉及一种基于多尺度图对比学习的图神经网络方法。
技术介绍
[0002]图结构数据已被证明可以有效地表示各种数据,例如社交网络、金融网络和化学分子图等,具有广泛的应用价值。伴随着图数据在现实世界的场景中越来越普遍,学习图数据的表示也变得越来越重要。
[0003]图表示学习即从图中提取出高维的结构和属性信息,并将其编码为低维的表示向量,已被广泛地应用于诸多图数据分析和处理任务中。在信息化时代下,数据量的增加导致标记数据越来越稀缺,导致收集数据标签需要大量的人力资源和时间。因此,越来越多的研究人员开始关注无监督或自监督图表示学习。
[0004]传统的方法例如矩阵分解和随机游走都无法扩展到较大规模的图上,且不能很好地利用节点的属性信息,因此,不依赖于图的标签信息的情况下来学习到图的表示则变得至关重要。
[0005]目前,基于对比学习的图表示学习方法是一种可行方法,许多相关的研究也已经取得了令人期待的成果。然而,目前绝大多数研究都未曾考虑到图数据的多尺度信息,即从一个单一的尺度来进行对比学习,忽略了更加丰富的全局信息或是更加细致的局部信息。
技术实现思路
[0006]为解决上述问题,本专利技术提供一种基于多尺度图对比学习的图神经网络方法,克服了以前的方法中对于多尺度信息的缺乏,通过控制随机游走节点数量的方式提出了全局视图和局部视图的概念,同时制定不同的对比学习策略,从而对于不同的视图间执行不同的策略 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度图对比学习的图神经网络方法,其特征在于:包括以下步骤:S1、收集原始图数据,并对收集到的原始图数据进行标记;S2、对收集到的原始图数据通过随机游走的方式进行数据增强,并控制生成子图的规模,进而生成不同尺度的全局视图和局部视图;S3、通过图神经网络学习原始图数据的全局信息潜在表示和局部信息潜在表示;S4、针对图神经网络学习到的全局信息潜在表示和局部信息潜在表示,分别执行不同的对比学习策略;S5、通过最小化目标函数,改善不同视图在表征空间中的距离,提高网络所学习到的表征质量。2.根据权利要求1所述的一种基于多尺度图对比学习的图神经网络方法,其特征在于:在步骤S1中,根据不同的数据类型,标记从网络中收集到的原始图结构数据为对应的标签文件。3.根据权利要求2所述的一种基于多尺度图对比学习的图神经网络方法,其特征在于:在步骤S1中,定义一个图数据集D,该数据集由N个图数据组成,对于数据集中的每个图G={V,E},其中表示该图中的节点的集合,E表示图中的边的集合,v
i
代表图中的第i个节点,若节点v
i
和v
j
之间存在关联,则e
ij
=(v
i
,v
j
)∈E为图中的边;因此,图数据存在一个邻接矩阵A,其维度为V
×
V,若e
ij
∈E则A
ij
=1;此外,图数据的每个节点还具有特征向量x
i
∈R
d
,图中所有节点特征构成一个特征矩阵X∈R
|V|
×
d
,y
k
∈y是图数据对应的标签。4.根据权利要求1所述的一种基于多尺度图对比学习的图神经网络方法,其特征在于:在步骤S2中,给定一个G∈{G
n
:n∈N},定义图一个增强图其中为所使用的图增强方法;增强方法主要是子图采样,通过控制节点数量来控制生成子图的规模,进而将得到拥有不同尺度信息的全局视图和局部视图,即和5.根据权利要求1所述的一种基于多尺度图对比学习的图神经网络方法,其特征在于:步骤S3中,通过使用对于全局视图和局部视图之间共享模型参数的五层图同构网络来学习视图的潜在表示。6.根据权利要求1所述的一种基于多尺度图对比学习的图神经网络方法,其特征在于:步骤S4中,对于全局视图之间及全局和局部视图之间选择噪声对比估计函数,而对于局部视图之间选择使用一个回归器度量,该回归器的实现是一个拥有批次归一化和...
【专利技术属性】
技术研发人员:王波,刘彦北,李志胜,徐振宇,国英龙,王伟,贾智洋,杨铭锴,
申请(专利权)人:思腾合力天津科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。