【技术实现步骤摘要】
基于全局图瓶颈表示的图自监督学习方法
[0001]本专利技术涉及计算机图像处理技术,具体涉及一种基于全局图瓶颈表示的图自监督学习方法
。
技术介绍
[0002]传统的深度学习方法被应用在提取欧式空间数据的特征方便取得了巨大的成功,但许多实际应用场景中的数据是从非欧式空间生成的
。
图神经网络可以对这种非欧式空间生成的数据需要有效的分析
。
图神经网络同时使用数据的特征和结构,通过聚合邻居节点信息来更新当前的节点特征,获得节点表示后,将其应用于图分类
、
节点分类
、
链接预测等下游任务
。
[0003]传统图神经网络如图卷积网络
(GCN)
通过卷积操作聚合邻居节点的信息,堆叠多层不断更新自身节点的表示;图注意力网络
(GAT)
对节点的邻居分配不同的权重,通过多头注意力聚合邻居节点的信息;这种图神经网络的核心是定义确定性传播操作
。
目前大多图神经网络采用全聚合的策略,即节点接收来自邻居节点的所有属性信息
。
然而,这种聚合方式考虑的重点放在了网络的局部结构关系
(
如一阶相似性或二阶相似性
)
,容易遇到优化的不稳定性,如梯度消失和表示过度平滑,从而在表示远距离的依赖关系方面很困难
。
[0004]图随机神经网络
(GRAND)
设计了一种随机传播策略来获得图数据增强,利用一致性正则化来优化不同数据增 ...
【技术保护点】
【技术特征摘要】
1.
一种基于全局图瓶颈表示的图自监督学习方法,其特征在于:包括以下步骤:步骤
(1)、
输入待分类的原始图数据,包括原始图的邻接矩阵
A
和节点特征矩阵
X
;邻接矩阵
A
的维度为
N
×
N
,
N
是指原始图中节点的个数,节点特征矩阵
X
的维度为
N
×
d
,
d
是节点的特征维度;步骤
(2)、
初始化一个全局共享的
cls
节点,其向量表示为
x
cls
∈1
×
d
;步骤
(3)、
执行两次不同的图数据增强操作,并分别进行构图以获得两个新视图,然后在新视图数据上进行特征传播,具体过程为:步骤
(3.1)、
两次图数据增强操作分别以不同随机概率对节点特征矩阵
X
进行随机删除,以生成不同的扰动特征矩阵;步骤
(3.2)、
构图操作是指将步骤
(2)
所得
cls
节点与扰动特征矩阵中所有节点连边得到两个不同的新视图;步骤
(3.3)、
对于步骤
(3.2)
所得新视图分别通过图卷积神经网络进行特征传播,新视图中每个节点的特征随机地与其高阶邻居的特征进交互,而
cls
节点则聚合图中所有节点的信息后回传到每个节点;步骤
(4)、
将步骤
(3)
输出的特征输入多层感知器分类模块,得到最终的输出,也就是得到原始图中每个节点的分类结果;步骤
(5)、
计算有标签节点的监督损失,以及一致性正则化,通过多次迭代训练得到最后的分类结果
。2.
根据权利要求1所述的基于全局图瓶颈表示的图自监督学习方法,其特征在于:所述步骤
(3)
数据增强以及特征传播的具体细节如下:首先,为每个节点
v
i
随机采样一个二进制掩码
ε
i
,二进制掩码
ε
i
服从伯努利分布
Bernoulli(1
‑
δ
)
,通过掩码获取扰动矩阵
X'
=
ε
i
X
;然后,为每个图添加
cls
节点
cls
节点与图上每个节点之间都有连边,如公式
(1)
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。