一种可信的图神经网络节点分类方法技术

技术编号:38050106 阅读:10 留言:0更新日期:2023-06-30 11:16
本发明专利技术公开了一种可信的图神经网络节点分类方法,属于图半监督分类技术领域,具体步骤如下:输入图数据,采用图卷积神经网络对图数据进行特征学习和特征提取,并获取最终图节点数据的嵌入表示;将嵌入表示输入到质心模块进行处理,利用有标签节点的嵌入表示获取不同类别的质心;通过将无标签节点的嵌入表示与各类别的质心输入到RBF模块,得到无标签节点与质心的距离,并预测无标签节点所属类别;通过RBF模块加入不确定性损失和梯度惩罚损失,联合交叉熵损失共同作为目标函数,通过参数优化最小化损失函数,迭代更新。本发明专利技术采用上述一种可信的图神经网络节点分类方法,不仅能够较好地对图节点进行分类,还能够提高分类模型的可信性。可信性。可信性。

【技术实现步骤摘要】
一种可信的图神经网络节点分类方法


[0001]本专利技术涉及图半监督分类
,尤其是涉及一种可信的图神经网络节点分类方法。

技术介绍

[0002]图在日常现实中广泛存在,且作为一种灵活的数据形式可以表示不同特征对象之间复杂的连接关系。例如交通网络、社交网络、生物化学网络等。由于图可以包含较多的数据信息,例如节点的属性信息和链接信息,导致图数据相对复杂,因此对图数据进行分析具有一定的挑战。近年来,图神经网络在数据分析方面受到了极大的关注,逐渐成为学术界的一个热点研究领域。图数据的分析任务包括了节点分类、图分类以及链接预测等。在图节点分类任务中,输入一个图,目的是根据学习输入节点和类别标签的对应关系,预测未知节点的类别标签。
[0003]尽管图神经网络在半监督节点分类方面表现优异,但图神经网络分类器不仅需要准确的预测值,更需要得到可信的预测值。可信性指的是模型能够检测出分布外样本的数据的能力,对于测试数据中未训练类别的样本输入给出一个越高置信的预测值意味着模型是越不可信的,但现有模型往往对未训练样本给出较高的置信度,意味着现有模型不确定的模型,具有较高的不确定性。

技术实现思路

[0004]本专利技术的目的是提供一种可信的图神经网络节点分类方法,在获得较高节点分类准确率的同时,有效提高图节点数据分类模型的可信性。
[0005]为实现上述目的,本专利技术提供了一种可信的图神经网络节点分类方法,具体步骤如下:
[0006]步骤S1:输入图数据,图数据包括特征矩阵、邻接矩阵以及部分节点的标签;
[0007]步骤S2:采用图卷积神经网络对图数据进行特征学习和特征提取,再通过Softmax函数获取最终图节点数据的嵌入表示;
[0008]步骤S3:将图卷积神经网络学习到的嵌入表示输入到质心模块进行处理,利用有标签节点的嵌入表示获取不同类别的质心;
[0009]步骤S4:通过将无标签节点的嵌入表示与各类别的质心输入到RBF模块,得到无标签节点与质心的距离,并预测无标签节点所属类别;
[0010]步骤S5:通过RBF模块加入不确定性损失和梯度惩罚损失,联合交叉熵损失共同作为目标函数,通过参数优化最小化损失函数,迭代更新用于提高图节点数据分类模型的可靠性。
[0011]优选的,在步骤S1中,特征矩阵表示节点的特征信息,邻接矩阵表示节点之间所连接边的信息,将二者以及部分节点的标签信息共同作为输入的图数据。
[0012]优选的,在步骤S2中,所述图卷积神经网络采用两层图卷积神经网络逐层提取节
点的特征,利用ReLU函数作为激活函数,Softmax函数作为分类器,整体正向传播得到节点的嵌入表示,节点的嵌入表示的计算公式如下:
[0013][0014]其中,A表示邻接矩阵,X表示特征向量矩阵,I表示单位矩阵;X表示特征向量矩阵,θ
(0)
表示第一层图卷积层所学习的权重矩阵,θ
(1)
表示第二层图卷积层所学习的权重矩阵。
[0015]优选的,在步骤S3中,将嵌入表示输入到质心模块,通过计算出有标签节点在嵌入空间中所得嵌入表示的平均值获取每类质心,质心计算公式如下:
[0016][0017]其中,V
l
是有标签节点的索引,是有标签节点x
l
的嵌入向量,y
l
为节点x
l
的标签。
[0018]优选的,在步骤S4中,RBF模块输出包括未标记节点和每个类别质心的距离度量,通过Softmax函数输出层给每个未标记节点分配空间中距离其最近的类别质心的标签,计算公式如下:
[0019][0020]其中,U
k
是RBF模块的输出,是无标签节点x
u
的嵌入向量,n表示质心的数量即节点类别数量,W
k
是一个可学习的权重矩阵,σ是超参数。
[0021]优选的,通过RBF模块所预测得未标记节点的类别标签,得到无标签节点得类别,同时获取模型每个未标记节点的可信性,可信度为无标签节点与质心间的距离。
[0022]优选的,在步骤S5中,在交叉熵损失的基础之上,引入梯度惩罚损失和不确定性损失,通过反向传播算法最小化各项损失,
[0023]交叉熵损失计算公式如下:
[0024][0025]V
l
是有标签节点的索引,K表示节点的类别数量,Y
ik
表示第i个有标签节点的标签集合,Z
ik
表示第i个有标签节点的嵌入向量;
[0026]不确定性损失计算公式如下:
[0027][0028]其中,U
k
表示不确定性,表示有标签节点所求得的质心,V是图数据的节点集合;
[0029]梯度惩罚损失计算公式如下:
[0030][0031]其中||
·
||2是L2范数。
[0032]优选的,模型总损失如下:
[0033]L=L
ce
+λ1L
un
+λ2L
gp
[0034]其中,用λ1和λ2分别表示不确定性损失和梯度惩罚损失重要程度。
[0035]因此,本专利技术采用上述一种可信的图神经网络节点分类方法,将分类阶段与不确定性估计相结合,在模型能够得到较高分类准确率的同时,还能够增强模型的可信性。本专利技术可用于图半监督分类等场景,能够帮助更好地分析图数据。
[0036]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
附图说明
[0037]图1为本专利技术一种可信的图神经网络节点分类方法流程图;
[0038]图2为本专利技术算法原理图;
[0039]图3为本专利技术分布外样本检测可视化曲线结果图。
具体实施方式
[0040]实施例
[0041]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。
[0042]因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0043]下面结合附图,对本专利技术的实施方式作详细说明。
[0044]一种可信的图神经网络节点分类方法,具体步骤如下:
[0045]步骤S1:输入图数据,图数据包括特征矩阵、邻接矩阵以及部分节点的标签。
[0046]本实施例引用了三个引文网络数据集进行实验,包括Cora、Citeseer和Pubmed数据集,每个数据集中包括的不同节点信息如下表所示:
[0047] CoraC本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种可信的图神经网络节点分类方法,其特征在于,具体步骤如下:步骤S1:输入图数据,图数据包括特征矩阵、邻接矩阵以及部分节点的标签;步骤S2:采用图卷积神经网络对图数据进行特征学习和特征提取,再通过Softmax函数获取最终图节点数据的嵌入表示;步骤S3:将图卷积神经网络学习到的嵌入表示输入到质心模块进行处理,利用有标签节点的嵌入表示获取不同类别的质心;步骤S4:通过将无标签节点的嵌入表示与各类别的质心输入到RBF模块,得到无标签节点与质心的距离,并预测无标签节点所属类别;步骤S5:通过RBF模块加入不确定性损失和梯度惩罚损失,联合交叉熵损失共同作为目标函数,通过参数优化最小化损失函数,迭代更新用于提高图节点数据分类模型的可靠性。2.根据权利要求1所述的一种可信的图神经网络节点分类方法,其特征在于:在步骤S1中,特征矩阵表示节点的特征信息,邻接矩阵表示节点之间所连接边的信息,将二者以及部分节点的标签信息共同作为输入的图数据。3.根据权利要求1所述的一种可信的图神经网络节点分类方法,其特征在于:在步骤S2中,所述图卷积神经网络采用两层图卷积神经网络逐层提取节点的特征,利用ReLU函数作为激活函数,Softmax函数作为分类器,整体正向传播得到节点的嵌入表示,节点的嵌入表示的计算公式如下:其中,A表示邻接矩阵,X表示特征向量矩阵,I表示单位矩阵;X表示特征向量矩阵,θ
(0)
表示第一层图卷积层所学习的权重矩阵,θ
(1)
表示第二层图卷积层所学习的权重矩阵。4.根据权利要求1所述的一种可信的图神经网络节点分类方法,其特征在于:在步骤S3中,将嵌入表示输入到质心模块,通过计算出有标签节点在嵌入空间中所得嵌入表示的平均值获取每类质心,质心计算公式如下:其中,V
l
是有标签节点的索引,是有标签节点x
l
的嵌入向量,y...

【专利技术属性】
技术研发人员:王波王伟国英龙徐振宇刘彦北李志胜贾智洋杨铭锴
申请(专利权)人:思腾合力天津科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1