【技术实现步骤摘要】
适用于图神经网络分布外泛化的分布鲁棒优化方法及系统
[0001]本专利技术涉及图神经网络领域,尤其涉及一种适用于图神经网络分布外泛化的分布鲁棒优化方法及系统。
技术介绍
[0002]如今,图结构数据越来越受到人们的重视,与图相关的各种算法也应运而生,其中,图神经网络得到了广泛的研究,也被应用到了多个领域。图神经网络作为一种深度学习模型,其可信性十分重要,尤其是在金融领域或者生物研究等领域。可信AI中的一个重要分支就是模型的分布外泛化问题,由于模型在训练过程中使用的数据与在预测中所面对的数据分布可能存在不同,导致模型在测试时与训练阶段的性能会有很大的差距,从而使得模型缺乏最基本的可信度。
[0003]目前有一些工作专门用于解决图卷积神经网络的分布外泛化问题。
[0004]EERM(Explore
‑
to
‑
Extrapolate Risk Minimization)首先利用生成器将所有节点划分成不同的环境,然后计算出每个环境下节点的平均损失,训练分类模型使得所有环境损失的均值 ...
【技术保护点】
【技术特征摘要】
1.适用于图神经网络分布外泛化的分布鲁棒优化方法,其特征在于,包括以下步骤:步骤1、将训练个体输入到图卷积神经网络模型,完成对目标个体邻居特征的聚合、特征变换以及更新目标个体自身的特征,最后得到预测输出;步骤2、计算每个训练个体的损失值;步骤3、利用基于KL散度的分布鲁棒优化算法计算每个训练个体的损失权重;步骤4、对个体的损失权重进行平滑;步骤5、利用加权损失进行训练;步骤6、使用训练好的模型在进行数据预测。2.根据权利要求1所述的适用于图神经网络分布外泛化的分布鲁棒优化方法,其特征在于,图卷积神经网络的输入包括特征矩阵和图结构信息,其中,特征矩阵包括节点特征矩阵和边特征矩阵,图结构信息由邻接矩阵保存,表示节点之间的连接关系;图卷积神经网络主要由三个部分组成:特征变换、信息聚合和特征更新。3.根据权利要求2所述的适用于图神经网络分布外泛化的分布鲁棒优化方法,其特征在于,所述图卷积神经网络为Graph Convolutional Networks(GCN)模型:其中,W
l
表示第l层的特征变换矩阵;H
l
表示个体在第l层的特征表示,H0为个体的原始特征;D表示图中节点的度矩阵,代表每个节点的邻居数量;A表示图的邻接矩阵,则是对邻接矩阵进行归一化操作;σ表示激活函数;通过将图中每个节点的特征矩阵以及表示节点之间边关系的邻接矩阵输入到图卷积神经网络中,最终得到每一个节点的分类结果。4.根据权利要求1所述的适用于图神经网络分布外泛化的分布鲁棒优化方法,其特征在于,当前图数据存在N个个体,模型对每个个体进行分类,共有M个风险类别,利用标签计算的交叉熵损失来优化模型参数,计算公式如下:其中,N为训练个体个数,L
i
为个体i对应的损失,p
ic
表示模型对个体i在类别c上的预测概率,y
ic
则是对应的标签,通过该公式得到最后的总损失L。5.根据权利要求1所述的适用于图神经网络分布外泛化的分布鲁棒优化方法,其特征在于,根据所得的损失值,使用基于KL散度的分布鲁棒优化算法,计算出当前所有个体的损失权重,该损失权重分布为当前算法所能找到的最差分布。6.根据权利要求1所述的适用于图神经网络分布外泛化的分布鲁棒优化方法,其特征在于,优...
【专利技术属性】
技术研发人员:邢晓芬,许轶珂,郭锴凌,徐向民,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。