当前位置: 首页 > 专利查询>重庆大学专利>正文

不平衡图节点分类自适应加权方法及系统技术方案

技术编号:36193631 阅读:24 留言:0更新日期:2022-12-31 21:15
本发明专利技术属于图节点分类技术领域,具体公开了一种不平衡图节点分类自适应加权方法及系统,该方法提取多个原始图数据的节点集合、边集合、图的邻接矩阵和图的特征矩阵,利用双层图卷积神经网络,构建图节点分类器;划分原始图数据的节点,计算原始图数据的节点不平衡率;构建自适应样本权重学习网络,对节点不平衡的原始图数据的节点集合内每个节点的损失施加权重;基于元学习,使用节点平衡的原始图数据更新自适应样本权重学习网络内的参数,得到自适应样本权重学习网络的最优参数,优化图节点分类器并进行不平衡图节点分类。采用本技术方案,基于元学习思想,通过少量无偏元数据的引导,弥补分类器对少数节点表示能力的不足,从而提高分类能力。从而提高分类能力。从而提高分类能力。

【技术实现步骤摘要】
不平衡图节点分类自适应加权方法及系统


[0001]本专利技术属于图节点分类
,涉及一种不平衡图节点分类自适应加权方法及系统。

技术介绍

[0002]图由节点以及边组成,是对对象及其之间相互关系的抽象数学表达。图神经网络是一类针对图结构数据的神经网络模型,广泛应用于社交网络的链路预测、化学分子特性预测和药物的相互作用预测等诸多现实问题。
[0003]其中,图表示学习得到了广泛的关注,它将原始的图节点从高维稀疏向量映射为低维稠密向量,并且尽可能多的保留网络的结构信息。图表示学习可以大致分为两类:无监督表示学习与半监督表示学习。无监督表示学习中具有代表性的工作有DeepWalk(DeepWalk是使用自然语言处理中的word2vec模型),通过截断随机游走在图中进行采样,使用节点与节点之间的共现关系来学习节点的嵌入,是第一个被提出来使用表示学习的网络嵌入方法。而典型的半监督图神经网络如GCN(图卷积网络),GAT(图注意力网络)等,通过聚合邻居结点之间的特征信息以此获取节点的嵌入表达。
[0004]目前大多数网络嵌入方法均假设图网络中的节点类别是平衡的,即不同类别节点的数量大致相等。当图中某类节点数量远远小于其他类别节点时,现有的嵌入方法往往无法取得令人满意的性能。而这种不平衡情况在现实中是大量存在的,并且少数类有时在现实问题中具有非常高的重要性。例如,在疾病诊断中,对一种罕见的传染病的漏检会导致多人的健康风险;在社交网络中,欺诈者数量远远小于正常用户,对此类节点的正确分类尤为重要。因此,非平衡数据上的图节点分类问题是当前图神经网络研究领域中一个具有挑战性的问题。

技术实现思路

[0005]本专利技术的目的在于提供一种不平衡图节点分类自适应加权方法及系统,以解决非平衡数据上的图节点分类的问题。
[0006]为了达到上述目的,本专利技术的基础方案为:一种不平衡图节点分类自适应加权方法,包括如下步骤:
[0007]获取多个原始图数据,并提取多个原始图数据中对应的节点集合、边集合、图的邻接矩阵和图的特征矩阵;
[0008]根据图的邻接矩阵和图的特征矩阵,并利用双层图卷积神经网络,构建图节点分类器;
[0009]将多个原始图数据对应的节点集合、边集合输入图节点分类器,将原始图数据的节点划分为两类:多数类节点和少数类节点,并计算多个原始图数据分别对应的节点不平衡率;
[0010]构建自适应样本权重学习网络,对节点不平衡的原始图数据的节点集合内每个节
点的损失施加权重;
[0011]基于元学习,使用节点平衡的原始图数据对自适应样本权重学习网络内的参数进行更新,得到自适应样本权重学习网络的最优参数;
[0012]利用自适应样本权重学习网络的最优参数,训练图节点分类器,得到优化的图节点分类器并进行不平衡图节点分类。
[0013]本基础方案的工作原理和有益效果在于:基于元学习思想,其包含分类器以及自适应样本权重学习网络,通过少量无偏元数据的引导,弥补分类器对少数节点表示能力的不足,从而提高分类能力。该方法是模型无关的,可以直接应用到所有图神经网络变体中去。
[0014]进一步,利用图卷积神经网络,构建图节点分类器的方法如下:
[0015]获取原始图数据其中V={v1,v2,

,v
i
,

,v
n
}为图中节点集合,v
i
表示第i个节点;为边的集合;A={a
1,1
,a
2,2
,

,a
i,j
,a
n,n
},为图的邻接矩阵,表示邻接矩阵的节点数量为n、维度为n,a
i,j
表示节点v
i
与节点v
j
之间边的权重;X={x1,x2,

,x
i
,

,x
n
},为图的特征矩阵,表示特征矩阵的节点数量为n、维度为d,表示节点v
i
所对应的特征向量;
[0016]利用双层图卷积神经网络,构建图节点分类器:
[0017][0018]其中,其中,为添加节点自链接后的邻接矩阵,是添加自连接与标准化后的邻接矩阵,f表示采用了softmax函数的分类器,Z为分类结果;而为其所对应的节点度矩阵,节点度矩阵,将图节点d维特征向量映射到h维的隐藏空间中去;为隐藏层到输出层的权重矩阵,其中c为图中节点类别数量。
[0019]图卷积神经网络可将节点特征以及其邻居节点之间的特征进行融合,从而更新本节点的嵌入,是一种非常经典的图数据挖掘模型,利于使用。
[0020]进一步,原始图数据的节点不平衡率计算如下:利用少数类节点数量min占节点总量total比例ρ来描述图中的节点不平衡水平:ρ越小则图中节点不平衡程度越高。
[0021]计算图数据的节点不平衡率,衡量不平衡程度,便于后续处理。
[0022]进一步,构建自适应样本权重学习网络,对节点不平衡的原始图数据的节点集合内每个节点的损失施加权重的方法如下:
[0023]令节点不平衡的原始图数据集合为令节点不平衡的原始图数据集合为为集合V
*
中的第i个节点,为集合V
*
中的i个节点的类别,N为集合V
*
中节点的总量;
[0024]设置f(v,w)为图节点分类器,v表示图节点,w为图节点分类器参数;
[0025]通过最小化损失函数计算图节点分类器最佳参数w
*
,记l为损失函数:
[0026][0027]针对非平衡原始图数据,通过对第i个节点v
i
的损失施加权重提升模型的对非平衡训练数据的鲁棒性;
[0028]记E(l;θ)为自适应样本权重学习网络,θ为自适应样本权重学习网络的参数,自适应样本权重学习网络的输入为节点在分类器中的损失向量,其输出为该节点的权重。
[0029]通过施加损失权重,提升模型对非平衡训练数据的鲁棒性。
[0030]进一步,计算自适应样本权重学习网络的最优参数的方法如下:
[0031]随机提取部分节点平衡的原始图数据作用无偏元数据集合随机提取部分节点平衡的原始图数据作用无偏元数据集合随机提取部分节点平衡的原始图数据作用无偏元数据集合为集合V
meta
中第i个节点,为集合V
meta
中第i个节点的类别,K为节点集合V
meta
中节点的总量,K<<N;
[0032]E(l;θ)为自适应样本权重学习网络,l为损失函数,θ为自适应样本权重学习网络的参数,采用元学习的方式对参数θ进行学习,得到自适应样本权重学习网络的最优参数θ
*

[0033][0034]其中,表示元数据上的损失。
[0035]元学习的主要思想是设计能够利用之本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种不平衡图节点分类自适应加权方法,其特征在于,包括如下步骤:获取多个原始图数据,并提取多个原始图数据中对应的节点集合、边集合、图的邻接矩阵和图的特征矩阵;根据图的邻接矩阵和图的特征矩阵,并利用双层图卷积神经网络,构建图节点分类器;将多个原始图数据对应的节点集合、边集合输入图节点分类器,将原始图数据的节点划分为两类:多数类节点和少数类节点,并计算多个原始图数据分别对应的节点不平衡率;构建自适应样本权重学习网络,对节点不平衡的原始图数据的节点集合内每个节点的损失施加权重;基于元学习,使用节点平衡的原始图数据对自适应样本权重学习网络内的参数进行更新,得到自适应样本权重学习网络的最优参数;利用自适应样本权重学习网络的最优参数,训练图节点分类器,得到优化的图节点分类器并进行不平衡图节点分类。2.如权利要求1所述的不平衡图节点分类自适应加权方法,其特征在于,利用图卷积神经网络,构建图节点分类器的方法如下:获取原始图数据其中V={v1,v2,

,v
i
,

,v
n
}为图中节点集合,v
i
表示第i个节点;为边的集合;A={a
1,1
,a
2,2
,

,a
i,j
,a
n,n
},为图的邻接矩阵,表示邻接矩阵的节点数量为n、维度为n,a
i,j
表示节点v
i
与节点v
j
之间边的权重;X={x1,x2,

,x
i
,

,x
n
},为图的特征矩阵,表示特征矩阵的节点数量为n、维度为d,表示节点v
i
所对应的特征向量;利用双层图卷积神经网络,构建图节点分类器:其中,其中,为添加节点自链接后的邻接矩阵,是添加自连接与标准化后的邻接矩阵,f表示采用了softmax函数的分类器,Z为分类结果;而为其所对应的节点度矩阵,度矩阵,将图节点d维特征向量映射到h维的隐藏空间中去;为隐藏层到输出层的权重矩阵,其中c为图中节点类别数量。3.如权利要求1所述的不平衡图节点分类自适应加权方法,其特征在于,原始图数据的节点不平衡率计算如下:利用少数类节点数量min占节点总量total比例ρ来描述图中的节点不平衡水平:ρ越小则图中节点不平衡程度越高。4.如权利要求1所述的不平衡图节点分类自适应加权方法,其特征在于,构建自适应样本权重学习网络,对节点不平衡的...

【专利技术属性】
技术研发人员:陈小杰邢永康
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1