基于位置学习图卷积神经网络的图分类方法及系统技术方案

技术编号:29301416 阅读:20 留言:0更新日期:2021-07-17 01:25
本发明专利技术提出一种基于位置学习图卷积神经网络的图分类方法和系统,本发明专利技术目的是解决上述现有图分类方法启发式地对图中节点进行排序、选择的过程导致重要结构丢失和提取不到启发式规则下的关键结构等问题。具体来说,本发明专利技术提出了一种基于位置学习卷积神经网络的图分类方法,核心思想是通过为图上每个节点学习对应的位置,进而得到整个图的表示。这种端到端的建模方式有效避免了对节点进行排序、选择和丢弃的过程,不仅提升了图分类的准确率,而且保证了对关键结构的有效提取。且保证了对关键结构的有效提取。且保证了对关键结构的有效提取。

【技术实现步骤摘要】
基于位置学习图卷积神经网络的图分类方法及系统


[0001]本专利技术属于数据挖掘技术与社会网络研究领域,涉及一种图分类方法,具体涉及一种基于卷积神经网络的图级别特征提取和模式识别方法。

技术介绍

[0002]随着互联网技术的蓬勃发展,图数据广泛出现在我们的生活中,图数据不仅可以用于表示复合对象,还能表示复合对象中元素间的复杂关系。例如社交网络、交通网络、引文网络,生物化学网络等。图分类任务是指给定一组图,通过数据挖掘的方式找到图和对应类别标签的映射关系,进而预测每个图的类别标签的过程。图分类作为一个重要的数据挖掘任务,可以应用在很多领域,包括金融科技、社会网络分析、生物信息学、化学信息学等。例如,在化学信息学中,通过对分子图进行分类来判断化合物分子的诱变性、毒性、抗癌活性等;生物信息学中,通过蛋白质网络分类判断蛋白质是不是酶,是不是具有某种疾病的治疗能力。
[0003]现有的图分类方法主要包括两大类。第一类是基于相似度计算的图分类方法,基于相似度计算的图分类方法是通过计算成对图的相似度对图进行分类,包括图核方法和图匹配方法。图核方法通过图核的定义来计算图的相似度,图核是图的某种子结构(例如:子图、子树、路径等),以图核作为图的特征计算图的相似度,进而进行图分类。图匹配方法通过考虑跨图因素计算图之间的相似度分数,进而进行图分类。早期的图分类方法主要关注图核方法,然而这种方法不够灵活且通常计算代价较大,图的特征提取过程和图的分类是独立进行的,因此无法针对具体任务进行优化。
[0004]第二类是基于图神经网络的图分类方法。随着深度学习在图像、文本等领域的成功,研究人员开始关注用深度学习建模图数据。基于深度学习的图数据建模方法也逐渐被应用于图分类问题。其中,图神经网络应用于图分类问题时,主要包括基于图卷积神经网络的方法和基于传统卷积神经网络的方法。基于图卷积神经网络的方法,假设图上相邻节点的标签相同,采用邻居信息传递机制获得节点表示,然后利用池化算子对节点表示进行汇总得到整个图的表示用于图分类。这种方法着眼于节点角度,更适合图上的节点分类任务。基于传统卷积神经网络的方法,先将图数据表示为结构规则的欧式数据,然后在规则的欧式数据基础上进行传统的卷积,提取图上特征,进而进行图分类。这种方法具有提取关键结构的能力。
[0005]现有技术虽然给出了一些图分类的方法,但仍然存在这一些明显的不足:
[0006]1)基于图核的图分类方法中,特征的表示和分类的过程是分开进行的,无法针对具体的分类任务进行统一的优化。此外,图核方法中,图特征的表示需要一些先验的、启发式的特征,与图上的结构特征进行对比,通常复杂度较高,无法应用到大规模的图上。
[0007]2)基于图卷积神经网络的图分类方法中,基于相邻节点标签相同的假设,利用信息传递的卷积求得节点表示后,用池化机制得到整个图的表示。但已有研究指出,信息传递式图卷积方法中,存在图上节点信息过平滑的问题,基于信息传递式卷积得到的节点表示
非常相似,因此后续池化方式的变化不能显著的影响图的表示和分类。
[0008]3)基于传统卷积神经网络的图分类方法中,把图结构转化为欧式数据时,由于图上的节点没有确定的、统一的顺序,已有的方法都是在一些启发式的规则下对节点进行排序和选择,直接丢失了图上的一些结构,并且使得后续卷积得到的图上重要结构可能是这种启发式排序规则下的重要结构,而不是图分类任务中所需要的重要结构。
[0009]因此,如何由图数据得到包含丰富图特征的图表示,进一步进行图的分类,是一个重要且亟待解决的问题。

技术实现思路

[0010]本专利技术的目的是解决上述现有图分类方法启发式的对图中节点进行排序、选择的过程导致重要结构丢失和提取不到启发式规则下的关键结构等问题。具体来说,本专利技术提出了一种基于位置学习卷积神经网络的图分类方法,核心思想是通过为图上每个节点学习对应的位置,进而得到整个图的表示。这种端到端的建模方式有效避免了对节点进行排序、选择和丢弃的过程,不仅提升了图分类的准确率,而且保证了对关键结构的有效提取。
[0011]具体来说本专利技术提出了一种基于位置学习图卷积神经网络的图分类方法,其中包括:
[0012]步骤1、获取由节点和边构成的图数据,以该图数据中每个节点为中心,取节点的自我网络图作为子图;
[0013]步骤2、利用子图的特征和结构信息,为子图上的节点学习其在子图表示空间的位置,将子图中表示空间位置相同的节点合并为超节点,得到子图间相同大小的局部感受野,利用和局部感受野大小相同的卷积核对该局部感受野进行特征提取,得到每个子图的第一特征H
local

[0014]步骤3、根据该第一特征H
local
,为图上的节点学习其在图表示空间的位置,将该图数据中表示空间位置相同的节点合并为超节点,得到固定大小的全局感受野,利用和全局感受野大小相同的卷积核对该全局感受野进行特征提取,得到该图数据的第二特征H
glob

[0015]步骤4、根据该第二特征对该图数据进行分类,得到该图数据的分类结果。
[0016]所述的基于位置学习图卷积神经网络的图分类方法,其中该步骤2包括:
[0017]图数据G包含的节点集合以每个节点为中心,取节点的n

hop自我网络图,其中,n一般是{2,3,4}。接着,利用子图上节点的特征信息和结构信息,我们采用图同构神经网络为子图上节点学习节点表示:
[0018][0019]其中,为子图G
i
上节点v在第k层图同构神经网络中的特征表示,N
i
(v)为节点v的邻居节点集合,MLP为多层感知机,为子图G
i
中节点v的邻居节点u在第k

1层图同构神经网络中的特征表示。
[0020]所述的基于位置学习图卷积神经网络的图分类方法,其中该步骤2包括:
[0021]集合节点v在同构神经网络中每一层的特征表示,得到节点v的特征表示h
v,i
,当前
子图G
i
的中心节点v
i
,节点v
i
表示为则节点v在表示空间的位置为:
[0022]所述的基于位置学习图卷积神经网络的图分类方法,其中该步骤2包括:
[0023]子图上所有节点的位置矩阵为L
i
=[l
1,i
,l
2,i
,

,l
|v|,i
],其中,|V
i
|是子图上节点的个数,M
local
是子图空间上位置的个数,整个子图上节点的表示是将处于同一位置的节点加权求和,得到新的超节点,则子图构成的局部感受野可以表示为:
[0024][0025]其中,D是特征维度;
[0026]利用W个和局部感受野大小相同的卷积核对其进行特征提取,得到第i个子图的局部卷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于位置学习图卷积神经网络的图分类方法,其特征在于,包括:步骤1、获取由节点和边构成的图数据,以该图数据中每个节点为中心,取节点的自我网络图作为子图;步骤2、利用子图的特征和结构信息,为子图上的节点学习其在子图表示空间的位置,将子图中表示空间位置相同的节点合并为超节点,得到子图间相同大小的局部感受野,利用和局部感受野大小相同的卷积核对该局部感受野进行特征提取,得到每个子图的第一特征H
local
;步骤3、根据该第一特征H
local
,为图上的节点学习其在图表示空间的位置,将该图数据中表示空间位置相同的节点合并为超节点,得到固定大小的全局感受野,利用和全局感受野大小相同的卷积核对该全局感受野进行特征提取,得到该图数据的第二特征H
glob
;步骤4、根据该第二特征对该图数据进行分类,得到该图数据的分类结果。2.如权利要求1所述的基于位置学习图卷积神经网络的图分类方法,其特征在于,该步骤2包括:图数据G包含的节点集合以每个节点为中心,取节点的n

hop自我网络图,其中,n一般是{2,3,4}。接着,利用子图上节点的特征信息和结构信息,我们采用图同构神经网络为子图上节点学习节点表示:其中,为子图G
i
上节点v在第k层图同构神经网络中的特征表示,N
i
(v)为节点v的邻居节点集合,MLP为多层感知机,为子图G
i
中节点v的邻居节点u在第k

1层图同构神经网络中的特征表示。3.如权利要求2所述的基于位置学习图卷积神经网络的图分类方法,其特征在于,该步骤2包括:集合节点v在同构神经网络中每一层的特征表示,得到节点v的特征表示h
v,i
,当前子图G
i
的中心节点v
i
,节点v
i
表示为则节点v在表示空间的位置为:4.如权利要求3所述的基于位置学习图卷积神经网络的图分类方法,其特征在于,该步骤2包括:子图上所有节点的位置矩阵为其中,|V
i
|是子图上节点的个数,M
local
是子图空间上位置的个数,整个子图上节点的表示是将处于同一位置的节点加权求和,得到新的超节点,则子图构成的局部感受野可以表示为:其中,D是特征维度;利用W个和局部感受野大小相同的卷积核对其进行特征提取,得到第i个子图的局部卷
积积其中,K
(w)
表示第w个局部卷积核,b
(w)
表示偏置项,<>
F
表示F内积,σ()是非线性激活函数,W是模型中的一个超参数;子图G
i
在局部卷积后的特征映射为所有子图共享同样的W个卷积核,经过局部卷积的全图特征映射为享同样的W...

【专利技术属性】
技术研发人员:沈华伟王兆慧曹婍徐冰冰岑科廷程学旗
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1