基于位置学习图卷积神经网络的图分类方法及系统技术方案

技术编号：29301416 阅读：20 留言：0更新日期：2021-07-17 01:25

本发明专利技术提出一种基于位置学习图卷积神经网络的图分类方法和系统，本发明专利技术目的是解决上述现有图分类方法启发式地对图中节点进行排序、选择的过程导致重要结构丢失和提取不到启发式规则下的关键结构等问题。具体来说，本发明专利技术提出了一种基于位置学习卷积神经网络的图分类方法，核心思想是通过为图上每个节点学习对应的位置，进而得到整个图的表示。这种端到端的建模方式有效避免了对节点进行排序、选择和丢弃的过程，不仅提升了图分类的准确率，而且保证了对关键结构的有效提取。且保证了对关键结构的有效提取。且保证了对关键结构的有效提取。

全部详细技术资料下载

【技术实现步骤摘要】
基于位置学习图卷积神经网络的图分类方法及系统

[0001]本专利技术属于数据挖掘技术与社会网络研究领域，涉及一种图分类方法，具体涉及一种基于卷积神经网络的图级别特征提取和模式识别方法。

技术介绍

[0002]随着互联网技术的蓬勃发展，图数据广泛出现在我们的生活中，图数据不仅可以用于表示复合对象，还能表示复合对象中元素间的复杂关系。例如社交网络、交通网络、引文网络，生物化学网络等。图分类任务是指给定一组图，通过数据挖掘的方式找到图和对应类别标签的映射关系，进而预测每个图的类别标签的过程。图分类作为一个重要的数据挖掘任务，可以应用在很多领域，包括金融科技、社会网络分析、生物信息学、化学信息学等。例如，在化学信息学中，通过对分子图进行分类来判断化合物分子的诱变性、毒性、抗癌活性等；生物信息学中，通过蛋白质网络分类判断蛋白质是不是酶，是不是具有某种疾病的治疗能力。
[0003]现有的图分类方法主要包括两大类。第一类是基于相似度计算的图分类方法，基于相似度计算的图分类方法是通过计算成对图的相似度对图进行分类，包括图核方法和图匹配方法。图核方法通过图核的定义来计算图的相似度，图核是图的某种子结构(例如：子图、子树、路径等)，以图核作为图的特征计算图的相似度，进而进行图分类。图匹配方法通过考虑跨图因素计算图之间的相似度分数，进而进行图分类。早期的图分类方法主要关注图核方法，然而这种方法不够灵活且通常计算代价较大，图的特征提取过程和图的分类是独立进行的，因此无法针对具体任务进行优化。
[0004]第二类是基于图神经网...

【技术保护点】

【技术特征摘要】
1.一种基于位置学习图卷积神经网络的图分类方法，其特征在于，包括：步骤1、获取由节点和边构成的图数据，以该图数据中每个节点为中心，取节点的自我网络图作为子图；步骤2、利用子图的特征和结构信息，为子图上的节点学习其在子图表示空间的位置，将子图中表示空间位置相同的节点合并为超节点，得到子图间相同大小的局部感受野，利用和局部感受野大小相同的卷积核对该局部感受野进行特征提取，得到每个子图的第一特征H
local
；步骤3、根据该第一特征H
local
，为图上的节点学习其在图表示空间的位置，将该图数据中表示空间位置相同的节点合并为超节点，得到固定大小的全局感受野，利用和全局感受野大小相同的卷积核对该全局感受野进行特征提取，得到该图数据的第二特征H
glob
；步骤4、根据该第二特征对该图数据进行分类，得到该图数据的分类结果。2.如权利要求1所述的基于位置学习图卷积神经网络的图分类方法，其特征在于，该步骤2包括：图数据G包含的节点集合以每个节点为中心，取节点的n
‑
hop自我网络图，其中，n一般是{2，3，4}。接着，利用子图上节点的特征信息和结构信息，我们采用图同构神经网络为子图上节点学习节点表示：其中，为子图G
i
上节点v在第k层图同构神经网络中的特征表示，N
i
(v)为节点v的邻居节点集合，MLP为多层感知机，为子图G
i
中节点v的邻居节点u在第k
‑
1层图同构神经网络中的特征表示。3.如权利要求2所述的基于位置学习图卷积神经网络的图分类方法，其特征在于，该步骤2包括：集合节点v在同构神经网络中每一层的特征表示，得到节点v的特征表示h
v，i
，当前子图G
i
的中心节点v
i
，节点v
i
表示为则节点v在表示空间的位置为：4.如权利要求3所述的基于位置学习图卷积神经网络的图分类方法，其特征在于，该步骤2包括：子图上所有节点的位置矩阵为其中，|V
i
|是子图上节点的个数，M
local
是子图空间上位置的个数，整个子图上节点的表示是将处于同一位置的节点加权求和，得到新的超节点，则子图构成的局部感受野可以表示为：其中，D是特征维度；利用W个和局部感受野大小相同的卷积核对其进行特征提取，得到第i个子图的局部卷
积积其中，K
(w)
表示第w个局部卷积核，b
(w)
表示偏置项，<>
F
表示F内积，σ()是非线性激活函数，W是模型中的一个超参数；子图G
i
在局部卷积后的特征映射为所有子图共享同样的W个卷积核，经过局部卷积的全图特征映射为享同样的W...

【专利技术属性】
技术研发人员：沈华伟，王兆慧，曹婍，徐冰冰，岑科廷，程学旗，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人