一种基于超图p-Laplacian图卷积神经网络的半监督分类方法技术

技术编号:21142077 阅读:29 留言:0更新日期:2019-05-18 05:26
本发明专利技术公开了一种基于超图p‑Laplacian图卷积神经网络的半监督分类方法,属于半监督分类技术领域。包括:1:提取训练样本特征;2:计算超图p‑Laplacian矩阵;3:计算结构信息矩阵;4:建立超图p‑Laplacian的图卷积神经网络模型;5:对训练样本特征进行卷积操作,得到第一层网络输出;6:每一层网络的输出作为下一层网络的输入;7:将最后一层卷积网络的输出作为分类器的输入,得到模型参数;8:然后计算验证样本的交叉熵损失,选择最好的模型参数;9:提取测试样本的特征;10:将最后一层卷积网络输出的特征向量送到分类器进行分类。本申请采用多次卷积操作,能够大幅度提高模型分类效果。

【技术实现步骤摘要】
一种基于超图p-Laplacian图卷积神经网络的半监督分类方法
本专利技术涉及一种半监督分类方法,特别是指一种基于超图p-Laplacian图卷积神经网络的半监督分类方法。
技术介绍
随着目前社会生活的丰富与扩展,数据所呈现出来的结构变的越来越复杂,如何对这些复杂的结构型数据进行高效的管理与应用成为了目前研究者们所面临的严峻挑战。当前,将深度学习网络应用于复杂结构数据分类任务,可以从原始数据中自动化地去提取丰富的样本特征,有助于更加全面的反映原始数据的信息。相较于传统的方法,深度学习能够学习到更高效的特征与模式。因此,大量深度学习相关的算法包括卷积神经网络(CNN),Deepwalk,Struc2vec以及图卷积神经网络(GCN)已成功的应用于图结构的数据分类任务中。其中,图卷积神经网络(GCN)能够更加高效的处理这种数据结构并且在半监督的数据分类任务中获得了更好的识别率。GCN通过使用拉普拉斯矩阵表示数据的流形结构,在训练过程中将数据的特征信息与结构信息进行融合,从而提取到丰富的复杂结构的数据特征。但是,如何描述复杂的图结构数据间的差异是十分重要的。上述的分类算法都无法更加精细的描述出数据的流形结构,从而无法得到更好的分类效果。
技术实现思路
为解决现有技术中的不足,本专利技术提供一种基于超图p-Laplacian图卷积神经网络的半监督分类方法,HpLapGCN算法使用超图p-Laplacian矩阵表示数据的流形结构,p-Laplacian是标准的图Laplacian矩阵的非线性推广,超图是普通图的推广。超图p-Laplacian能够更加精细反应数据的流形结构,从而提取到更加精细的数据结构信息,最终提取到能够更加全面的反映样本的特征,进而提高数据的识别率。为解决上述技术问题,本专利技术提供技术方案如下:本专利技术提供一种基于超图p-Laplacian图卷积神经网络的半监督分类方法,包括:步骤1:提取训练数据的特征向量矩阵;步骤2:根据特征向量矩阵,计算其数据的超图p-Laplacian矩阵,然后在其基础上计算样本结构信息矩阵;步骤3:在结构信息矩阵的基础上建立基于超图p-Laplacian的图卷积神经网络模型(HpLapGCN);步骤4:用HpLapGCN模型对训练样本的特征向量矩阵进行卷积操作,得到第一层网络的输出;步骤5:将每一层网络的输出特征向量矩阵作为下一层网络的输入,重复可得到多层的HpLapGCN网络;步骤6:将最后一层网络的输出作为分类器的输入,给出每个训练样本所对应的预测标签以及获得各种不同的实验参数;步骤7:将训练数据中所学习到网络模型在验证数据集进行训练,得到最优参数的网络模型;(8)将最优参数的网络模型对测试样本进行多层卷积操作,然后把最后一层网络输出的特征向量矩阵送到分类器进行分类,得到数据的预测标签信息。进一步的,所述步骤2中,首先计算数据的p-Laplacian矩阵Lp,然后在其基础上计算超图p-Laplacian矩阵HLp;在超图p-Laplacian矩阵HLp的基础上构造样本的局部结构信息矩阵其中,λmax表示HLp矩阵特征分解的最大特征值。进一步的,所述步骤3中,HpLapGCN模型为其中,H(L+1)为第L+1层网络输出;σ表示线性激活函数;表示样本的结构信息;H(L)为第L层的网络输出;W(L)为第L层的权重。进一步的,所述步骤4中,首先,利用Xavier方法初始化第一层网络权重W1;然后,进行第一层卷积操作其中,RELU是线性激活函数,是一种人工神经网络中常用的激活函数,f(x)=max(0,x);其中,H(0)=X表示最初的样本特征向量矩阵,得到第一层网络的输出H(1)。进一步的,所述步骤5具体为:首先,将第一层卷积网络的输出H(1)作为第二层卷积网络输入的样本特征向量矩阵;其次,利用Xavier方法初始化第二层网络权重W2;然后,构造第二层卷积网络公式将第二层网络的输入H(1)与结构信息矩阵进行融合,得到第二层网络的输出。进一步的,所述步骤6具体为:首先,将最后一层卷积网络的输出作为softmax分类器的输入;通过softmax函数将每个样本特征矩阵转换成属于每个类的概率向量矩阵;然后,取概率值最大的作为样本的分类,给出样本的标签信息或者识别率。进一步的,所述步骤7具体为:根据交叉熵损失函数C=-∑kyklogZK通过使其损失值最小来选择最优的网络模型参数;其中yk表示真实的标签信息,ZK表示经过softmax函数输出的概率向量矩阵。进一步的,所述第一层网络权重W1和第二层网络权重W2均满足的均匀分布。为实现有效的半监督分类,本专利技术所述的基于超图p-Laplacian图卷积神经网络的半监督分类方法,包括分别提取训练数据、验证数据、测试数据的特征向量矩阵;对提取特征后的训练数据进行预处理,首先计算其数据的超图p-Laplacian矩阵,然后在其基础上计算样本结构信息矩阵,由于超图p-Laplacian矩阵是超图理论和p-Laplacian矩阵的结合体,因此利用基于超图p-Laplacian矩阵计算的样本结构信息矩阵能够包含比基于LapLacian矩阵的样本结构信息矩阵更加精细的数据局部几何信息;在结构信息矩阵的基础上建立基于超图p-Laplacian的图卷积神经网络模型(HpLapGCN),此模型比GCN模型能够学习到更加丰富的样本特征;用HpLapGCN模型对训练样本的特征向量矩阵进行卷积操作,得到第一层网络的输出;将每一层网络的输出特征向量矩阵作为下一层网络的输入可得到多层的HpLapGCN网络;将最后一层网络的输出作为分类器的输入,给出每个训练样本所对应的预测标签以及获得各种不同的实验参数;将训练数据中所学习到网络模型在验证数据集进行训练,通过不断降低样本的交叉熵损失值,进而选择最好的网络模型参数,提高模型分类效果;将最优实验参数的网络模型对测试样本进行多层卷积操作,然后把最后一层网络输出的特征向量矩阵送到分类器进行分类,得到数据的预测标签信息。与现有技术相比,本专利技术具有以下有益效果:本专利技术通过建立超图p-Laplacian的图卷积神经网络模型(HpLapGCN)的基础上,采用多次卷积操作,在每一层卷积的过程中利用基于超图p-Laplacian的结构信息矩阵,提高模型分类效果。附图说明图1为本专利技术的基于超图p-Laplacian图卷积神经网络的半监督分类方法的结构示意图;图2所示为本专利技术的基于超图p-Laplacian图卷积神经网络的半监督分类方法的流程图;图3所示为本专利技术所采用的第一层卷积网络的流程图;图4所示为本专利技术所采用的第二层卷积网络的流程图;图5所示为本专利技术所采用的分类器层和模型优化参数的流程图;图6所示为本专利技术的采用的二层卷积网络时的算法流程图;图7为本专利技术实施例1和对比例1-4在Citeseer数据库上的实验结果图;图8为本专利技术实施例1和对比例1-4在Cora数据库上的实验结果图。具体实施方式为使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。实施例1一种基于超图p-Laplacian图卷积神经网络的半监督分类方法,如图1-6所示。首先向数据存储设备中输入各种数据信息,既可以是用户输入的数据也可以是网上本文档来自技高网...

【技术保护点】
1.一种基于超图p‑Laplacian图卷积神经网络的半监督分类方法,其特征在于,包括:步骤1:提取训练数据的特征向量矩阵;步骤2:根据特征向量矩阵,计算其数据的超图p‑Laplacian矩阵,然后在其基础上计算样本结构信息矩阵;步骤3:在结构信息矩阵的基础上建立基于超图p‑Laplacian的图卷积神经网络模型(HpLapGCN);步骤4:用HpLapGCN模型对训练样本的特征向量矩阵进行卷积操作,得到第一层网络的输出;步骤5:将每一层网络的输出特征向量矩阵作为下一层网络的输入,重复可得到多层的HpLapGCN网络;步骤6:将最后一层网络的输出作为分类器的输入,给出每个训练样本所对应的预测标签以及获得各种不同的实验参数;步骤7:将训练数据中所学习到网络模型在验证数据集进行训练,得到最优参数的网络模型;步骤8:将最优参数的网络模型对测试样本进行多层卷积操作,然后把最后一层网络输出的特征向量矩阵送到分类器进行分类,得到数据的预测标签信息。

【技术特征摘要】
1.一种基于超图p-Laplacian图卷积神经网络的半监督分类方法,其特征在于,包括:步骤1:提取训练数据的特征向量矩阵;步骤2:根据特征向量矩阵,计算其数据的超图p-Laplacian矩阵,然后在其基础上计算样本结构信息矩阵;步骤3:在结构信息矩阵的基础上建立基于超图p-Laplacian的图卷积神经网络模型(HpLapGCN);步骤4:用HpLapGCN模型对训练样本的特征向量矩阵进行卷积操作,得到第一层网络的输出;步骤5:将每一层网络的输出特征向量矩阵作为下一层网络的输入,重复可得到多层的HpLapGCN网络;步骤6:将最后一层网络的输出作为分类器的输入,给出每个训练样本所对应的预测标签以及获得各种不同的实验参数;步骤7:将训练数据中所学习到网络模型在验证数据集进行训练,得到最优参数的网络模型;步骤8:将最优参数的网络模型对测试样本进行多层卷积操作,然后把最后一层网络输出的特征向量矩阵送到分类器进行分类,得到数据的预测标签信息。2.根据权利要求1所述的基于超图p-Laplacian图卷积神经网络的半监督分类方法,其特征在于,所述步骤2中,首先计算数据的p-Laplacian矩阵Lp,然后在其基础上计算超图p-Laplacian矩阵HLp;在超图p-Laplacian矩阵HLp的基础上构造样本的局部结构信息矩阵其中,λmax表示HLp矩阵特征分解的最大特征值。3.根据权利要求1所述的基于超图p-Laplacian图卷积神经网络的半监督分类方法,其特征在于,所述步骤3中,HpLapGCN模型为其中,H(L+1)为第L+1层网络输出;σ表示线性激活函数;表示样本的结构信息;H(L)为第L层的网络输出;W(L)为第L层的权重。4.根...

【专利技术属性】
技术研发人员:傅司超赵珂文刘伟锋聂礼强
申请(专利权)人:中国石油大学华东山东大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1