一种半监督节点分类方法、系统、计算机设备和存储介质技术方案

技术编号:27744355 阅读:39 留言:0更新日期:2021-03-19 13:38
本发明专利技术提供了一种半监督节点分类方法、系统、计算机设备和存储介质,所述方法包括获取半监督分类数据集;根据所述半监督分类数据集构建数据图网络;根据所述数据图网络建立多规模邻域池化的高阶图卷积网络模型;根据所述半监督分类数据集对所述多规模邻域池化的高阶图卷积网络模型进行半监督节点分类训练,得到分类结果。本发明专利技术实施例在半监督节点分类时,既能同时捕捉不同阶邻域节点间的相互关系,并将其混合保留更多更丰富的特征信息,进而扩宽感受野和提高模型的表达能力,又通过设置不同阶图卷积间权重共享及选用较少隐藏神经元数目,减少了模型的计算复杂度和参数量,进而提高了模型的分类效率和分类精度。

【技术实现步骤摘要】
一种半监督节点分类方法、系统、计算机设备和存储介质
本专利技术涉及数据信息处理
,特别是涉及一种基于多规模邻域池化的高阶图卷积网络的半监督节点分类方法、系统、计算机设备和存储介质。
技术介绍
现有的数据分类方法通常分为全监督分类、半监督分类和无监督分类三种,其中全监督分类要求数据全部标记应用场景受限,无监督分类虽然对数据标记无要求但其分类效果不好,因此,对数据的标记要求低和分类效果好的半监督分类得到了应用广泛。随后,由于深度机器学习技术的不断提升,半监督分类的方法也逐渐得到改进,基于图的半监督数据分类方法因其能够很好利用数据样本之间关系提升分类效果而备受关注,比如学者们通过堆叠两层的一阶图卷积或者构建多层的图卷积网络模型去学习图的表示。然而,经典的基于图卷积网络(GCNs)的半监督分类要么因其对数据的特征表达不够准确,不能很好地反映分类数据的实际情况而导致分类精度较低,要么由于模型复杂、参数过多造成分类效率太低,要么浅层模型机制了模型的感受野和表达能力。因此,研究如何在提升基于图卷积网络的半监督分类中数据特征表达正确性的同时,有效本文档来自技高网...

【技术保护点】
1.一种半监督节点分类方法,其特征在于,所述方法包括以下步骤:/n获取半监督分类数据集;所述半监督分类数据集包括文章、特征词和分类标签;/n根据所述半监督分类数据集构建数据图网络;/n根据所述数据图网络建立多规模邻域池化的高阶图卷积网络模型;所述多规模邻域池化的高阶图卷积网络模型依次包括输入层、高阶图卷积层、信息融合层、一阶图卷积层和输出层;/n根据所述半监督分类数据集对所述多规模邻域池化的高阶图卷积网络模型进行半监督节点分类训练,得到分类结果。/n

【技术特征摘要】
1.一种半监督节点分类方法,其特征在于,所述方法包括以下步骤:
获取半监督分类数据集;所述半监督分类数据集包括文章、特征词和分类标签;
根据所述半监督分类数据集构建数据图网络;
根据所述数据图网络建立多规模邻域池化的高阶图卷积网络模型;所述多规模邻域池化的高阶图卷积网络模型依次包括输入层、高阶图卷积层、信息融合层、一阶图卷积层和输出层;
根据所述半监督分类数据集对所述多规模邻域池化的高阶图卷积网络模型进行半监督节点分类训练,得到分类结果。


2.如权利要求1所述的半监督节点分类方法,其特征在于,所述高阶图卷积包括基于权重共享的一阶图卷积到p阶图卷积。


3.如权利要求2所述的半监督节点分类方法,其特征在于,所述高阶图卷积层、信息融合层和一阶图卷积层均为1个,多规模邻域池化的高阶图卷积网络模型的输出为YHCNP,则:



其中X是图的输入矩阵,w1和w2分别是输入层到隐藏层之间的参数矩阵和隐藏层到输出层之间的参数矩阵,是图的含自连接的正则化邻接矩阵,p是图卷积的最高阶数,σ(·)为激活函数,MNPooling(·)为信息融合层,softmax(·)为多分类输出函数。


4.如权利要求3所述的半监督节点分类方法,其特征在于,所述激活函数可以为ReLU(·)非线性激活函数。


5.如权利要求3所述的半监督节点分类方法,其特征在于,所述信息融合层包括最大值信息融合层MNPoolingmax、均值信息融合层MNPoolingavg和累计信息融合层MNPoolingsum,三种信息融合层计算公式分别为:









其中,为图卷积阶数,i表示第i个隐藏层,H(i)为隐藏特征矩阵,W(i)为参数矩阵,为正则化邻接矩阵。


6.如权利要求1所述的半监督节点分类方法,其特征在于,所述根据所述半监督分类数据集构建数据图网络的步骤包括:
根据所述半监督分类数据集中的文章...

【专利技术属性】
技术研发人员:刘勋宗建华夏国清李敏弟梁智强陈晓霖
申请(专利权)人:广州大学华软软件学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1