一种分类模型训练方法、装置、设备及介质制造方法及图纸

技术编号：29676157 阅读：13 留言：0更新日期：2021-08-13 21:58

本申请公开了一种分类模型训练方法、装置、设备及介质，包括：基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵；其中，顶点标签矩阵包括图数据集每个顶点的标签信息；将顶点特征矩阵、邻接矩阵以及顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练，并在训练过程中确定出相应的有监督训练损失；将顶点特征矩阵、邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练，并在训练过程中确定出相应的无监督训练损失；基于有监督训练损失以及无监督训练损失确定目标训练损失；当目标训练损失收敛，则输出当前的分类模型，得到训练后分类模型。这样，能够提升分类模型的分类准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种分类模型训练方法、装置、设备及介质
本申请涉及分类器
，特别涉及一种分类模型训练方法、装置、设备及介质。
技术介绍
随着云计算、物联网、移动通信和智能终端等信息技术的快速发展，以社交网络、社区和博客为代表的新型应用得到广泛使用。这些应用不断产生大量数据，方便用图来建模分析。其中，顶点表示个人或团体，连接边表示他们之间的联系；顶点上通常附有标签信息，用以表示所建模对象的年龄、性别、位置、兴趣爱好和宗教信仰，以及其他许多可能的特征。这些特征从各个方面反映了个人的行为偏好，理想情况下，每个社交网络用户都附有所有与自己特征相关的标签。但现实情况却并非如此。这是因为，用户出于保护个人隐私的目的，越来越多的社交网络用户在分享个人信息时，显得更加谨慎，导致社交网络媒体仅能搜集用户的部分信息。因此，如何根据已知用户的标签信息，推测剩余用户的标签，显得尤为重要和迫切。该问题即顶点分类问题。目前，通过图神经网络解决顶点分类问题已成为研究热点。图神经网络通常由输入层、一个或多个隐藏层，以及输出层组成。例如，参见图1所示，图1为现有技术中的一种图神经网络结构图，图1展示了一种典型的图卷积神经网络的结构，它由一个输入层(Inputlayer)、两个图卷积层(Gconvlayer)，和一个输出层(Outputlayer)组成。其中，输入层读取n*d维的顶点特征矩阵，图卷积层对顶点特征矩阵进行特征提取，经由非线性激活函数如ReLu变换后传递给下一个图卷积层，最后，输出层即任务层，完成特定的任务如顶点分类、聚类等，图1中展示的是一...

【技术保护点】
1.一种分类模型训练方法，其特征在于，包括：/n基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵；其中，所述顶点标签矩阵包括所述图数据集每个顶点的标签信息；/n将所述顶点特征矩阵、所述邻接矩阵以及所述顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练，并在训练过程中确定出相应的有监督训练损失；/n将所述顶点特征矩阵、所述邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练，并在训练过程中确定出相应的无监督训练损失；/n基于所述有监督训练损失以及所述无监督训练损失确定目标训练损失；/n当所述目标训练损失收敛，则输出当前的分类模型，得到训练后分类模型；/n其中，Teacher图小波神经网络以及Student图小波神经网络均包括输入层，若干图卷积层，以及输出层；/n并且，所述方法还包括：在训练过程中，基于注意力机制利用所述Teacher图小波神经网络训练得到的图卷积层的卷积核确定所述Student图小波神经网络中对应的图卷积层的卷积核。/n

【技术特征摘要】
1.一种分类模型训练方法，其特征在于，包括：
基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵；其中，所述顶点标签矩阵包括所述图数据集每个顶点的标签信息；
将所述顶点特征矩阵、所述邻接矩阵以及所述顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练，并在训练过程中确定出相应的有监督训练损失；
将所述顶点特征矩阵、所述邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练，并在训练过程中确定出相应的无监督训练损失；
基于所述有监督训练损失以及所述无监督训练损失确定目标训练损失；
当所述目标训练损失收敛，则输出当前的分类模型，得到训练后分类模型；
其中，Teacher图小波神经网络以及Student图小波神经网络均包括输入层，若干图卷积层，以及输出层；
并且，所述方法还包括：在训练过程中，基于注意力机制利用所述Teacher图小波神经网络训练得到的图卷积层的卷积核确定所述Student图小波神经网络中对应的图卷积层的卷积核。

2.根据权利要求1所述的分类模型训练方法，其特征在于，所述在训练过程中确定出相应的有监督训练损失，包括：
在训练过程中，基于Teacher图小波神经网络的第一顶点标签预测结果与所述顶点标签矩阵确定出相应的有监督训练损失；
相应的，所述在训练过程中确定出相应的无监督训练损失，包括：
在训练过程中，基于Student图小波神经网络的第二顶点标签预测结果与所述第一顶点标签预测结果确定出相应的无监督训练损失。

3.根据权利要求2所述的分类模型训练方法，其特征在于，还包括：
在训练过程中，利用所述第一顶点标签预测结果更新所述顶点标签矩阵；
当所述目标训练损失收敛，则输出当前的顶点标签矩阵，得到每个无类别标签的顶点的类别预测结果。

4.根据权利要求1所述的分类模型训练方法，其特征在于，还包括：
利用切比雪夫多项式计算所述图数据集的图小波变换基，以及图小波逆变换基；
相应的，Teacher图小波神经网络以及Student图小波神经网络在训练过程中基于所述图小波变换基和图小波逆变换基进行图卷积操作。

5.根据权利要...

【专利技术属性】
技术研发人员：胡克坤，董刚，赵雅倩，刘海威，徐哲，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人