一种分类模型训练方法、装置、设备及介质制造方法及图纸

技术编号:29676157 阅读:13 留言:0更新日期:2021-08-13 21:58
本申请公开了一种分类模型训练方法、装置、设备及介质,包括:基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵;其中,顶点标签矩阵包括图数据集每个顶点的标签信息;将顶点特征矩阵、邻接矩阵以及顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练,并在训练过程中确定出相应的有监督训练损失;将顶点特征矩阵、邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练,并在训练过程中确定出相应的无监督训练损失;基于有监督训练损失以及无监督训练损失确定目标训练损失;当目标训练损失收敛,则输出当前的分类模型,得到训练后分类模型。这样,能够提升分类模型的分类准确度。

【技术实现步骤摘要】
一种分类模型训练方法、装置、设备及介质
本申请涉及分类器
,特别涉及一种分类模型训练方法、装置、设备及介质。
技术介绍
随着云计算、物联网、移动通信和智能终端等信息技术的快速发展,以社交网络、社区和博客为代表的新型应用得到广泛使用。这些应用不断产生大量数据,方便用图来建模分析。其中,顶点表示个人或团体,连接边表示他们之间的联系;顶点上通常附有标签信息,用以表示所建模对象的年龄、性别、位置、兴趣爱好和宗教信仰,以及其他许多可能的特征。这些特征从各个方面反映了个人的行为偏好,理想情况下,每个社交网络用户都附有所有与自己特征相关的标签。但现实情况却并非如此。这是因为,用户出于保护个人隐私的目的,越来越多的社交网络用户在分享个人信息时,显得更加谨慎,导致社交网络媒体仅能搜集用户的部分信息。因此,如何根据已知用户的标签信息,推测剩余用户的标签,显得尤为重要和迫切。该问题即顶点分类问题。目前,通过图神经网络解决顶点分类问题已成为研究热点。图神经网络通常由输入层、一个或多个隐藏层,以及输出层组成。例如,参见图1所示,图1为现有技术中的一种图神经网络结构图,图1展示了一种典型的图卷积神经网络的结构,它由一个输入层(Inputlayer)、两个图卷积层(Gconvlayer),和一个输出层(Outputlayer)组成。其中,输入层读取n*d维的顶点特征矩阵,图卷积层对顶点特征矩阵进行特征提取,经由非线性激活函数如ReLu变换后传递给下一个图卷积层,最后,输出层即任务层,完成特定的任务如顶点分类、聚类等,图1中展示的是一个顶点分类任务层,输出每个顶点的类别标签。当前,如何提高分类准确度是需要解决的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种分类模型训练方法、装置、设备及介质,能够提升分类模型的分类准确度。其具体方案如下:第一方面,本申请公开了一种分类模型训练方法,包括:基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵;其中,所述顶点标签矩阵包括所述图数据集每个顶点的标签信息;将所述顶点特征矩阵、所述邻接矩阵以及所述顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练,并在训练过程中确定出相应的有监督训练损失;将所述顶点特征矩阵、所述邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练,并在训练过程中确定出相应的无监督训练损失;基于所述有监督训练损失以及所述无监督训练损失确定目标训练损失;当所述目标训练损失收敛,则输出当前的分类模型,得到训练后分类模型。可选的,所述在训练过程中确定出相应的有监督训练损失,包括:在训练过程中,基于Teacher图小波神经网络的第一顶点标签预测结果与所述顶点标签矩阵确定出相应的有监督训练损失;相应的,所述在训练过程中确定出相应的无监督训练损失,包括:在训练过程中,基于Student图小波神经网络的第二顶点标签预测结果与所述第一顶点标签预测结果确定出相应的无监督训练损失。可选的,还包括:在训练过程中,利用所述第一顶点标签预测结果更新所述顶点标签矩阵;当所述目标训练损失收敛,则输出当前的顶点标签矩阵,得到每个无类别标签的顶点的类别预测结果。可选的,所述方法还包括:利用切比雪夫多项式计算所述图数据集的图小波变换基,以及图小波逆变换基;相应的,Teacher图小波神经网络以及Student图小波神经网络在训练过程中基于所述图小波变换基和图小波逆变换基进行图卷积操作。可选的,所述方法还包括:获取所述图小波变换基的计算公式;其中,所述计算公式为基于谱理论定义的公式。可选的,Teacher图小波神经网络以及Student图小波神经网络均包括输入层,若干图卷积层,以及输出层;其中,所述图卷积层用于在训练过程中对该层的输入数据依次进行特征变换以及图卷积操作处理。可选的,所述方法还包括:在训练过程中,基于注意力机制利用所述Teacher图小波神经网络训练得到的图卷积层的卷积核确定所述Student图小波神经网络中对应的图卷积层的卷积核。第二方面,本申请公开了一种分类模型训练装置,包括:训练数据构建模块,用于基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵;其中,所述顶点标签矩阵包括所述图数据集每个顶点的标签信息;分类模型训练模块,用于将所述顶点特征矩阵、所述邻接矩阵以及所述顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练,并在训练过程中确定出相应的有监督训练损失;将所述顶点特征矩阵、所述邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练,并在训练过程中确定出相应的无监督训练损失;基于所述有监督训练损失以及所述无监督训练损失确定目标训练损失;当所述目标训练损失收敛,则输出当前的分类模型,得到训练后分类模型。第三方面,本申请公开了一种电子设备,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序,以实现前述的分类模型训练方法。第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的分类模型训练方法。可见,本申请先基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵;其中,所述顶点标签矩阵包括所述图数据集每个顶点的标签信息,之后将所述顶点特征矩阵、所述邻接矩阵以及所述顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练,并在训练过程中确定出相应的有监督训练损失;将所述顶点特征矩阵、所述邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练,并在训练过程中确定出相应的无监督训练损失;基于所述有监督训练损失以及所述无监督训练损失确定目标训练损失;当所述目标训练损失收敛,则输出当前的分类模型,得到训练后分类模型。这样,将图数据集的顶点特征矩阵、邻接矩阵输入图神经网络进行训练,利用了图拓扑结构和顶点特征,在训练的时候,利用了有监督训练和无监督训练,充分发挥有监督训练和无监督训练各自的优势,能够提升分类模型的分类准确度。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为现有技术中的一种图神经网络结构图;图2为本申请公开的一种分类模型训练方法流程图;图3为本申请公开的一种具体的分类模型训练方法流程图;图4为本申请公开的一种分类模型结构图;图5为本申请公开的一种具体的分类模型结构图;图6为本申请公开的一种具体的分类模型训练方法流程图;图7为本申请公开的一种分类模型训练装置结构示意图;图8为本申请公开的一种电本文档来自技高网
...

【技术保护点】
1.一种分类模型训练方法,其特征在于,包括:/n基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵;其中,所述顶点标签矩阵包括所述图数据集每个顶点的标签信息;/n将所述顶点特征矩阵、所述邻接矩阵以及所述顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练,并在训练过程中确定出相应的有监督训练损失;/n将所述顶点特征矩阵、所述邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练,并在训练过程中确定出相应的无监督训练损失;/n基于所述有监督训练损失以及所述无监督训练损失确定目标训练损失;/n当所述目标训练损失收敛,则输出当前的分类模型,得到训练后分类模型;/n其中,Teacher图小波神经网络以及Student图小波神经网络均包括输入层,若干图卷积层,以及输出层;/n并且,所述方法还包括:在训练过程中,基于注意力机制利用所述Teacher图小波神经网络训练得到的图卷积层的卷积核确定所述Student图小波神经网络中对应的图卷积层的卷积核。/n

【技术特征摘要】
1.一种分类模型训练方法,其特征在于,包括:
基于图数据集构建顶点特征矩阵、邻接矩阵以及顶点标签矩阵;其中,所述顶点标签矩阵包括所述图数据集每个顶点的标签信息;
将所述顶点特征矩阵、所述邻接矩阵以及所述顶点标签矩阵输入至分类模型中的Teacher图小波神经网络进行有监督训练,并在训练过程中确定出相应的有监督训练损失;
将所述顶点特征矩阵、所述邻接矩阵输入至分类模型中的Student图小波神经网络进行无监督训练,并在训练过程中确定出相应的无监督训练损失;
基于所述有监督训练损失以及所述无监督训练损失确定目标训练损失;
当所述目标训练损失收敛,则输出当前的分类模型,得到训练后分类模型;
其中,Teacher图小波神经网络以及Student图小波神经网络均包括输入层,若干图卷积层,以及输出层;
并且,所述方法还包括:在训练过程中,基于注意力机制利用所述Teacher图小波神经网络训练得到的图卷积层的卷积核确定所述Student图小波神经网络中对应的图卷积层的卷积核。


2.根据权利要求1所述的分类模型训练方法,其特征在于,所述在训练过程中确定出相应的有监督训练损失,包括:
在训练过程中,基于Teacher图小波神经网络的第一顶点标签预测结果与所述顶点标签矩阵确定出相应的有监督训练损失;
相应的,所述在训练过程中确定出相应的无监督训练损失,包括:
在训练过程中,基于Student图小波神经网络的第二顶点标签预测结果与所述第一顶点标签预测结果确定出相应的无监督训练损失。


3.根据权利要求2所述的分类模型训练方法,其特征在于,还包括:
在训练过程中,利用所述第一顶点标签预测结果更新所述顶点标签矩阵;
当所述目标训练损失收敛,则输出当前的顶点标签矩阵,得到每个无类别标签的顶点的类别预测结果。


4.根据权利要求1所述的分类模型训练方法,其特征在于,还包括:
利用切比雪夫多项式计算所述图数据集的图小波变换基,以及图小波逆变换基;
相应的,Teacher图小波神经网络以及Student图小波神经网络在训练过程中基于所述图小波变换基和图小波逆变换基进行图卷积操作。


5.根据权利要...

【专利技术属性】
技术研发人员:胡克坤董刚赵雅倩刘海威徐哲
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1