模型训练方法及装置、图分类方法及装置制造方法及图纸

技术编号:37211212 阅读:18 留言:0更新日期:2023-04-20 23:01
本公开涉及用于图分类的模型训练方法及装置、图分类方法及装置、电子设备、计算机可存储介质,涉及机器学习领域。用于图分类的模型训练方法包括:利用图分类模型对图进行分类,得到所述图的预测类别;确定所述图的预测类别与所述图的标注类别之间的差异程度,其中,所述差异程度反映所述标注类别属于噪声标签的概率;根据所述差异程度、所述标注类别和所述预测类别,训练所述图分类模型。根据本公开,可以提高模型训练的准确性,进而提高图分类模型的分类准确性。的分类准确性。的分类准确性。

【技术实现步骤摘要】
模型训练方法及装置、图分类方法及装置


[0001]本公开涉及机器学习领域,特别涉及用于图分类的模型训练方法及装置、图分类方法及装置、电子设备、计算机可存储介质。

技术介绍

[0002]图是用于分析对象和实体之间的成对关系的数据结构。图包括节点以及用于连接节点之间的边。图分类是一个基本的图机器学习问题,在社交网络分析、物品类别分析、生化等各个领域均存在广泛应用。
[0003]相关技术中,利用图分类模型对图进行分类,得到图的预测类别,根据图的预测类别和标注类别训练图分类模型。

技术实现思路

[0004]相关技术中,图的标注类别通常是观察到的标签,这些标签存在一些与图的实际类别不相符的情况,从而为图分类模型的训练过程带来噪声,导致模型训练的准确性下降,从而使得图分类模型的分类准确性下降。
[0005]针对上述技术问题,本公开提出了一种解决方案,可以提高模型训练的准确性,进而提高图分类模型的分类准确性。
[0006]根据本公开的第一方面,提供了一种用于图分类的模型训练方法,包括:利用图分类模型对图进行分类,得到所述图的预测类别;确定所述图的预测类别与所述图的标注类别之间的差异程度,其中,所述差异程度反映所述标注类别属于噪声标签的概率;根据所述差异程度、所述标注类别和所述预测类别,训练所述图分类模型。
[0007]在一些实施例中,利用图分类模型对图进行分类包括:对所述图进行子图采样,得到所述图的多张子图;利用所述图分类模型对所述多张子图进行分类,得到第一预测类别和多个第二预测类别,作为所述图的预测类别,其中,所述第一预测类别表征所述图所属的类别,每个第二预测类别表征每张子图所属的类别;确定所述图的预测类别与所述图的标注类别之间的差异程度包括:根据所述第一预测类别和所述多个第二预测类别,确定所述差异程度。
[0008]在一些实施例中,根据所述第一预测类别和所述多个第二预测类别,确定所述差异程度包括:对于所述图,确定所述第一预测类别与所述标注类别之间的差异程度,作为第一差异程度;对于每张子图,确定所述每张子图的第二预测类别与所述标注类别之间的差异程度,作为第二差异程度;根据所述第一差异程度和与每张子图对应的第二差异程度,确定所述图的预测类别与所述图的标注类别之间的差异程度,其中,所述图的预测类别与所述图的标注类别之间的差异程度与所述第一差异程度成正相关且与所述第二差异程度成正相关。
[0009]在一些实施例中,根据所述第一差异程度和与每张子图对应的第二差异程度,确定所述图的预测类别与所述图的标注类别之间的差异程度包括:确定与所述多张子图对应
的多个第二差异程度的平均值;根据所述第一差异程度和所述平均值,确定所述图的预测类别与所述图的标注类别之间的差异程度。
[0010]在一些实施例中,根据所述第一差异程度和所述平均值,确定所述图的预测类别与所述图的标注类别之间的差异程度包括:根据所述第一差异程度与所述平均值的和,确定所述图的预测类别与所述图的标注类别之间的差异程度。
[0011]在一些实施例中,所述图存在多张,每张图对应一个差异程度并对应多张子图,根据所述差异程度、所述标注类别和所述预测类别,训练所述图分类模型包括:
[0012]对于每张图,在所述每张图的差异程度表征所述每张图的标注类别属于噪声标签的情况下,确定所述每张图为负样本;对于每张图,在所述每张图的差异程度表征所述每张图的标注类别不属于噪声标签的情况下,确定所述每张图为正样本;根据与所述负样本对应的多个第二预测类别,对所述负样本的标注类别进行降噪处理,得到所述负样本的降噪标注类别;根据所述负样本的降噪标注类别、所述正样本的标注类别和所述图的预测类别,训练所述图分类模型。
[0013]在一些实施例中,每个第二预测类别包括位于多个预测元素位置的多个预测元素值,所述标注类别包括位于多个标注元素位置的多个标注元素值,每个预测元素位置对应一个标注元素位置,每个元素位置的元素值表征所述图或所述每张子图属于与所述每个元素位置对应的类别的概率,对所述负样本的标注类别进行降噪处理包括:对于所述负样本的标注类别中的每个标注元素位置,根据与所述负样本对应的多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值,更新位于所述每个标注元素位置的标注元素值。
[0014]在一些实施例中,更新位于所述每个标注元素位置的标注元素值包括:对于与所述负样本的标注类别中的每个标注元素位置对应的预测元素位置,根据与所述负样本对应的多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值,确定与所述每个标注元素位置对应的预测元素位置的复合元素值,作为第一复合元素值,其中,所述第一复合元素值表征所述多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值的平均水平;根据所述第一复合元素值,更新位于所述每个标注元素位置的标注元素值。
[0015]在一些实施例中,根据所述第一复合元素值,更新位于所述每个标注元素位置的标注元素值包括:对于除与所述每个标注元素位置对应的预测元素值以外的每个其他预测元素位置,根据所述多个第二预测类别中位于所述每个其他预测元素位置的预测元素值,确定所述每个其他预测元素位置的复合元素值,作为第二复合元素值,其中,所述第二复合元素值表征所述多个第二预测类别中位于与所述每个其他预测元素位置的预测元素值的平均水平;根据所述第一复合元素值和所述第二复合元素值,更新位于所述每个标注元素位置的标注元素值。
[0016]在一些实施例中,对于所述负样本,位于所述每个标注元素位置的更新后的标注元素值与所述第一复合元素值成正相关且与所述第二复合元素值成负相关。
[0017]在一些实施例中,根据所述第一复合元素值和所述第二复合元素值,更新位于所述每个标注元素位置的标注元素值包括:根据所述第一复合元素值和所述第二复合元素值,对所述第一复合元素值进行平滑处理,得到位于所述每个标注元素位置的更新后的标
注元素值。
[0018]在一些实施例中,确定与所述每个标注元素位置对应的预测元素位置的复合元素值,作为第一复合元素值包括:利用第一超参数,对所述多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值进行平滑处理,得到更新后的第一预测元素值;根据所述更新后的第一预测元素值,确定所述第一复合元素值;确定所述每个其他预测元素位置的复合元素值,作为第二复合元素值包括:利用所述第一超参数,对所述多个第二预测类别中位于所述每个其他预测元素位置的预测元素值进行平滑处理,得到更新后的第二预测元素值;根据所述更新后的第二预测元素值,确定所述第二复合元素值;其中,所述第一超参数用于调整所述平滑处理的平滑程度。
[0019]在一些实施例中,所述正样本的标注类别包括多个标注元素值,根据所述负样本的降噪标注类别、所述正样本的标注类别和所述图的预测类别,训练所述图分类模型包括:利用第二超参数,对所述正样本的标注类别中的每个标注元素进行平滑处理,得到所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于图分类的模型训练方法,包括:利用图分类模型对图进行分类,得到所述图的预测类别;确定所述图的预测类别与所述图的标注类别之间的差异程度,其中,所述差异程度反映所述标注类别属于噪声标签的概率;根据所述差异程度、所述标注类别和所述预测类别,训练所述图分类模型。2.根据权利要求1所述的模型训练方法,其中,利用图分类模型对图进行分类包括:对所述图进行子图采样,得到所述图的多张子图;利用所述图分类模型对所述多张子图进行分类,得到第一预测类别和多个第二预测类别,作为所述图的预测类别,其中,所述第一预测类别表征所述图所属的类别,每个第二预测类别表征每张子图所属的类别;确定所述图的预测类别与所述图的标注类别之间的差异程度包括:根据所述第一预测类别和所述多个第二预测类别,确定所述差异程度。3.根据权利要求2所述的模型训练方法,其中,根据所述第一预测类别和所述多个第二预测类别,确定所述差异程度包括:对于所述图,确定所述第一预测类别与所述标注类别之间的差异程度,作为第一差异程度;对于每张子图,确定所述每张子图的第二预测类别与所述标注类别之间的差异程度,作为第二差异程度;根据所述第一差异程度和与每张子图对应的第二差异程度,确定所述图的预测类别与所述图的标注类别之间的差异程度,其中,所述图的预测类别与所述图的标注类别之间的差异程度与所述第一差异程度成正相关且与所述第二差异程度成正相关。4.根据权利要求3所述的模型训练方法,其中,根据所述第一差异程度和与每张子图对应的第二差异程度,确定所述图的预测类别与所述图的标注类别之间的差异程度包括:确定与所述多张子图对应的多个第二差异程度的平均值;根据所述第一差异程度和所述平均值,确定所述图的预测类别与所述图的标注类别之间的差异程度。5.根据权利要求4所述的模型训练方法,其中,根据所述第一差异程度和所述平均值,确定所述图的预测类别与所述图的标注类别之间的差异程度包括:根据所述第一差异程度与所述平均值的和,确定所述图的预测类别与所述图的标注类别之间的差异程度。6.根据权利要求2所述的模型训练方法,其中,所述图存在多张,每张图对应一个差异程度并对应多张子图,根据所述差异程度、所述标注类别和所述预测类别,训练所述图分类模型包括:对于每张图,在所述每张图的差异程度表征所述每张图的标注类别属于噪声标签的情况下,确定所述每张图为负样本;对于每张图,在所述每张图的差异程度表征所述每张图的标注类别不属于噪声标签的情况下,确定所述每张图为正样本;根据与所述负样本对应的多个第二预测类别,对所述负样本的标注类别进行降噪处
理,得到所述负样本的降噪标注类别;根据所述负样本的降噪标注类别、所述正样本的标注类别和所述图的预测类别,训练所述图分类模型。7.根据权利要求6所述的模型训练方法,其中,每个第二预测类别包括位于多个预测元素位置的多个预测元素值,所述标注类别包括位于多个标注元素位置的多个标注元素值,每个预测元素位置对应一个标注元素位置,每个元素位置的元素值表征所述图或所述每张子图属于与所述每个元素位置对应的类别的概率,对所述负样本的标注类别进行降噪处理包括:对于所述负样本的标注类别中的每个标注元素位置,根据与所述负样本对应的多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值,更新位于所述每个标注元素位置的标注元素值。8.根据权利要求7所述的模型训练方法,其中,更新位于所述每个标注元素位置的标注元素值包括:对于与所述负样本的标注类别中的每个标注元素位置对应的预测元素位置,根据与所述负样本对应的多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值,确定与所述每个标注元素位置对应的预测元素位置的复合元素值,作为第一复合元素值,其中,所述第一复合元素值表征所述多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值的平均水平;根据所述第一复合元素值,更新位于所述每个标注元素位置的标注元素值。9.根据权利要求8所述的模型训练方法,其中,根据所述第一复合元素值,更新位于所述每个标注元素位置的标注元素值包括:对于除与所述每个标注元素位置对应的预测元素值以外的每个其他预测元素位置,根据所述多个第二预测类别中位于所述每个其他预测元素位置的预测元素值,确定所述每个其他预测元素位置的复合元素值,作为第二复合元素值,其中,所述第二复合元素值表征所述多个第二预测类别中位于与所述每个其他预测元素位置的预测元素值的平均水平;根据所述第一复合元素值和所述第二复合元素值,更新位于所述每个标注元素位置的标注元素值。10.根据权利要求9所述的模型训练方法,其中,对于所述负样本,位于所述每个标注元素位置的更新后的标注元素值与所述第一复合元素值成正相关且与所述第二复合元素值成负相关。11.根据权利要求9所述的模型训练方法,其中,根据所述第一复合元素值和所述第二复合元素值,更新位于所述每个标注元素位置的标注元素值包括:根据所述第一复合元素值和所述第二复合元素值,对所述第一复合元素值进行平滑处理,得到位于所述每个标注元素位置的更新后的标注元素值。12.根据权利要求11所述的模型训练方法,其中,确定与所述每个标注元素位置对应的预测元素位置的复合元素值,作为第一复合元素值包括:利用第一超参数,对所述多个第二预测类别中位于与所述每个标注元素位置对应的预测元素位置的预测元素值进行平滑处理,得到更新后的第一预测元素值;
根据所述更新后的第一预测元素值,确定所述第一复合元素值;确定所述每个其他预测元素位置的复合元素值,作为第二复合元素值包括:利用所述第一超参数,对所述多...

【专利技术属性】
技术研发人员:沈力尹楠
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1