半监督分类模型训练、图像分类方法和装置制造方法及图纸

技术编号:37152860 阅读:32 留言:0更新日期:2023-04-06 22:10
本公开提供了一种半监督分类模型训练方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:对获取的素材样本进行序列化处理,得到素材序列;对素材序列进行随机掩码处理,得到包括整体语义特征的掩码序列;将素材序列和掩码序列输入预先构建的半监督分类网络的掩码预测网络中,计算得到掩码预测网络的掩码预测损失;将带目标标签且经过掩码预测网络预测的整体语义特征输入半监督分类网络的线性分类网络,计算得到线性分类网络的监督损失;基于掩码预测损失和监督损失,训练半监督分类网络,得到对应半监督分类网络的半监督分类模型。该实施方式提高了半监督分类模型的分类性能。的分类性能。的分类性能。

【技术实现步骤摘要】
半监督分类模型训练、图像分类方法和装置


[0001]本公开涉及计算机
,具体涉及人工智能
,尤其涉及半监督分类模型训练方法和装置、图像分类方法和装置、电子设备、计算机可读介质。

技术介绍

[0002]深度神经网络已经被应用于图像分类、目标检测与跟踪、语义分割、情感分析、机器翻译、语音辨识等等各个领域,成为了现代人工智能中最重要的方法之一。深度神经网络的训练需要大量的高质量标注样本,然而,高质量标注样本的获得却非常困难,数据标注的时间和经济成本都非常高。在移动互联网得到广泛应用的今天,如何将互联网上海量的无标注样本运用起来,使得的模型可以在少量标椎样本的监督和大量无标注样本的帮助下获得较高的精度,即进行半监督学习,就变成了一个非常重要的问题。

技术实现思路

[0003]本公开的实施例提出了半监督分类模型训练方法和装置、图像分类方法和装置、电子设备、计算机可读介质。
[0004]第一方面,本公开的实施例提供了一种半监督分类模型训练方法,该方法包括:对获取的素材样本进行序列化处理,得到素材序列;对素材序列进行随机掩本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种半监督分类模型训练方法,所述方法包括:对获取的素材样本进行序列化处理,得到素材序列;对所述素材序列进行随机掩码处理,得到包括整体语义特征的掩码序列;将所述素材序列和所述掩码序列输入预先构建的半监督分类网络的掩码预测网络中,计算得到所述掩码预测网络的掩码预测损失;将带目标标签且经过所述掩码预测网络预测的整体语义特征输入所述半监督分类网络的线性分类网络,计算得到所述线性分类网络的监督损失;基于所述掩码预测损失和所述监督损失,训练所述半监督分类网络,得到对应所述半监督分类网络的半监督分类模型。2.根据权利要求1所述的方法,其中,所述掩码预测网络包括:掩码分词器、掩码分类器以及训练完成的素材分词器、素材编码字典;所述将所述素材序列和所述掩码序列输入预先构建的半监督分类网络的掩码预测网络中,计算得到所述掩码预测网络的掩码预测损失包括:将所述素材序列输入所述素材分词器,得到素材块编码;从所述素材编码字典中选取与所述素材块编码相匹配的素材向量,得到素材向量序列;将所述掩码序列输入所述掩码分词器,得到预测块编码;将所述预测块编码输入所述掩码分类器,以使所述掩码分类器从所述素材编码字典选取与所述预测块编码相匹配的预测向量,得到预测向量序列;基于所述素材向量序列和所述预测向量序列,计算得到所述掩码预测网络的掩码预测损失。3.根据权利要求2所述的方法,所述素材分词器和所述素材编码字典的训练过程如下:对获取的样本素材进行序列化处理,得到样本序列;将所述样本序列输入素材分词网络,得到样本特征序列,从样本编码字典选取与所述样本特征序列相对应的样本编码序列,并对所述样本编码序列进行解码,得到预测序列;将所述样本序列输入预训练的样本监督模型,得到监督序列;基于所述预测序列和所述监督序列,训练所述素材分词网络以及所述素材编码字典;响应于所述素材分词网络满足训练完成条件,得到素材分词器。4.根据权利要求1所述的方法,所述将带目标标签且经过所述掩码预测网络预测的整体语义特征输入所述半监督分类网络的线性分类网络,计算得到所述线性分类网络的监督损失包括:将带目标标签且经过所述掩码预测网络预测的整体语义特征输入所述半监督分类网络的线性分类网络,得到所述线性分类网络输出的分类结果;基于所述分类结果和所述目标标签,计算得到所述线性分类网络的监督损失。5.根据权利要求1
‑<...

【专利技术属性】
技术研发人员:王家兴李勇宫礼星陶通刘朋樟包勇军颜伟鹏
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1