【技术实现步骤摘要】
一种半监督学习模型的训练方法、图像处理方法及设备
本申请涉及机器学习领域,尤其涉及一种半监督学习模型的训练方法、图像处理方法及设备。
技术介绍
传统的机器学习任务分为无监督学习(数据无标签,如聚类、异常检测等)和监督学习(数据有标签,如分类、回归等),而半监督学习(semi-supervisedlearning,SSL)是模式识别和机器学习领域研究的重点问题,属于监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的无标签数据和一部分有标签数据来进行模式识别工作。现实场景中数据的标签获取往往是十分昂贵的,然而现有的半监督学习模型对有标签数据的数量有一定要求,当有标签数据达到一定数量,半监督学习模型的泛化能力才能明显增强,并且半监督学习模型的预测准确率仍然有较大的提升空间。基于此,利用少量有标签数据训练得到一种更高预测准确率的半监督学习模型的方法亟待推出。
技术实现思路
本申请实施例提供了一种半监督学习模型的训练方法、图像处理方法及设备,用于在当前训练阶段,通过训练后的第一半监督学习模型预测 ...
【技术保护点】
1.一种半监督学习模型的训练方法,其特征在于,包括:/n从第一无标签样本集选取初始子集,并通过训练后的第一半监督学习模型对所述初始子集进行预测,得到第一预测标签集,所述第一半监督学习模型由初始半监督学习模型通过初始训练集训练得到,所述初始训练集包括第一有标签样本集和所述第一无标签样本集;/n根据所述第一预测标签集将所述初始子集分为第一子集和第二子集,所述第一子集为预测正确的分类类别对应的样本集合,所述第二子集为预测错误的分类类别对应的样本集合;/n构建第一训练集,所述第一训练集包括第二有标签样本集、第二无标签样本集和负标签样本集,所述第二有标签样本集为包括所述第一有标签样本 ...
【技术特征摘要】
1.一种半监督学习模型的训练方法,其特征在于,包括:
从第一无标签样本集选取初始子集,并通过训练后的第一半监督学习模型对所述初始子集进行预测,得到第一预测标签集,所述第一半监督学习模型由初始半监督学习模型通过初始训练集训练得到,所述初始训练集包括第一有标签样本集和所述第一无标签样本集;
根据所述第一预测标签集将所述初始子集分为第一子集和第二子集,所述第一子集为预测正确的分类类别对应的样本集合,所述第二子集为预测错误的分类类别对应的样本集合;
构建第一训练集,所述第一训练集包括第二有标签样本集、第二无标签样本集和负标签样本集,所述第二有标签样本集为包括所述第一有标签样本集和所述第一子集的具有正确分类类别的样本集合,所述第二无标签样本集为所述第一无标签样本集中除所述初始子集之外的无标签样本的集合,所述负标签样本集为包括所述第二子集的具有错误分类类别的样本集合;
根据所述第一训练集训练所述初始半监督学习模型,得到训练后的第二半监督学习模型。
2.根据权利要求1所述的方法,其特征在于,所述初始半监督学习模型包括如下模型中的任意一种:
Π-model、VAT、LPDSSL、TNAR、pseudo-label、DCT、meanteacher模型。
3.根据权利要求2所述的方法,其特征在于,所述初始半监督学习模型为Π-model、VAT、LPDSSL、TNAR、pseudo-label、DCT中的任意一种,则所述根据所述第一训练集训练所述初始半监督学习模型,得到训练后的第二半监督学习模型包括:
根据所述第二有标签样本集和所述第二无标签样本集,利用第一损失函数对所述初始半监督学习模型进行训练,所述第一损失函数为所述初始半监督学习模型原有的损失函数;
根据所述负标签样本集,利用第二损失函数对所述初始半监督学习模型进行训练,所述第二损失函数为模型输出的预测值与修改值之间的差值,所述修改值为将预测错误的分类类别在所述预测值上的对应维度置为零的值。
4.根据权利要求2所述的方法,其特征在于,所述初始半监督学习模型为meanteacher模型,则所述根据所述第一训练集训练所述初始半监督学习模型,得到训练后的第二半监督学习模型包括:
根据所述第二有标签样本集,利用第三损失函数对所述meanteacher模型进行训练;
根据所述第二有标签样本集和所述第二无标签样本集,利用第四损失函数对所述meanteacher模型进行训练,所述第三损失函数和所述第四损失函数为所述meanteacher模型原有的损失函数;
根据所述负标签样本集,利用第五损失函数对所述meanteacher模型进行训练,所述第五损失函数为模型输出的预测值与修改值之间的差值,所述修改值为将预测错误的分类类别在所述预测值上的对应维度置为零的值。
5.根据权利要求4所述的方法,其特征在于,
所述第三损失函数为交叉熵损失函数;
和/或,
所述第四损失函数为均方误差损失函数。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述方法还包括:
将所述第二无标签样本集作为新的第一无标签样本集、所述第二半监督学习模型作为新的第一半监督学习模型,重复执行上述步骤,直至所述第二无标签样本集为空。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述在根据所述第一训练集训练所述初始半监督学习模型,得到训练后的第二半监督学习模型之后,所述方法还包括:
将所述训练后的第二半监督学习模型部署在目标设备上,所述目标设备用于获取目标图像,所述训练后的第二半监督学习模型用于对所述目标图像进行标签预测。
8.根据权利要求1-7中任一项所述的方法,其特征在于,所述从第一无标签样本集选取初始子集包括:
从所述第一无标签样本集随机选取预设数量的无标签样本构成所述初始子集。
9.一种图像处理方法,其特征在于,包括:
获取目标图像;
将所述目标图像作为训练后的半监督学习模型的输入,输出对所述目标图像的预测结果,所述训练后的半监督学习模型为权利要求1-8中任一项所述方法中的第二半监督学习模型。
10.一种训练设备,其特征在于,包括:
选取模块,用于从第一无标签样本集选取初始子集,并通过训练后的第一半监督学习模型对所述初始子集进行预测,得到第一预测标签集,所述第一半监督学习模型由初始半监督学习模型通过初始训练集训练得到,所述初始训练集包括第一有标签样本集和所述第一无标签样本集;
猜测模块,用于根据所述第一预测标签集将所述初始子集分为第一子集和第二子集,所述第一子集为预测正确的分类类别对应的样本集合,所述第二子集为预测错误的分类类别对应的样本集合;
构建模块,用于构建...
【专利技术属性】
技术研发人员:杜泽伟,胡恒通,谢凌曦,田奇,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。