一种半监督学习模型的训练方法、图像处理方法及设备技术

技术编号：26971821 阅读：25 留言：0更新日期：2021-01-06 00:03

本申请实施例公开了一种半监督学习模型的训练方法、图像处理方法及设备，可应用于人工智能领域的计算机视觉领域，该方法包括：首先通过训练后的第一半监督学习模型对一部分无标签样本的分类类别进行预测，得到预测标签，并通过一比特标注的方式判断各预测标签是否正确，如果预测正确则获得该样本的正确标签(即正标签)，否则可排除掉该样本的一个错误标签(即负标签)，之后，在下一训练阶段，利用上述信息重新构建训练集(即第一训练集)，并根据第一训练集重新训练初始半监督学习模型，从而提高模型的预测准确率，由于一比特标注只需标注者针对预测标签回答“是”或“否”，该标注方式能缓解机器学习中需要大量有正确标签数据的人工标注压力。

全部详细技术资料下载

【技术实现步骤摘要】
一种半监督学习模型的训练方法、图像处理方法及设备
本申请涉及机器学习领域，尤其涉及一种半监督学习模型的训练方法、图像处理方法及设备。
技术介绍
传统的机器学习任务分为无监督学习(数据无标签，如聚类、异常检测等)和监督学习(数据有标签，如分类、回归等)，而半监督学习(semi-supervisedlearning，SSL)是模式识别和机器学习领域研究的重点问题，属于监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的无标签数据和一部分有标签数据来进行模式识别工作。现实场景中数据的标签获取往往是十分昂贵的，然而现有的半监督学习模型对有标签数据的数量有一定要求，当有标签数据达到一定数量，半监督学习模型的泛化能力才能明显增强，并且半监督学习模型的预测准确率仍然有较大的提升空间。基于此，利用少量有标签数据训练得到一种更高预测准确率的半监督学习模型的方法亟待推出。
技术实现思路
本申请实施例提供了一种半监督学习模型的训练方法、图像处理方法及设备，用于在当前训练阶段，通过训练后的第一半监督学习模型预测...

【技术保护点】
1.一种半监督学习模型的训练方法，其特征在于，包括：/n从第一无标签样本集选取初始子集，并通过训练后的第一半监督学习模型对所述初始子集进行预测，得到第一预测标签集，所述第一半监督学习模型由初始半监督学习模型通过初始训练集训练得到，所述初始训练集包括第一有标签样本集和所述第一无标签样本集；/n根据所述第一预测标签集将所述初始子集分为第一子集和第二子集，所述第一子集为预测正确的分类类别对应的样本集合，所述第二子集为预测错误的分类类别对应的样本集合；/n构建第一训练集，所述第一训练集包括第二有标签样本集、第二无标签样本集和负标签样本集，所述第二有标签样本集为包括所述第一有标签样本集和所述第一子集的具...

【技术特征摘要】
1.一种半监督学习模型的训练方法，其特征在于，包括：
从第一无标签样本集选取初始子集，并通过训练后的第一半监督学习模型对所述初始子集进行预测，得到第一预测标签集，所述第一半监督学习模型由初始半监督学习模型通过初始训练集训练得到，所述初始训练集包括第一有标签样本集和所述第一无标签样本集；
根据所述第一预测标签集将所述初始子集分为第一子集和第二子集，所述第一子集为预测正确的分类类别对应的样本集合，所述第二子集为预测错误的分类类别对应的样本集合；
构建第一训练集，所述第一训练集包括第二有标签样本集、第二无标签样本集和负标签样本集，所述第二有标签样本集为包括所述第一有标签样本集和所述第一子集的具有正确分类类别的样本集合，所述第二无标签样本集为所述第一无标签样本集中除所述初始子集之外的无标签样本的集合，所述负标签样本集为包括所述第二子集的具有错误分类类别的样本集合；
根据所述第一训练集训练所述初始半监督学习模型，得到训练后的第二半监督学习模型。

2.根据权利要求1所述的方法，其特征在于，所述初始半监督学习模型包括如下模型中的任意一种：
Π-model、VAT、LPDSSL、TNAR、pseudo-label、DCT、meanteacher模型。

3.根据权利要求2所述的方法，其特征在于，所述初始半监督学习模型为Π-model、VAT、LPDSSL、TNAR、pseudo-label、DCT中的任意一种，则所述根据所述第一训练集训练所述初始半监督学习模型，得到训练后的第二半监督学习模型包括：
根据所述第二有标签样本集和所述第二无标签样本集，利用第一损失函数对所述初始半监督学习模型进行训练，所述第一损失函数为所述初始半监督学习模型原有的损失函数；
根据所述负标签样本集，利用第二损失函数对所述初始半监督学习模型进行训练，所述第二损失函数为模型输出的预测值与修改值之间的差值，所述修改值为将预测错误的分类类别在所述预测值上的对应维度置为零的值。

4.根据权利要求2所述的方法，其特征在于，所述初始半监督学习模型为meanteacher模型，则所述根据所述第一训练集训练所述初始半监督学习模型，得到训练后的第二半监督学习模型包括：
根据所述第二有标签样本集，利用第三损失函数对所述meanteacher模型进行训练；
根据所述第二有标签样本集和所述第二无标签样本集，利用第四损失函数对所述meanteacher模型进行训练，所述第三损失函数和所述第四损失函数为所述meanteacher模型原有的损失函数；
根据所述负标签样本集，利用第五损失函数对所述meanteacher模型进行训练，所述第五损失函数为模型输出的预测值与修改值之间的差值，所述修改值为将预测错误的分类类别在所述预测值上的对应维度置为零的值。

5.根据权利要求4所述的方法，其特征在于，
所述第三损失函数为交叉熵损失函数；
和/或，
所述第四损失函数为均方误差损失函数。

6.根据权利要求1-5中任一项所述的方法，其特征在于，所述方法还包括：
将所述第二无标签样本集作为新的第一无标签样本集、所述第二半监督学习模型作为新的第一半监督学习模型，重复执行上述步骤，直至所述第二无标签样本集为空。

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述在根据所述第一训练集训练所述初始半监督学习模型，得到训练后的第二半监督学习模型之后，所述方法还包括：
将所述训练后的第二半监督学习模型部署在目标设备上，所述目标设备用于获取目标图像，所述训练后的第二半监督学习模型用于对所述目标图像进行标签预测。

8.根据权利要求1-7中任一项所述的方法，其特征在于，所述从第一无标签样本集选取初始子集包括：
从所述第一无标签样本集随机选取预设数量的无标签样本构成所述初始子集。

9.一种图像处理方法，其特征在于，包括：
获取目标图像；
将所述目标图像作为训练后的半监督学习模型的输入，输出对所述目标图像的预测结果，所述训练后的半监督学习模型为权利要求1-8中任一项所述方法中的第二半监督学习模型。

10.一种训练设备，其特征在于，包括：
选取模块，用于从第一无标签样本集选取初始子集，并通过训练后的第一半监督学习模型对所述初始子集进行预测，得到第一预测标签集，所述第一半监督学习模型由初始半监督学习模型通过初始训练集训练得到，所述初始训练集包括第一有标签样本集和所述第一无标签样本集；
猜测模块，用于根据所述第一预测标签集将所述初始子集分为第一子集和第二子集，所述第一子集为预测正确的分类类别对应的样本集合，所述第二子集为预测错误的分类类别对应的样本集合；
构建模块，用于构建...

【专利技术属性】
技术研发人员：杜泽伟，胡恒通，谢凌曦，田奇，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人