基于动态半监督深度学习的图像分类方法、系统及设备技术方案

技术编号：37709085 阅读：36 留言：0更新日期：2023-06-02 00:00

本发明专利技术提供了基于动态半监督深度学习的图像分类方法、系统及设备，方法包括：构建图像分类模型，获取图像数据集，并基于所述图像数据集，采用基于伪标签与一致性正则化的动态半监督深度学习方法对所述图像分类模型进行训练和优化，得到训练好的图像分类模型；图像分类模块，获取待分类的图像，利用训练好的图像分类模型对所述待分类的图像进行分类，得到所述待分类的图像的标签。本发明专利技术采用基于动态半监督深度学习的图像分类方法，基于伪标签与一致性正则化，通过置信度阈值的动态调整，提升了伪标签数据的使用率，从而从根源上解决了现有的针对固定置信度阈值和图像样本使用不充分的情况，导致图像分类模型精度下降，图像分类准确性低的问题。类准确性低的问题。类准确性低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于动态半监督深度学习的图像分类方法、系统及设备

[0001]本专利技术属于图像分类领域，具体涉及一种基于动态半监督深度学习的图像分类方法、系统及设备。

技术介绍

[0002]近来年，神经网络成为图像分类领域重要的处理分析工具，在图像分类技术中得到了广泛应用。神经网络的图像分类精度与标签图像样本数量和标注准确性密切相关，如果有足够数量的且准确标注的图像数据集，就能训练得到分类效果较好的图像分类模型，然而，标记大量图像数据集对应的人工成本非常高。
[0003]于是，由于标签图像的数量有限，半监督学习方式得到越来越广泛的应用。半监督学习使得图像分类模型的训练过程中仅需要少量标签图像和一定的无标签图像，大大减轻了对标记图像的需求。现有技术中，在标签数据有限的前提下，将无标签的数据生成伪标签，例如MixMatch、FixMatch等。然而，现有的方法中仅使用固定数量的具有高置信度的未标记图像参与训练，这样使得很多图像样本没有得到使用，训练集的规模降低了，大大影响了图像分类模型的分类精度。
[0004]因此，如何提升图...

【技术保护点】

【技术特征摘要】
1.一种基于动态半监督深度学习的图像分类方法，其特征在于，包括步骤：S1、构建图像分类模型，所述图像分类模型采用WRN模型；S2、获取图像数据集，并利用所述图像数据集，采用基于伪标签与一致性正则化的动态半监督深度学习方法对所述图像分类模型进行训练和优化，得到训练好的图像分类模型；具体地，S2包括如下步骤：S21、获取图像数据集，并进行超参数设置；其中，所述图像数据集包括有标签的图像集X＝(x
b
，p
b
)：b∈(1，...，B)和无标签的图像集u＝u
b
：b∈(1，...，μB)，所述超参数至少包括置信度阈值τ、增强量aug
times
、无标签图像的比例μ、无标签图像对应损失的权重λ
u
；其中，x
b
表示第b张图像，p
b
表示第b张图像对应的标签，B代表有标签图像的数量，μ
b
表示第b张无标签图像；S22、将有标签的图像集X输入至所述图像分类模型进行监督训练，训练过程中，采用的有标签图像的损失函数为：其中，H()表示交叉熵，P
m
()表示模型预测的概率分布，y为概率，α(x
b
)表示对图像x
b
进行弱增强；S23、将所述无标签的图像集进行弱增强后输入至所述图像分类模型中进行预测，基于预测值对无标签的图像进行打上标签，形成伪标签图像，伪标签为：q
b
＝p
model
(y|α(u
b
)；θ)其中，q
b
表示伪标签，p
model
()表示模型预测的概率分布，y为概率，α(μ
b
)为无标签图像μ
b
的弱增强，θ为模型的超参；S24、将所述无标签的图像集进行强增强后输入至所述图像分类模型中进行预测；S25、将置信度高于阈值τ的伪标签图像输入至所述图像分类模型中进行训练，将强增强对应的预测值与弱增强对应的伪标签进行交叉熵损失计算，无标签图像的损失函数为：其中，max(q
b
)是伪标签概率分布中的最大值，argmax(q
b
)表示也是伪标签概率分布中的最大值，P
model

【专利技术属性】
技术研发人员：吴全旺，孙建勋，张智勇，张香，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人