一种图像分类方法、装置、可读存储介质及终端设备制造方法及图纸

技术编号：21914059 阅读：28 留言：0更新日期：2019-08-21 12:27

本发明专利技术涉及图像处理技术领域，尤其涉及一种图像分类方法、装置、存储介质及终端设备。本发明专利技术提供的图像分类方法包括：获取待分类图像；将待分类图像输入至训练完成的图像分类模型，得到图像分类模型输出的图像标签；其中，图像分类模型包括老师模型和学生模型，老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型，学生模型为基于老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型；根据图像标签得到待分类图像对应的分类结果，以使用老师模型来进行知识迁移，并利用噪声数据和非噪声数据进行多任务学习训练，提高图像分类模型的分类效率和分类准确性。

An Image Classification Method, Device, Readable Storage Media and Terminal Equipment

全部详细技术资料下载

【技术实现步骤摘要】
一种图像分类方法、装置、可读存储介质及终端设备
本专利技术涉及图像处理
，尤其涉及一种图像分类方法、装置、计算机可读存储介质及终端设备。
技术介绍
随着互联网大数据时代的发展，深度卷积神经网络技术已成功应用于人工智能领域，例如可通过深度卷积神经网络技术来识别图像的类别，以进行图像分类，现有的深度卷积神经网络技术能够实现图像分类的关键因素在于：在进行深度卷积神经网络技术的训练时，所采集的训练用的图像集需具有非常可靠的标签数据。在目前海量的网络数据图像和爬虫图像的情况下，获取可靠、高质量的标签数据是非常困难和费时的，而一旦训练用的图像集的标签数据变得不可靠时，将严重影响深度卷积神经网络技术的分类性能和分类准确性，从而使得现有图像分类的分类效率和分类准确性较低。
技术实现思路
本专利技术实施例提供了一种图像分类方法、装置、计算机可读存储介质及终端设备，能够解决现有的图像分类中分类效率和分类准确性较低的问题。本专利技术实施例的第一方面，提供了一种图像分类方法，包括：获取待分类图像；将所述待分类图像输入至训练完成的图像分类模型，得到所述图像分类模型输出的图像标签；其中，所述图像分类模型包括老师模型和学生模型，所述老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型，所述学生模型为基于所述老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型；根据所述图像标签得到所述待分类图像对应的分类结果。进一步地，所述老师模型通过下述步骤训练得到：获取第一训练样本集，并确定所述第一训练样本集中各训练数据对应的第一标准图像标签；将所述第一训练样本集输入至初始...

【技术保护点】
1.一种图像分类方法，其特征在于，包括：获取待分类图像；将所述待分类图像输入至训练完成的图像分类模型，得到所述图像分类模型输出的图像标签；其中，所述图像分类模型包括老师模型和学生模型，所述老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型，所述学生模型为基于所述老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型；根据所述图像标签得到所述待分类图像对应的分类结果。

【技术特征摘要】
1.一种图像分类方法，其特征在于，包括：获取待分类图像；将所述待分类图像输入至训练完成的图像分类模型，得到所述图像分类模型输出的图像标签；其中，所述图像分类模型包括老师模型和学生模型，所述老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型，所述学生模型为基于所述老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型；根据所述图像标签得到所述待分类图像对应的分类结果。2.根据权利要求1所述的图像分类方法，其特征在于，所述老师模型通过下述步骤训练得到：获取第一训练样本集，并确定所述第一训练样本集中各训练数据对应的第一标准图像标签；将所述第一训练样本集输入至初始的老师模型，得到所述初始的老师模型输出的各训练数据对应的第一预测图像标签；利用下式根据所述第一标准图像标签与所述第一预测图像标签计算本轮训练的训练误差；其中，Losst为训练误差，M为训练数据对应的总个数，yi为第i个训练数据对应的第一标准图像标签，y′i为第i个训练数据对应的第一预测图像标签；若所述训练误差满足第一预设条件，则确定所述老师模型训练完成；若所述训练误差不满足所述第一预设条件，则调整所述老师模型的第一模型参数，并将第一模型参数调整后的老师模型确定为初始的老师模型，返回执行将所述第一训练样本集输入至初始的老师模型的步骤以及后续步骤。3.根据权利要求1所述的图像分类方法，其特征在于，所述学生模型通过下述步骤训练得到：获取第二训练样本集，并将所述第二训练样本集划分为噪声数据集和非噪声数据集；将所述噪声数据集输入至所述老师模型，得到所述老师模型输出的各个噪声数据对应的第一输出值，并对所述第一输出值进行软化操作，得到各类噪声数据对应的第一软标签；获取各个噪声数据对应的图像噪声标签，并将所述图像噪声标签与对应的第一软标签进行融合，得到各类噪声数据对应的引导知识标签；将所述噪声数据集输入至初始的学生模型，得到所述初始的学生模型输出的各个噪声数据对应的第二输出值，并对所述第二输出值进行软化操作，得到各个噪声数据对应的第二软标签；根据所述引导知识标签和所述第二软标签计算所述噪声数据集对应的KL散度；将所述非噪声数据集输入至初始的学生模型，得到各个非噪声数据对应的第二预测图像标签；获取各个非噪声数据对应的第二标准图像标签，并根据所述第二预测图像标签和所述第二标准图像标签计算所述非噪声数据集对应的交叉熵；根据所述KL散度和所述交叉熵，确定所述第二训练样本集对应的总误差；若所述总误差满足第二预设条件，则确定所述学生模型训练完成；若所述总误差不满足所述第二预设条件，则调整所述学生模型的第二模型参数，并将第二模型参数调整后的学生模型确定为初始的学生模型，...

【专利技术属性】
技术研发人员：乔宇，李青，彭小江，
申请(专利权)人：中国科学院深圳先进技术研究院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人