一种图像分类方法、装置、可读存储介质及终端设备制造方法及图纸

技术编号:21914059 阅读:28 留言:0更新日期:2019-08-21 12:27
本发明专利技术涉及图像处理技术领域,尤其涉及一种图像分类方法、装置、存储介质及终端设备。本发明专利技术提供的图像分类方法包括:获取待分类图像;将待分类图像输入至训练完成的图像分类模型,得到图像分类模型输出的图像标签;其中,图像分类模型包括老师模型和学生模型,老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型,学生模型为基于老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型;根据图像标签得到待分类图像对应的分类结果,以使用老师模型来进行知识迁移,并利用噪声数据和非噪声数据进行多任务学习训练,提高图像分类模型的分类效率和分类准确性。

An Image Classification Method, Device, Readable Storage Media and Terminal Equipment

【技术实现步骤摘要】
一种图像分类方法、装置、可读存储介质及终端设备
本专利技术涉及图像处理
,尤其涉及一种图像分类方法、装置、计算机可读存储介质及终端设备。
技术介绍
随着互联网大数据时代的发展,深度卷积神经网络技术已成功应用于人工智能领域,例如可通过深度卷积神经网络技术来识别图像的类别,以进行图像分类,现有的深度卷积神经网络技术能够实现图像分类的关键因素在于:在进行深度卷积神经网络技术的训练时,所采集的训练用的图像集需具有非常可靠的标签数据。在目前海量的网络数据图像和爬虫图像的情况下,获取可靠、高质量的标签数据是非常困难和费时的,而一旦训练用的图像集的标签数据变得不可靠时,将严重影响深度卷积神经网络技术的分类性能和分类准确性,从而使得现有图像分类的分类效率和分类准确性较低。
技术实现思路
本专利技术实施例提供了一种图像分类方法、装置、计算机可读存储介质及终端设备,能够解决现有的图像分类中分类效率和分类准确性较低的问题。本专利技术实施例的第一方面,提供了一种图像分类方法,包括:获取待分类图像;将所述待分类图像输入至训练完成的图像分类模型,得到所述图像分类模型输出的图像标签;其中,所述图像分类模型包括老师模型和学生模型,所述老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型,所述学生模型为基于所述老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型;根据所述图像标签得到所述待分类图像对应的分类结果。进一步地,所述老师模型通过下述步骤训练得到:获取第一训练样本集,并确定所述第一训练样本集中各训练数据对应的第一标准图像标签;将所述第一训练样本集输入至初始的老师模型,得到所述初始的老师模型输出的各训练数据对应的第一预测图像标签;利用下式根据所述第一标准图像标签与所述第一预测图像标签计算本轮训练的训练误差;其中,Losst为训练误差,M为训练数据对应的总个数,yi为第i个训练数据对应的第一标准图像标签,y′i为第i个训练数据对应的第一预测图像标签;若所述训练误差满足第一预设条件,则确定所述老师模型训练完成;若所述训练误差不满足所述第一预设条件,则调整所述老师模型的第一模型参数,并将第一模型参数调整后的老师模型确定为初始的老师模型,返回执行将所述第一训练样本集输入至初始的老师模型的步骤以及后续步骤。优选地,所述学生模型通过下述步骤训练得到:获取第二训练样本集,并将所述第二训练样本集划分为噪声数据集和非噪声数据集;将所述噪声数据集输入至所述老师模型,得到所述老师模型输出的各个噪声数据对应的第一输出值,并对所述第一输出值进行软化操作,得到各类噪声数据对应的第一软标签;获取各个噪声数据对应的图像噪声标签,并将所述图像噪声标签与对应的第一软标签进行融合,得到各类噪声数据对应的引导知识标签;将所述噪声数据集输入至初始的学生模型,得到所述初始的学生模型输出的各个噪声数据对应的第二输出值,并对所述第二输出值进行软化操作,得到各个噪声数据对应的第二软标签;根据所述引导知识标签和所述第二软标签计算所述噪声数据集对应的KL散度;将所述非噪声数据集输入至初始的学生模型,得到各个非噪声数据对应的第二预测图像标签;获取各个非噪声数据对应的第二标准图像标签,并根据所述第二预测图像标签和所述第二标准图像标签计算所述非噪声数据集对应的交叉熵;根据所述KL散度和所述交叉熵,确定所述第二训练样本集对应的总误差;若所述总误差满足第二预设条件,则确定所述学生模型训练完成;若所述总误差不满足所述第二预设条件,则调整所述学生模型的第二模型参数,并将第二模型参数调整后的学生模型确定为初始的学生模型,返回执行将所述噪声数据集输入至初始的学生模型,得到所述初始的学生模型输出的各个噪声数据对应的第二输出值的步骤以及后续步骤。可选地,所述对所述第一输出值进行软化操作,得到各类噪声数据对应的第一软标签,包括:通过下述公式对所述第一输出值进行软化操作,得到各类噪声数据对应的第一软标签:其中,p′i为第i类噪声数据对应的第一软标签,z为噪声数据对应的第一输出值,T为温度系数。进一步地,所述将所述图像噪声标签与对应的第一软标签进行融合,得到各类噪声数据对应的引导知识标签,包括:通过下述公式将所述图像噪声标签与对应的第一软标签进行融合,得到各类噪声数据对应的引导知识标签:其中,gi为第i类噪声数据对应的引导知识标签,p′i为第i类噪声数据对应的第一软标签,ti为第i类噪声数据对应的图像噪声标签,β为第一平衡权重参数。优选地,所述根据所述引导知识标签和所述第二软标签计算所述噪声数据集对应的KL散度,包括:根据下述公式计算所述噪声数据集对应的KL散度:其中,Lossg为KL散度,N为噪声数据的总个数,gk为第k个噪声数据对应的引导知识标签,qk为第k个噪声数据对应的第二软标签。可选地,所述根据所述KL散度和所述交叉熵,确定所述第二训练样本集对应的总误差,包括:根据下述公式确定所述第二训练样本集对应的总误差:Losstotal=α*T2*Lossg+Lossc其中,Losstotal为总误差,T为温度系数,α为第二平衡权重参数,Lossg为KL散度,Lossc为交叉熵。本专利技术实施例的第二方面,提供了一种图像分类装置,包括:图像获取模块,用于获取待分类图像;图像标签获取模块,用于将所述待分类图像输入至训练完成的图像分类模型,得到所述图像分类模型输出的图像标签;其中,所述图像分类模型包括老师模型和学生模型,所述老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型,所述学生模型为基于所述老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型;分类结果确定模块,用于根据所述图像标签得到所述待分类图像对应的分类结果。本专利技术实施例的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前述第一方面所述图像分类方法的步骤。本专利技术实施例的第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如前述第一方面所述图像分类方法的步骤。从以上技术方案可以看出,本专利技术实施例具有以下优点:本专利技术实施例的图像分类模型可包括老师模型和学生模型,其中,老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型,学生模型则为基于老师模型根据知识迁移机制和多任务学习机制共同训练所得到的模型,以通过在老师模型的基础上进行知识迁移,并利用多任务学习机制进行噪声数据和非噪声数据的训练来提高学生模型的分类性能,从而提高图像分类模型的分类效率和分类准确性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例中一种图像分类方法的一个实施例流程图;图2为本专利技术实施例中一种图像分类方法在一个应用场景下训练老师模型的流程示意图;图3为本专利技术实施例中一种图像分类方法在一个应用场景下训练学生模型的流程示意图;图4为本专利技术实施例中一种图像本文档来自技高网...

【技术保护点】
1.一种图像分类方法,其特征在于,包括:获取待分类图像;将所述待分类图像输入至训练完成的图像分类模型,得到所述图像分类模型输出的图像标签;其中,所述图像分类模型包括老师模型和学生模型,所述老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型,所述学生模型为基于所述老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型;根据所述图像标签得到所述待分类图像对应的分类结果。

【技术特征摘要】
1.一种图像分类方法,其特征在于,包括:获取待分类图像;将所述待分类图像输入至训练完成的图像分类模型,得到所述图像分类模型输出的图像标签;其中,所述图像分类模型包括老师模型和学生模型,所述老师模型为利用噪声数据和非噪声数据进行弱监督训练得到的卷积神经网络模型,所述学生模型为基于所述老师模型根据知识迁移机制和多任务学习机制共同训练获得的模型;根据所述图像标签得到所述待分类图像对应的分类结果。2.根据权利要求1所述的图像分类方法,其特征在于,所述老师模型通过下述步骤训练得到:获取第一训练样本集,并确定所述第一训练样本集中各训练数据对应的第一标准图像标签;将所述第一训练样本集输入至初始的老师模型,得到所述初始的老师模型输出的各训练数据对应的第一预测图像标签;利用下式根据所述第一标准图像标签与所述第一预测图像标签计算本轮训练的训练误差;其中,Losst为训练误差,M为训练数据对应的总个数,yi为第i个训练数据对应的第一标准图像标签,y′i为第i个训练数据对应的第一预测图像标签;若所述训练误差满足第一预设条件,则确定所述老师模型训练完成;若所述训练误差不满足所述第一预设条件,则调整所述老师模型的第一模型参数,并将第一模型参数调整后的老师模型确定为初始的老师模型,返回执行将所述第一训练样本集输入至初始的老师模型的步骤以及后续步骤。3.根据权利要求1所述的图像分类方法,其特征在于,所述学生模型通过下述步骤训练得到:获取第二训练样本集,并将所述第二训练样本集划分为噪声数据集和非噪声数据集;将所述噪声数据集输入至所述老师模型,得到所述老师模型输出的各个噪声数据对应的第一输出值,并对所述第一输出值进行软化操作,得到各类噪声数据对应的第一软标签;获取各个噪声数据对应的图像噪声标签,并将所述图像噪声标签与对应的第一软标签进行融合,得到各类噪声数据对应的引导知识标签;将所述噪声数据集输入至初始的学生模型,得到所述初始的学生模型输出的各个噪声数据对应的第二输出值,并对所述第二输出值进行软化操作,得到各个噪声数据对应的第二软标签;根据所述引导知识标签和所述第二软标签计算所述噪声数据集对应的KL散度;将所述非噪声数据集输入至初始的学生模型,得到各个非噪声数据对应的第二预测图像标签;获取各个非噪声数据对应的第二标准图像标签,并根据所述第二预测图像标签和所述第二标准图像标签计算所述非噪声数据集对应的交叉熵;根据所述KL散度和所述交叉熵,确定所述第二训练样本集对应的总误差;若所述总误差满足第二预设条件,则确定所述学生模型训练完成;若所述总误差不满足所述第二预设条件,则调整所述学生模型的第二模型参数,并将第二模型参数调整后的学生模型确定为初始的学生模型,...

【专利技术属性】
技术研发人员:乔宇李青彭小江
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1