一种图像分类模型的训练方法及相关设备技术

技术编号:22296023 阅读:37 留言:0更新日期:2019-10-15 05:05
本发明专利技术实施例公开了一种图像分类模型的训练方法及相关设备,所述方法包括:获取训练图像集;将相关训练图像输入图像分类学习模型,得到相关训练图像针对各个所述目标类别的预测分类概率,并将无关训练图像输入所述图像分类学习模型,得到无关训练图像针对各个目标类别的预测分类概率;确定目标类别在所述相关训练图像下的真实概率分布与预测概率分布之间的概率分布差异度;确定相关训练图像的预测分类不确定度,并确定无关训练图像的预测分类不确定度;根据概率分布差异度、相关训练图像的预测分类不确定度以及无关训练图像的预测分类不确定度,调节图像分类学习模型的当前模型参数。通过本发明专利技术实施例可以提高图像分类模型的泛化能力。

A Training Method of Image Classification Model and Related Equipment

【技术实现步骤摘要】
一种图像分类模型的训练方法及相关设备
本申请涉及机器学习领域,尤其涉及一种图像分类模型的训练方法及相关设备。
技术介绍
随着人工智能领域的发展,越来越多的工作可以通过计算机实现,其中图像分类就是计算机通过提取图像的特征,根据图像的特征将图像划分为若干图像归类中的某一类,代替人类通过视觉进行判读归类的技术。目前存在许多用于图像分类的算法,比如KNN(K近邻分类器)、SVM(支持向量机)、CNN(卷积神经网络)等,CNN由于不需要人工进行预处理以及额外的特征提取等操作,成为图像分类领域的主流方法。在通过基于CNN的图像分类模型进行图像分类过程中,图像分类模型提取输入图像的图像特征,进而根据图像特征计算输入图像为每一种预设类别的预测概率,进而将最大的预测概率对应的类别确定为输入对象的归类。例如,图像分类模型进行分类的预设类别有两种,分别为猫和狗,即任何图像输入图像分类模型后,图像分类模型均会计算该图像是猫和狗的预测概率,进而输出相对较高的预测概率对应的类别(猫和狗中的一种)。在一些情况下,将猫或狗的图像输入图像分类模型可以输出准确的归类,在另一些情况下,将猫或狗以外的图像输入图像分类模型后,依然输出猫或狗其中的一种归类,且模型内部对应的预测概率较高,如0.8或0.8以上,也就是说图像分类模型较为肯定地将猫和狗以外的图像地误判为了猫或狗,说明当前的图像分类模型的训练方法使得图像分类模型不能对不属于预设类别的输入图像进行合理预测,进而使得图像分类模型的泛化能力较弱。
技术实现思路
本申请提供一种图像分类模型的训练方法及相关设备,通过本专利技术可以提高图像分类模型的泛化能力。本专利技术实施例一方面提供了一种图像分类模型的训练方法,包括:获取训练图像集,所述训练图像集包括不同目标类别下的相关训练图像,以及不属于所述目标类别的无关训练图像,所述相关训练图像携带各自的目标类别对应的类别标签;将所述相关训练图像输入图像分类学习模型,得到所述相关训练图像针对各个所述目标类别的预测分类概率,并将所述无关训练图像输入所述图像分类学习模型,得到所述无关训练图像针对各个所述目标类别的预测分类概率;根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述目标类别在所述相关训练图像下的真实概率分布与预测概率分布之间的概率分布差异度;根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的预测分类不确定度,并根据所述无关训练图像针对各个所述目标类别的预测分类概率,确定所述无关训练图像的预测分类不确定度;根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,调节所述图像分类学习模型的当前模型参数,使得通过调节后的图像分类学习模型确定出的概率分布差异度、确定出的所述相关训练图像的预测分类不确定度以及确定出的所述无关训练图像的预测分类不确定度满足预设的调节结果条件。其中,所述根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述目标类别在所述相关训练图像下的真实概率分布与预测概率分布之间的概率分布差异度包括:根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的分类交叉熵,并将所述相关训练图像的分类交叉熵确定为所述概率分布差异度。其中,所述根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的预测分类不确定度,并根据所述无关训练图像针对各个所述目标类别的预测分类概率,确定所述无关训练图像的预测分类不确定度包括:根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的分类信息熵,并将所述相关训练图像的分类信息熵确定为所述相关训练图像的预测分类不确定度;根据所述无关训练图像针对各个所述目标类别的预测分类概率,确定所述无关训练图像的分类信息熵,并将所述无关训练图像的分类信息熵确定为所述无关训练图像的预测分类不确定度。其中,所述方法还包括:分别对所述相关训练图像的预测分类不确定度和所述无关训练图像的预测分类不确定度进行归一化处理,得到所述相关训练图像的归一化不确定度和所述无关训练图像的归一化不确定度;所述根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,调节所述图像分类学习模型的当前模型参数包括:根据所述概率分布差异度、所述相关训练图像的归一化不确定度以及所述无关训练图像的归一化不确定度,调节所述图像分类学习模型的当前模型参数。其中,所述分别对所述相关训练图像的预测分类不确定度和所述无关训练图像的预测分类不确定度进行归一化处理,得到所述相关训练图像的归一化不确定度和所述无关训练图像的归一化不确定度包括:确定所述目标类别在概率均匀分布的情况下的最大分类不确定度;将所述相关训练图像的预测分类不确定度与所述最大分类不确定度的比值,确定为所述相关训练图像的归一化不确定度,并将所述无关训练图像的预测分类不确定度与所述最大分类不确定度的比值,确定为所述无关训练对象的归一化不确定度。其中,所述根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,调节所述图像分类学习模型的当前模型参数包括:根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,构造所述图像分类学习模型的当前模型参数对应的分类损失函数;对所述分类损失函数求偏导,确定所述图像分类学习模型的当前模型参数对应的损失梯度;根据所述图像分类学习模型的当前模型参数对应的损失梯度以及预设的参数学习率,调节所述图像分类学习模型的当前模型参数。其中,所述根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,构造所述图像分类学习模型的当前模型参数对应的分类损失函数包括:所述图像分类学习模型的当前模型参数对应的分类损失函数L为:L=Lc+αLr-βLur,其中,Lc为所述概率分布差异度,α为预设的所述相关训练图像的预测分类不确定度对应的权重,Lr为所述相关训练图像的预测分类不确定度,β为预设的所述无关训练图像的预测分类不确定度对应的权重,Lur为所述无关训练图像的预测分类不确定度。其中,所述根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定各个所述相关训练图像的分类交叉熵包括:所述相关训练图像的分类交叉熵Lce-ur为:其中,i为所述相关训练图像的索引,N为所述相关训练图像的数量,i和N为正整数,且i≤N,j为所述目标类别的索引,K为所述目标类别的种类数量,j和K为正整数,且j≤K,yj为目标类别j对应的类别标签,pij为相关训练图像i针对目标类别j的预测分类概率。其中,所述根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的分类信息熵包括:所述相关训练图像的分类信息熵Le-r为:其中,i为所述相关训练图像的索引,N为所述相关训练图像的数量,i和N为正整数,且i≤N,j为所述目标类别的索引,K本文档来自技高网...

【技术保护点】
1.一种图像分类模型的训练方法,其特征在于,包括:获取训练图像集,所述训练图像集包括不同目标类别下的相关训练图像,以及不属于所述目标类别的无关训练图像,所述相关训练图像携带各自的目标类别对应的类别标签;将所述相关训练图像输入图像分类学习模型,得到所述相关训练图像针对各个所述目标类别的预测分类概率,并将所述无关训练图像输入所述图像分类学习模型,得到所述无关训练图像针对各个所述目标类别的预测分类概率;根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述目标类别在所述相关训练图像下的真实概率分布与预测概率分布之间的概率分布差异度;根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的预测分类不确定度,并根据所述无关训练图像针对各个所述目标类别的预测分类概率,确定所述无关训练图像的预测分类不确定度;根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,调节所述图像分类学习模型的当前模型参数,使得通过调节后的图像分类学习模型确定出的概率分布差异度、确定出的所述相关训练图像的预测分类不确定度以及确定出的所述无关训练图像的预测分类不确定度满足预设的调节结果条件。...

【技术特征摘要】
1.一种图像分类模型的训练方法,其特征在于,包括:获取训练图像集,所述训练图像集包括不同目标类别下的相关训练图像,以及不属于所述目标类别的无关训练图像,所述相关训练图像携带各自的目标类别对应的类别标签;将所述相关训练图像输入图像分类学习模型,得到所述相关训练图像针对各个所述目标类别的预测分类概率,并将所述无关训练图像输入所述图像分类学习模型,得到所述无关训练图像针对各个所述目标类别的预测分类概率;根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述目标类别在所述相关训练图像下的真实概率分布与预测概率分布之间的概率分布差异度;根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的预测分类不确定度,并根据所述无关训练图像针对各个所述目标类别的预测分类概率,确定所述无关训练图像的预测分类不确定度;根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,调节所述图像分类学习模型的当前模型参数,使得通过调节后的图像分类学习模型确定出的概率分布差异度、确定出的所述相关训练图像的预测分类不确定度以及确定出的所述无关训练图像的预测分类不确定度满足预设的调节结果条件。2.根据权利要求1所述的方法,其特征在于,所述根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述目标类别在所述相关训练图像下的真实概率分布与预测概率分布之间的概率分布差异度包括:根据所述相关训练图像的目标类别对应的类别标签、所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的分类交叉熵,并将所述相关训练图像的分类交叉熵确定为所述概率分布差异度。3.根据权利要求1所述的方法,其特征在于,所述根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的预测分类不确定度,并根据所述无关训练图像针对各个所述目标类别的预测分类概率,确定所述无关训练图像的预测分类不确定度包括:根据所述相关训练图像针对各个所述目标类别的预测分类概率,确定所述相关训练图像的分类信息熵,并将所述相关训练图像的分类信息熵确定为所述相关训练图像的预测分类不确定度;根据所述无关训练图像针对各个所述目标类别的预测分类概率,确定所述无关训练图像的分类信息熵,并将所述无关训练图像的分类信息熵确定为所述无关训练图像的预测分类不确定度。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:分别对所述相关训练图像的预测分类不确定度和所述无关训练图像的预测分类不确定度进行归一化处理,得到所述相关训练图像的归一化不确定度和所述无关训练图像的归一化不确定度;所述根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,调节所述图像分类学习模型的当前模型参数包括:根据所述概率分布差异度、所述相关训练图像的归一化不确定度以及所述无关训练图像的归一化不确定度,调节所述图像分类学习模型的当前模型参数。5.根据权利要求4所述的方法,其特征在于,所述分别对所述相关训练图像的预测分类不确定度和所述无关训练图像的预测分类不确定度进行归一化处理,得到所述相关训练图像的归一化不确定度和所述无关训练图像的归一化不确定度包括:确定所述目标类别在概率均匀分布的情况下的最大分类不确定度;将所述相关训练图像的预测分类不确定度与所述最大分类不确定度的比值,确定为所述相关训练图像的归一化不确定度,并将所述无关训练图像的预测分类不确定度与所述最大分类不确定度的比值,确定为所述无关训练对象的归一化不确定度。6.根据权利要求1至3中任一所述的方法,其特征在于,所述根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,调节所述图像分类学习模型的当前模型参数包括:根据所述概率分布差异度、所述相关训练图像的预测分类不确定度以及所述无关训练图像的预测分类不确定度,构造所述图像分类学习模型的当前模型参数对应的分类损失函数;对所述分类损失函数求偏导,确定所述图像分类学习模...

【专利技术属性】
技术研发人员:王晓宁孙钟前付星辉郑瀚杨巍
申请(专利权)人:腾讯医疗健康深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1