一种图像分类模型训练方法及装置制造方法及图纸

技术编号:38206042 阅读:6 留言:0更新日期:2023-07-21 16:53
本发明专利技术提供了一种图像分类模型训练方法及装置。该方法通过综合考虑不同类别的训练图像的全局特征和局部特征,对每张训练图像进行分类,可以提高图像分类的准确率,以及,可以降低训练图像的边缘数据对于图像分类模型的模型训练效果的影响,从而可以提高模型的训练效果,进而可以实现基于少量数据便可以训练得到分类效果较好的图像分类模型。分类效果较好的图像分类模型。分类效果较好的图像分类模型。

【技术实现步骤摘要】
一种图像分类模型训练方法及装置


[0001]本专利技术涉及计算机视觉
,尤其涉及一种图像分类模型训练方法及装置。

技术介绍

[0002]近年来人工智能的发展给人们的生活带来了极大的便利,图像分类作为其中的重点研究领域得到了极大的关注和发展,但是图像分类模型的训练往往离不开足够的标注数据,一方面,对于大量无标签数据人工进行标注十分的耗费人力物力,另外一方面,对于医疗图像和安防等领域来说,获取足量的训练数据并不是容易的事情,这些问题阻碍了少量数据条件下图像分类任务的发展。目前,亟需一种可以基于少量数据便可以训练得到分类效果较好的图像分类模型的方法。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种图像分类模型训练方法、装置、计算机设备及计算机可读存储介质,以实现通过综合考虑不同类别的训练图像的全局特征和局部特征,对每张训练图像进行分类,可以提高图像分类的准确率,以及,可以降低训练图像的边缘数据对于图像分类模型的模型训练效果的影响,从而可以提高模型的训练效果,进而可以实现基于少量数据便可以训练得到分类效果较好的图像分类模型。
[0004]本专利技术实施例的第一方面,提供了一种图像分类模型训练方法,所述方法包括:
[0005]获取训练样本图像集,其中,所述训练样本图像集包括N个类别的训练图像;
[0006]将所述训练样本图像集输入图像分类模型中的卷积神经网络,得到所述训练样本图像集中每张训练图像的全局特征;
[0007]将所述训练样本图像集中每张训练图像的全局特征输入所述图像分类模型中的局部特征生成模块,得到所述训练样本图像集中每张训练图像的局部特征;
[0008]将所述训练样本图像集中每张训练图像的全局特征和局部特征输入所述图像分类模型中的类别描述生成模块,得到所述训练样本图像集中每张训练图像的预测类别;
[0009]根据所述训练样本图像集中每张训练图像的预测类别和真实类别,对所述图像分类模型的模型参数进行调整,直至所述图像分类模型满足网络收敛条件。
[0010]本专利技术实施例的第二方面,提供了一种图像分类模型训练装置,所述装置包括:
[0011]数据获取单元,用于获取训练样本图像集,其中,所述训练样本图像集包括N个类别的训练图像;
[0012]第一确定单元,用于将所述训练样本图像集输入图像分类模型中的卷积神经网络,得到所述训练样本图像集中每张训练图像的全局特征;
[0013]第二确定单元,用于将所述训练样本图像集中每张训练图像的全局特征输入所述图像分类模型中的局部特征生成模块,得到所述训练样本图像集中每张训练图像的局部特征;
[0014]第三确定单元,用于将所述训练样本图像集中每张训练图像的全局特征和局部特
征输入所述图像分类模型中的类别描述生成模块,得到所述训练样本图像集中每张训练图像的预测类别;
[0015]模型调整单元,用于根据所述训练样本图像集中每张训练图像的预测类别和真实类别,对所述图像分类模型的模型参数进行调整,直至所述图像分类模型满足网络收敛条件。
[0016]本专利技术实施例的第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0017]本专利技术实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0018]本专利技术实施例与现有技术相比存在的有益效果是:本实施例中先获取训练样本图像集,其中,所述训练样本图像集包括N个类别的训练图像;然后,可以将所述训练样本图像集输入图像分类模型中的卷积神经网络,得到所述训练样本图像集中每张训练图像的全局特征;接着,可以将所述训练样本图像集中每张训练图像的全局特征输入所述图像分类模型中的局部特征生成模块,得到所述训练样本图像集中每张训练图像的局部特征;紧接着,可以将所述训练样本图像集中每张训练图像的全局特征和局部特征输入所述图像分类模型中的类别描述生成模块,得到所述训练样本图像集中每张训练图像的预测类别;最后,可以根据所述训练样本图像集中每张训练图像的预测类别和真实类别,对所述图像分类模型的模型参数进行调整,直至所述图像分类模型满足网络收敛条件。可以理解的是,由于局部特征可以衡量训练图像中不同区域的辨别性强度,和可以反映每张训练图像中的重点特征,可以对训练图像进行更加完备的描述,优化边缘数据的特征向量;以及,全局特征可以反映每张图片整体特征的重要性,进一步给低质量的图像赋予更小的权重,以便增强特征的显著性;因此,本实施例中通过综合考虑不同类别的训练图像的全局特征和局部特征对每张训练图像进行分类,可以提高图像分类的准确率,以及,可以降低训练图像的边缘数据对于图像分类模型的模型训练效果的影响,从而可以提高模型的训练效果,进而可以实现基于少量数据便可以训练得到分类效果较好的图像分类模型。
附图说明
[0019]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0020]图1是本专利技术实施例提供的图像分类模型训练方法的的方法流程图;
[0021]图2是本专利技术实施例提供的卷积神经网络的网络结构示意图;
[0022]图3是本专利技术实施例提供的训练图像的局部特征的生成过程示意图;
[0023]图4是本专利技术实施例提供的图像分类模型训练装置的装置结构示意图;
[0024]图5是本专利技术实施例提供的计算机设备的示意图。
具体实施方式
[0025]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。
[0026]下面将结合附图详细说明根据本专利技术实施例的一种图像分类模型训练方法和装置。
[0027]专利技术人经研究发现:近年来人工智能的发展给人们的生活带来了极大的便利,图像分类作为其中的重点研究领域得到了极大的关注和发展,但是图像分类模型的训练往往离不开足够的标注数据,一方面,对于大量无标签数据人工进行标注十分的耗费人力物力,另外一方面,对于医疗图像和安防等领域来说,获取足量的训练数据并不是容易的事情,这些问题的存在推动了少量数据条件下图像分类任务的发展。
[0028]小样本图像分类的目的在于希望训练得到的神经网络,在面对训练集中不存在的新的类别时,仅仅通过对少数几个样本的学习就能够获得良好的分类结果。在实际应用中,给定测试图片,以及该图片可能所处的N个类别,每个类别K张图片,判断该测试图片的种类。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分类模型训练方法,其特征在于,所述方法包括:获取训练样本图像集,其中,所述训练样本图像集包括N个类别的训练图像;将所述训练样本图像集输入图像分类模型中的卷积神经网络,得到所述训练样本图像集中每张训练图像的全局特征;将所述训练样本图像集中每张训练图像的全局特征输入所述图像分类模型中的局部特征生成模块,得到所述训练样本图像集中每张训练图像的局部特征;将所述训练样本图像集中每张训练图像的全局特征和局部特征输入所述图像分类模型中的类别描述生成模块,得到所述训练样本图像集中每张训练图像的预测类别;根据所述训练样本图像集中每张训练图像的预测类别和真实类别,对所述图像分类模型的模型参数进行调整,直至所述图像分类模型满足网络收敛条件。2.根据权利要求1所述的方法,其特征在于,所述卷积神经网络包括四个卷积模块和一个最大池化层;其中,所述四个卷积模块为级联关系,且最后一个卷积模块与所述最大池化层连接;所述四个卷积模块的卷积核大小相同,且,所述四个卷积模块的通道数互不相同。3.根据权利要求2所述的方法,其特征在于,每个卷积模块均包括第一卷积层、第二卷积层和第三卷积层和ReLU函数。4.根据权利要求1所述的方法,其特征在于,所述将所述训练样本图像集中每张训练图像的全局特征输入所述图像分类模型中的局部特征生成模块,得到所述训练样本图像集中每张训练图像的局部特征,包括:针对所述训练样本图像集中每张训练图像,所述局部特征生成模块将所述训练图像的全局特征拆分成多个图像区域对应的图像特征;所述局部特征生成模块计算每个图像区域对应的图像特征分别与第一类别训练图像的全局特征之间的第一相似度,其中,所述第一类别训练图像为和所述训练图像属于同一类别的训练图像;所述局部特征生成模块计算每个图像区域对应的图像特征分别与第二类别训练图像的全局特征之间的第二相似度,其中,所述第二类别训练图像为和所述训练图像不属于同一类别的训练图像;所述局部特征生成模块根据所述第一相似度和所述第二相似度,生成每个图像区域对应的注意力值;所述局部特征生成模块将注意力值为最大的图像区域对应的图像特征作为训练图像的局部特征。5.根据权利要求4所述的方法,其特征在于,所述将所述训练样本图像集中每张训练图像的全局特征和局部特征输入所述图像分类模型中的类别描述生成模块,得到所述训练样本图像集中每张训练图像的预测类别,包括:针对所述训练样本图像集中每张训练图像,根据所述训练图像的全局特征和局部特征,确定所述训练图像的表征向量;所述类别描述生成模块计算所述训练图像的表征向量分别与所述第一类别训练图像的表征向量之间的第三相似度;所述类别描述生成模块计算所述训练图像的表征向量分别与所述第二类别训练图像的表征...

【专利技术属性】
技术研发人员:赵瑞静鲍思羽杨东明陈艺丹李响
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1