一种主动学习的图像分类方法、系统及存储介质技术方案

技术编号:39068501 阅读:16 留言:0更新日期:2023-10-12 20:00
本发明专利技术提供了一种主动学习的图像分类方法、系统及存储介质,所述方法包括:S1、将训练样本集分为第一有标签样本集D

【技术实现步骤摘要】
一种主动学习的图像分类方法、系统及存储介质


[0001]本专利技术涉及图像分类
,尤其是涉及一种主动学习的图像分类方法、系统及存储介质。

技术介绍

[0002]图像分类是根据图像所表达的特征将每张图像分为不同类别的一项技术,它根据已有数据集去训练网络模型,对图像做定量分析,使得网络模型从数据集中学得能够区分不同类别图像的知识,从而达到用网络模型去代替人的视觉判断的目的。
[0003]目前深度学习领域模型训练依赖大量标注数据集,高质量的标注数据集获取困难,需要高昂的时间成本和人力成本。并且,大量的数据集往往充斥着冗余的信息,有些标注样本对模型的训练并没有益处。所以获取有价值的有标注样本成为学界和工业界的研究热点。
[0004]主动学习是机器学习中的一个分支,它的作用是为了减小数据集的标注量,使得模型使用少量样本就可以获得令人满意的性能,从而达到节约人力成本和时间成本的目的。主动学习的基本思想是:每个样本所具有信息量都是不同的,也就是说不是每个样本都是值得模型学习的。有些样本包含的信息量大,有些样本包含的信息量小,主动学习的目的就是去挑选出所含信息量最大的那部分样本送给模型去学习,因为这类样本是非常值得模型学习的样本。如果将信息量大的样本都能够分类正确,那么对于信息量小的样本应当也能分类正确。总的来讲,在图片分类方面,主动学习能够通过选择策略挑选出最难分辨的样本去进行人工标注工作,再用标注完的样本来优化模型的训练效果。应用主动学习算法可以大大优化了工程投资成本。近年来主动学习一直在不断发展,提出了许多相关算法,对于在实现用小样本量获得更好的模型性能方面取得了不小的进步,对节省标注成本有很重要的意义。
[0005]目前许多主动学习方法采用了基于不确定性的方法,比如:基于熵的不确定性抽样、基于最小置信度抽样。
[0006]然而,现有的方法虽然考虑到了不确定性,但只是单纯的基于抽样策略的考量,没有结合模型的优化,对于不确定性的考虑过于单一。

技术实现思路

[0007]本专利技术提供了一种主动学习的图像分类方法、系统及存储介质,以解决现有技术中主动学习的图像分类基于抽样策略的考量,没有结合模型的优化,对于不确定性的考虑过于单一的技术问题。
[0008]本专利技术的一个方面在于提供一种主动学习的图像分类方法,所述图像分类方法包括如下方法步骤:
[0009]S1、获取训练样本集,将训练样本集分为第一有标签样本集D
L
和无标签样本集D
U

[0010]S2、训练查询模型Mq,所述查询模型Mq包括第一特征提取器第一分类器和
第二分类器
[0011]对第一有标签样本集D
L
进行数据增广,获取第二有标签样本集将第一有标签样本集D
L
和第二有标签样本集分别送入所述查询模型Mq,对所述第一分类器和所述第二分类器的分类能力进行训练,以及对所述第一分类器和所述第二分类器进行最大差异化训练;
[0012]S3、训练任务模型M
t
,所述任务模型M
t
包括第二特征提取器和第三分类器f
t

[0013]将所述第一特征提取器的参数传送至所述第二特征提取器使所述第一特征提取器与所述第二特征提取器进行参数共享;
[0014]将第一有标签样本集D
L
送入所述任务模型M
t
,对所述第三分类器f
t
的分类能力进行训练;
[0015]S4、查询样本,将无标签样本集D
U
送入所述查询模型M
q
,输出分类结果,根据所述第一分类器和所述第二分类器的分类结果,计算不确定性分数;
[0016]S5、更新训练样本,根据步骤S4计算得到的不确定性分数,标注不确定分数最大的前k个样本,并将标注的不确定性分数最大的前k个样本放入第一有标签样本集D
L
,同时将标注的不确定分数最大的前k个样本从无标签样本集D
U
剔除;
[0017]重复步骤S2至S5,循环多次,直至图像分类完成。
[0018]在一个优选的实施例中,在步骤S2中,对第一有标签样本集D
L
进行数据增广的方法包括:添加噪声、旋转、拉伸、裁剪或空间透视中的一种或多种。
[0019]在一个优选的实施例中,在步骤S2中,将第一有标签样本集D
L
送入所述查询模型Mq,通过所述第一特征提取器提取第一特征图将第一特征图送入所述第一分类器输出第一分类结果
[0020]将第二有标签样本集送入所述查询模型Mq,通过所述第一特征提取器提取第二特征图将第二特征图送入所述第二分类器输出第二分类结果
[0021]在一个优选的实施例中,在步骤S2中,通过如下损失函数L1,对所述第一分类器和所述第二分类器的分类能力进行训练,以及对所述第一分类器和所述第二分类器进行最大差异化训练:
[0022]L1=L
CE1
+L
CE2

λL
dis

[0023]其中,L
CE1
为第一分类交叉熵损失函数,L
CE2
为第二分类交叉熵损失函数,
[0024]λ为权重超参数。
[0025]在一个优选的实施例中,第一分类交叉熵损失函数L
CE1
通过如下方式表述:
[0026][0027]其中,y
ij
为第一有标签样本集D
L
中的第一有标签样本x
i
的标签值,n1为第一有标签
样本x
i
的数量,c为第一有标签样本x
i
的类别数,为第一特征图送入第一分类器输出的第一分类结果;
[0028]其中,i∈{1,2,

,n1},j∈{1,2,

,c};
[0029]第二分类交叉熵损失函数L
CE2
通过如下方式表述:
[0030][0031]其中,为第二有标签样本集中的第二有标签样本的标签值,为第二有标签样本的数量,为第二有标签样本的类别数,为第二特征图送入第二分类器输出的第二分类结果;
[0032]其中,
[0033]在一个优选的实施例中,在步骤S3中,将第一有标签样本集D
L
送入所述任务模型M
t
,通过所述第二特征提取器提取第三特征图将第三特征图送入所述第三分类器f
t
,输出第三分类结果
[0034]在一个优选的实施例中,在步骤S3中,通过第三分类交叉熵损失函数L
CE3
,对所述第三分类器f
t
的分类能力进行训练;
[0035]其中,第三分类交叉熵损失函数L
CE3
通过如下方式表述:
[0036][0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种主动学习的图像分类方法,其特征在于,所述图像分类方法包括如下方法步骤:S1、获取训练样本集,将训练样本集分为第一有标签样本集D
L
和无标签样本集D
U
;S2、训练查询模型M
q
,所述查询模型M
q
包括第一特征提取器第一分类器和第二分类器对第一有标签样本集D
L
进行数据增广,获取第二有标签样本集将第一有标签样本集D
L
和第二有标签样本集分别送入所述查询模型M
q
,对所述第一分类器和所述第二分类器的分类能力进行训练,以及对所述第一分类器和所述第二分类器进行最大差异化训练;S3、训练任务模型M
t
,所述任务模型M
t
包括第二特征提取器和第三分类器f
t
;将所述第一特征提取器的参数传送至所述第二特征提取器使所述第一特征提取器与所述第二特征提取器进行参数共享;将第一有标签样本集D
L
送入所述任务模型M
t
,对所述第三分类器f
t
的分类能力进行训练;S4、查询样本,将无标签样本集D
U
送入所述查询模型M
q
,输出分类结果,根据所述第一分类器和所述第二分类器的分类结果,计算不确定性分数;S5、更新训练样本,根据步骤S4计算得到的不确定性分数,标注不确定分数最大的前k个样本,并将标注的不确定性分数最大的前k个样本放入第一有标签样本集D
L
,同时将标注的不确定分数最大的前k个样本从无标签样本集D
U
剔除;重复步骤S2至S5,循环多次,直至图像分类完成。2.根据权利要求1所述的图像分类方法,其特征在于,在步骤S2中,对第一有标签样本集D
L
进行数据增广的方法包括:添加噪声、旋转、拉伸、裁剪或空间透视中的一种或多种。3.根据权利要求1所述的图像分类方法,其特征在于,在步骤S2中,将第一有标签样本集D
L
送入所述查询模型M
q
,通过所述第一特征提取器提取第一特征图将第一特征图送入所述第一分类器输出第一分类结果将第二有标签样本集送入所述查询模型M
q
,通过所述第一特征提取器提取第二特征图将第二特征图送入所述第二分类器输出第二分类结果4.根据权利要求3所述的图像分类方法,其特征在于,在步骤S2中,通过如下损失函数L1,对所述第一分类器和所述第二分类器的分类能力进行训练,以及对所述第一分类器和所述第二分类器进行最大差异化训练:L1=L
CE1
+L
CE2

λL
dis
,其中,L
CE1
为第一分类交叉熵损失函数,L
CE2
为第二分类交叉熵损失函数,
λ为权重超参数。5.根据权利要求4所述的图像分类方法,其特征在于,第一分类交叉熵损失函数L
CE1
通过如下方式表述:其中,y
ij
为第一有标签样本集D
L
中的第一有标签样本x
i
的标签值,n1为第一有标签样本x
i
的数量,c为第一有标签样本x
i
的类别数,为第一特征图送入第一分类器...

【专利技术属性】
技术研发人员:王悦蓉昝鹏韩天宇胡昊昊许慧妍钟万军张国福
申请(专利权)人:上大合肥产业技术创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1