【技术实现步骤摘要】
小样本图像分类的方法
[0001]本公开涉及机器学习
,尤其涉及一种小样本图像分类的方法。
技术介绍
[0002]得益于海量训练数据,参数量较大的卷积神经网络模型在图像分类问题中的表现甚至超越了人类水平。然而在许多场景下,人类无法获得大量的训练数据,一般分为两种情况。第一种情况,能获取的样本比较稀少,比如输电线路冰灾预测问题中,冰灾发生次数较少,客观上无法获得大量数据;身份证等证件识别问题中,证件涉及他人隐私,能合法获得的证件图像较少。第二种情况,样本类型标记繁琐,没有足够的人力或相关领域专家对图像进行标记,比如医学上各部位肿瘤类型分类。
[0003]常见的深度学习模型的参数量一般较大,通常需要海量数据的支撑,如果使用少量的样本数据来训练模型,即使使用随机失活技术也容易产生过拟合问题,导致最终测试结果准确率不高。面对此类问题,我们需要改变使用大量数据训练模型的方式,研究出使用少量样本即可达到较高分类准确率的模型,这类任务被称为小样本学习,本申请针对其中的小样本图像分类问题,提供了一种小样本图像分类的方法。 />
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种小样本图像分类的方法,其特征在于,包括:S1:获取小样本图像分类的数据集,所述数据集包括训练集、支持集和测试集;其中,所述训练集包括M个类别;所述支持集包括K个类别,K≤M,每个类别包括至少Z个图像,且所述训练集的类别与所述支持集的类别的交集为0;所述测试集的类别都包含在所述支持集的类别中;所述训练集和所述支持集的图像都包括标签,所述测试集的图像不包括标签;S2:将所述训练集划分为样本集和查询集,所述样本集和所述查询集都包括M个类别,将所述样本集和所述查询集投入到第一小样本分类模型进行训练,得到第二小样本分类模型;S3:通过所述支持集和所述测试集对所述第二小样本分类模型进行测试,得到分类准确率,根据所述分类准确率对所述第二小样本分类模型的超参数进行调整后重复步骤S2,直至所述第二小样本分类模型的分类准确率达到预设值,即得到最终小样本分类模型;S4:将实际任务中需要分类的图像与所述支持集输入到所述最终小样本分类模型中,对实际任务中需要分类的图像进行分类;其中,所述步骤S2包括:S21:从所述样本集中随机选择K个类别,每个类别包括Z个图像,则第i个类别的第j个图像记作x
ij
,I∈K,j∈Z;将图像x
ij
投入到第一小样本分类模型的第一编码器中进行特征提取,得到K*Z张样本特征图;S22:对类别相同图像的样本特征图的算术平均值进行计算,得到K个类别的K个样本特征图f(x1),f(x2),
…
,f(x
K
);S23:从所述查询集随机选择一个图像x,将所述图像x投入到所述第一编码器中进行特征提取,得到查询特征图f(x);S24:将K个样本特征图f(x1),f(x2),
…
,f(x
K
)与所述查询特征图f(x)输入到所述第一小样本分类模型的第一融合模块,所述第一融合模块输出K个取值范围在0到1间的小数;S25:通过K个小数与所述图像x对应的标签y(x)计算损失函数,通过反向传播算法对所述第一小样本分类模型的网络参数进行调整,重复步骤S21至步骤S25,直至所述损失函数的值下降到预设数量级,即得到第二小样本分类模型。2.如权利要求1所述的方法,其特征在于,所述步骤S24包括:S241:将f(x1),f(x2),
…
,f(x
K
),f(x)分别投入到所述第一融合模块的第一特征提取器h1、h2、h3进行特征提取,得到三组K+1个不同尺度的特征,即:h1(f(x1)),
…
,h1(f(x
K
...
【专利技术属性】
技术研发人员:路通,陈俍宇,陈鹏飞,周世杰,黄建武,曹阳,
申请(专利权)人:江苏威尔曼科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。