当前位置: 首页 > 专利查询>南昌大学专利>正文

一种基于特征分布拟合和深度学习的小样本图像分类方法技术

技术编号:39396030 阅读:9 留言:0更新日期:2023-11-19 15:50
本发明专利技术提供了一种基于特征分布拟合和深度学习的小样本图像分类方法,该方法综合方向驱动策略和相似性权重策略,提出一种全新的基于特征分布拟合机制的小样本图像分类网络

【技术实现步骤摘要】
一种基于特征分布拟合和深度学习的小样本图像分类方法


[0001]本专利技术属于计算机视觉
,具体涉及一种基于特征分布拟合和深度学习的小样本图像分类方法


技术介绍

[0002]一般图像分类是指将一张图片分配到不同的预定义类别中的过程

通常情况下,这是通过使用机器学习算法和深度神经网络来实现的

而小样本图像分类则是指在训练数据非常少的情况下
(
通常少于几百个图像
)
,将一张图片分配到不同的预定义类别中的过程

在这种情况下,传统的深度学习算法和神经网络往往无法有效地进行训练和分类

小样本图像分类的目的是解决在少量数据上进行图像分类时的问题

在现实生活中,获取大量标注的图像数据往往是非常困难的,因此小样本图像分类可以更好地利用现有的图像数据并提高分类的准确性

小样本图像分类通常涉及到使用一些特殊的技术和算法,例如迁移学习

元学习

生成对抗网络等,以帮助算法更好地理解和分类图像数据

其应用包括医学影像诊断

工业生产中的缺陷检测

机器人视觉等领域

[0003]传统的小样本图像分类方法主要包括以下几种:基于人工设计特征的分类方法,主要是通过手动设计特征提取器,例如
SIFT、HOG、LBP
等来提取图像特征,然后使用传统的机器学习算法,例如
SVM、KNN、
决策树等进行分类;基于字典学习的分类方法,通过对训练样本进行聚类,并将每个聚类中心作为字典的基础来构建分类器,在测试时,将测试样本表示为基础的线性组合,并使用分类器进行分类;基于核方法的分类方法,主要是通过核函数将低维特征映射到高维空间,然后使用传统的机器学习算法,例如
SVM、KNN
等进行分类;基于相似度度量的分类方法:主要是计算训练样本和测试样本之间的相似度,然后根据相似度对测试样本进行分类,常见的相似度度量方法包括欧式距离

余弦相似度

马氏距离等

这些方法都是传统的小样本图像分类方法,主要依赖于手动设计特征和传统的机器学习算法

虽然这些方法在一些场景下表现良好,但是面对复杂的图像数据和更少规模的样本数据时,效果可能不尽如人意

随着深度学习技术的发展,基于深度学习的小样本图像分类方法已成为当前的热点之一

[0004]目前基于深度学习的少样本图像分类方法主要有以下几种:元学习
(Meta

Learning)
方法,元学习可以使得模型能够在少量的样本上快速学习到新的任务

这种方法通过学习到从少量的训练样本中抽象出来的共性特征,从而快速适应新的任务,常见的元学习方法包括
MAML、Reptile、ProtoNets
等;基于生成对抗网络
(GAN)
的方法,
GAN
可以生成与训练数据类似的合成数据,因此可以用于增强训练数据,从而提高模型的泛化能力
。GAN
还可以生成样本的嵌入表示,用于分类任务

常见的基于
GAN
的小样本分类方法包括
GAN

based Few

Shot Learning(GFSL)、Conditional GAN

based Few

Shot Learning(CGFSL)
等;基于度量学习的方法则是学习如何比较,通过比较每个训练任务中的查询集图像和支持集图像之间的关系,实现任务之间可迁移特征的学习

常见的基于度量学习的方法包括
Matching Network、Relation Network


这些方法都是基于深度学习的小样本图像分类
方法,它们在处理少量数据和复杂数据方面有很好的表现,是当前研究的热点

虽然现有的小样本图像分类方法已经取得了一定的成果,但仍然大多聚焦于训练过程优化

判别性表征学习和样本生成网络,忽略了数据本身的属性,如数据在特征空间中的真实分布

此外,现有关注并估计小样本类别真实特征分布的方法在描述分布和获取分布信息方面还不够完全,这导致对小样本类别真实特征分布的估计不够准确

所以
,
设计一种准确估计的小样本类别真实特征分布的小样本图像分类网络十分有必要


技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种基于特征分布拟合和深度学习的小样本图像分类方法,具体来说,该方法综合方向驱动策略和相似性权重策略,提出一种全新的基于特征分布拟合机制的小样本图像分类网络

其中,方向驱动策略可以在更多方向
(
维度
)
上描述和获取更完整的特征分布的信息;相似性权重策略可以估计不同的类别在特征分布拟合过程中产生的不同程度的影响,并为其分配相应的权重

该方法可以近似估计出小样本类的真实特征分布,并以此生成无数量限制的训练样本,以避免模型过拟合

[0006]为实现上述目的,本专利技术提供如下技术方案:一种基于特征分布拟合和深度学习的小样本图像分类方法,包括以下步骤:
[0007]步骤一

将公开小样本图像分类数据集进行划分,分为训练集

测试集以及验证集
,
对训练集的图像及对应的标签数据进行预处理
,
获得同一尺寸图像;
[0008]步骤二

构建特征提取器模型,包括多个具有跳跃连接的宽残差块,多个卷积层

批量归一化层

激活函数层
、Dropout


平均池化层以及全连接层;
[0009]步骤三

基于步骤二构建的网络模型设计损失函数,其中包括交叉熵损失与自监督的旋转损失;
[0010]步骤四

将所述步骤一获得的训练集图像,以一定批次数量输入特征提取器模型,并以所述步骤三的损失函数对特征提取器进行预训练;
[0011]步骤五

将所述步骤一中的训练集和验证集图像输入所述步骤四中训练好的特征提取器进行特征提取,并得到训练集样本的特征向量与验证集样本的特征向量;
[0012]步骤六

在验证集中进行类别和样本特征的随机采样,构建大量不同的小样本任务;
[0013]步骤七

将所述步骤五中提本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于特征分布拟合和深度学习的小样本图像分类方法,其特征在于:包括以下步骤:步骤一

将公开小样本图像分类数据集进行划分,分为训练集

测试集以及验证集
,
对训练集的图像及对应的标签数据进行预处理
,
获得同一尺寸图像;步骤二

构建特征提取器模型,包括多个具有跳跃连接的宽残差块,多个卷积层

批量归一化层

激活函数层
、Dropout


平均池化层以及全连接层;步骤三

基于步骤二构建的网络模型设计损失函数,其中包括交叉熵损失与自监督的旋转损失;步骤四

将所述步骤一获得的训练集图像,以一定批次数量输入特征提取器模型,并以所述步骤三的损失函数对特征提取器进行预训练;步骤五

将所述步骤一中的训练集和验证集图像输入所述步骤四中训练好的特征提取器进行特征提取,并得到训练集样本的特征向量与验证集样本的特征向量;步骤六

在验证集中进行类别和样本特征的随机采样,构建大量不同的小样本任务;步骤七

将所述步骤五中提取的训练集各类别特征向量进行统计信息的计算,包括各类分布的均值向量和协方差矩阵;步骤八

将所述步骤五中构建小样本任务中的验证集样本的特征向量进行幂阶段变换;步骤九

使用步骤七计算的各类分布的均值向量和步骤八变换后小样本任务中的支持集特征向量构建特征描述矩阵;步骤十

选出与小样本类中的目标样本高度匹配的相似类;步骤十一

衡量不同相似类在分布拟合过程的不同贡献,并为其分配不同的权重;步骤十二

根据步骤七中的统计信息

步骤十中选出的相似类以及步骤十一中不同相似类的不同权重,将相似类的统计信息迁移到支持集中的特征向量所属的小样本类中;步骤十三

根据步骤十二中迁移后的小样本类特征分布,采样无数量限制的对应类别的特征向量;步骤十四

构建特定于任务的全连接层分类器,并将新生成的特征与支持集原始特征都将进行
L2
归一化,输入分类器中进行最小化监督损失的优化训练;步骤十五

提取所述步骤一中的测试集图像特征,并进行类别和样本特征的随机采样,构建大量不同的小样本任务;步骤十六

使用测试集小...

【专利技术属性】
技术研发人员:闵卫东杜伟熊若男胡晓平
申请(专利权)人:南昌大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1