一种基于增强小样本特征解耦的图像分类方法和系统技术方案

技术编号：38040625 阅读：11 留言：0更新日期：2023-06-30 11:07

本说明书公开了一种基于增强小样本特征解耦的图像分类方法和系统，旨在解决无法有效提取细粒度特征和粗粒度特征以获得充足的局部信息和全局信息的问题。本发明专利技术包括：基于待测数据，通过基于小样本的数据增强模型，获取增强待测数据；通过多层感知机和第一分类器获取增强待测数据；将增强待测数据进行特征解耦获得细粒度特征和粗粒度特征；通过特征连接器将细粒度特征与粗粒度特征进行连接，基于连接特征，通过训练好的第二分类器进行分类获得分类预测结果。本发明专利技术能够快速的提取细粒度特征和粗粒度特征，有效解决了细粒度特征提取和粗粒度特征提取之间的冲突，提高了图像识别的准确性，并解决了训练样本不足的问题。并解决了训练样本不足的问题。并解决了训练样本不足的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于增强小样本特征解耦的图像分类方法和系统

[0001]本专利技术属于计算机视觉领域，具体涉及了一种基于增强小样本特征解耦的图像分类方法和系统。

技术介绍

[0002]图像分类有广泛的应用场景，但是在许多场景下难以收集到足够多的训练数据，可以采用小样本数据增强的方法扩充数据集来解决数据库量不够的问题。在卷积神经网络(CNN)中，卷积运算擅长以分层的方式提取细粒度特征，细粒度特征很好的反映了图像的局部信息，但CNN在提取粗粒度特征方面的能力仍有不足有。在transformer中，自注意力机制可以捕获长距离特征依赖，对粗粒度特征的提取能力很强，但会忽略细粒度特征的细节。如何同时有效提取细粒度特征和粗粒度特征以获得充足的局部信息和全局信息一直是急需解决的问题。

技术实现思路

[0003]为了解决现有技术中的上述问题，即现有技术中没有方法能够同时提取细粒度特征和粗粒度特征以获得充足的局部信息和全局信息的问题，本专利技术提供了一种基于增强小样本特征解耦的图像分类方法，所述方法包括：
[0004]步骤S100，获取带有类别标签的训练数据，通过基于小样本数据增强的样本扩增模型，获取增强训练数据特征；
[0005]所述基于小样本的数据增强模型，具体为：将训练数据的中数据的量低于预设的阈值的一类数据设为待增强数据，基于所述待增强数据通过多层感知机和通过第一交叉熵损失训练的分类器获取增强训练数据特征；
[0006]步骤S200，将所述增强训练数据特征进行特征解耦获得细粒度特征和粗粒度特征；r/>[0007]步骤S300，通过特征连接器将所述细粒度特征与粗粒度特征进行连接，获得连接特征，基于所述连接特征，通过训练好的预测器获得训练数据的分类预测结果；
[0008]步骤S400，基于所述训练数据的预测结果计算第二交叉熵损失函数，重复步骤S200
‑
步骤S300的方法，调整预测器的参数，直至所述第二交叉熵损失函数低于预设的阈值，获得训练好的图像分类模型；
[0009]步骤S500，获取待测数据，通过所述训练好的图像分类模型，获取待测数据的分类预测结果。
[0010]在一些优选的实施方式中，所述基于小样本数据增强的样本扩增模型，包括4层全连接神经网络的多层感知机和一个预训练的分类器。
[0011]在一些优选的实施方式中，所述基于小样本数据增强的样本扩增模型，其处理方法包括：
[0012]将训练数据的中数据的量低于预设的阈值的一类数据设为待增强数据；
[0013]随机选取待增强数据中的两个待增强数据样本和
[0014]选取待增强数据之外且与待增强数据样本和的欧氏距离最小的干扰样本
[0015]定义训练样本集以待增强数据样本和干扰样本作为训练样本，待增强数据样本作为样本训练标签；
[0016]基于所述训练样本集生成预测数据
[0017]通过所述预训练的分类器获取判断结果，基于所述判断结果和样本训练标签计算第一交叉熵损失
[0018][0019]n表示训练样本集μ的个数；
[0020]重复迭代直至所述第一交叉熵损失取最小值，获得训练好的基于小样本数据增强的样本扩增模型和增强训练数据特征。
[0021]在一些优选的实施方式中，所述特征解耦网络，其处理方法为：
[0022]基于所述增强训练数据特征，通过所述卷积神经网络子网络进行特征提取，获得第一细粒度特征，基于所述第一细粒度特征，通过细粒度特征融合器获得当前的多粒度特征单元的第二细粒度特征；首次迭代中，卷积神经网络子网络的输入为增强训练数据特征，在非首次迭代阶段卷积神经网络子网络的输入为前一个多粒度特征单元输出的第二细粒度特征；
[0023]通过transformer的多头注意力机制层将第二细粒度特征与第一粗粒度特征进行特征融合，获得当前的多粒度特征单元的第二粗粒度特征；首次迭代中所述第一粗粒度特征为随机初始化得到的特征图像，首次迭代中的第二细粒度特征为增强训练数据特征，在非首次迭代阶段所述第一粗粒度特征为前一个的多粒度特征单元输出的第二粗粒度特征；
[0024]将最后一个多粒度特征单元输出的第二细粒度特征和第二粗粒度特征作为步骤S200所述的细粒度特征和粗粒度特征。
[0025]在一些优选的实施方式中，所述第二粗粒度特征，其获得方法为：
[0026]细粒度特征到粗粒度特征的融合过程F
L
→
G
为：
[0027][0028]其中，细粒度特征L和粗粒度特征G被分为h个注意力头L＝{l1，l2，...，l
h
}，G＝{g1，g2，...，g
h
}，W
iQ
为第i个注意力头的查询矩阵，为第i个注意力头的地址矩阵，W
iV
为第i个注意力头的值矩阵，d为W
iK
的维度。
[0029]在一些优选的实施方式中，所述第二细粒度特征，其获得方法为：
[0030]粗粒度特征到细粒度特征的融合过程F
G
→
L
为：
[0031][0032]其中，细粒度特征L和粗粒度特征G被分为h个注意力头L＝{l1，l2，...，l
h
}，G＝{g1，g2，...，g
h
}，W
iQ
为第i个注意力头的查询矩阵，W
iK
为第i个注意力头的地址矩阵，W
iV
为第i个注意力头的值矩阵，d为W
iK
的维度。
[0033]在一些优选的实施方式中，所述预测器，通过第二交叉熵损失进行训练，所述第二交叉熵损失为：
[0034][0035]其中，N表示样本数，y
i
表示真实标签，表示预测结果，i表示序号。
[0036]本专利技术的另一方面，提出了一种基于增强小样本特征解耦的图像分类系统，所述分类系统包括：
[0037]数据增强模块，配置为获取带有类别标签的训练数据，通过基于小样本数据增强的样本扩增模型，获取增强训练数据特征；
[0038]所述基于小样本的数据增强模型，具体为：将训练数据的中数据的量低于预设的阈值的一类数据设为待增强数据，基于所述待增强数据通过多层感知机和通过第一交叉熵损失训练的分类器获取增强训练数据特征；
[0039]所述基于小样本的数据增强模型，具体为：将训练数据的中数据的量低于预设的阈值的一类数据设为待增强数据，基于所述待增强数据通过多层感知机和通过第一交叉熵损失训练的分类器获取增强训练数据特征；
[0040]特征解耦模块，配置为将所述增强训练数据特征进行特征解耦获得细粒度特征和粗粒度特征；
[0041]结果预测模块，配置为通过特征连接器将所述细粒度特征与粗粒度特征进行连接，获得连接特征，基于所述连接特征，通过训练好的预测器获得预测结果；
[0042]模型训练模块，配置为基于所述预测结果计算第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于增强小样本特征解耦的图像分类方法，其特征在于，所述方法包括：步骤S100，获取带有类别标签的训练数据，通过基于小样本数据增强的样本扩增模型，获取增强训练数据特征；所述基于小样本的数据增强模型，具体为：将训练数据的中数据的量低于预设的阈值的一类数据设为待增强数据，基于所述待增强数据通过多层感知机和通过第一交叉熵损失训练的分类器获取增强训练数据特征；步骤S200，将所述增强训练数据特征进行特征解耦获得细粒度特征和粗粒度特征；步骤S300，通过特征连接器将所述细粒度特征与粗粒度特征进行连接，获得连接特征，基于所述连接特征，通过训练好的预测器获得训练数据的分类预测结果；步骤S400，基于所述训练数据的预测结果计算第二交叉熵损失函数，重复步骤S200
‑
步骤S300的方法，调整预测器的参数，直至所述第二交叉熵损失函数低于预设的阈值，获得训练好的图像分类模型；步骤S500，获取待测数据，通过所述训练好的图像分类模型，获取待测数据的分类预测结果。2.根据权利要求1所述的基于增强小样本特征解耦的图像分类方法，其特征在于，所述基于小样本数据增强的样本扩增模型，包括4层全连接神经网络的多层感知机和一个预训练的分类器。3.根据权利要求2所述的基于增强小样本特征解耦的图像分类方法，其特征在于，所述基于小样本数据增强的样本扩增模型，其处理方法包括：将训练数据的中数据的量低于预设的阈值的一类数据设为待增强数据；随机选取待增强数据中的两个待增强数据样本和选取待增强数据之外且与待增强数据样本和的欧氏距离最小的干扰样本定义训练样本集以待增强数据样本和干扰样本作为训练样本，待增强数据样本作为样本训练标签；基于所述训练样本集生成预测数据通过所述预训练的分类器获取判断结果，基于所述判断结果和样本训练标签计算第一交叉熵损失交叉熵损失n表示训练样本集μ的个数；重复迭代直至所述第一交叉熵损失取最小值，获得训练好的基于小样本数据增强的样本扩增模型和增强训练数据特征。4.根据权利要求1所述的基于增强小样本特征解耦的图像分类方法，其特征在于，所述特征解耦，通过特征解耦网络实现；所述特征解耦网络由预设个数的多粒度特征单元连接组成，所述多粒度特征单元包括：卷积神经网络子网络、transformer和细粒度特征融合器；其中transformer与卷积神经网络子网络并行，transformer的输入为粗粒度特征，卷积神经网络子网络的输入为特征
图，transformer的输出作为特征解耦网络的输出并同时输出至细粒度特征融合器；所述卷积神经网络子网络包括顺次连接的一个3
×
3卷积层、一个RELU激活层、一个均值池化层、一个1
×
1卷积层、一个RELU激活层和一个最大池化层；所述transformer包括一个多头注意力机制层和一个前馈神经网络。5.根据权利要求4所述的基于增强小样本特征解耦的图像分类方法，其特征在于，所述特征解耦网络，其处理方法为：基于所述增强训练数据特征，通过所述卷积神经网络子网络进行特征提取，获得第一细粒度特征，基于所述第一细粒度特征，通过细粒度特征融合器获得当前的多粒度特征单元的第二细粒度特征；首次迭代中，卷积神经网络子网络的输入为增强训练数据特征，在非首次迭代阶段卷积神经网络子网络的输入为前一个多粒度特征单元输出的第二细粒度特征；通过transformer的多头注意力机制层将第二细粒度特征...

【专利技术属性】
技术研发人员：王英雷，张右承，张力文，陈元培，黄旭辉，
申请(专利权)人：中国长峰机电技术研究设计院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人