一种融合关系选择和多尺度分布的小样本图像分类方法技术

技术编号：40074466 阅读：6 留言：0更新日期：2024-01-17 00:49

本发明专利技术公开了一种融合关系选择和多尺度分布的小样本图像分类方法。1、数据集获取和建立，训练阶段的支持集、查询集,以及测试阶段的辅助集；2、采用Conv‑64F作为特征提取器，得到初始特征对；3、将初始特征对分别输入到局部关系选择度量分支和全局特征分布度量分支；得到查询图像初步预测分数Ⅰ和Ⅱ；4、将得到的查询图像初步预测分数Ⅰ、Ⅱ进行合并，再输入到自适应融合层，得到查询图像属于各个类别的最终分数；5、最大分数对应的类别即为预测类别，与查询图像对应真实样本图像类别计算交叉熵损失函数并进行梯度回传更新模型参数。本发明专利技术所述模型有效提升了小样本学习准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及小样本学习领域，特别是涉及一种融合关系选择和多尺度分布的小样本图像分类方法。

技术介绍

1、随着大数据时代的到来，深度学习模型已经在图像分类、文本分类等任务中取得了先进成果。但深度学习模型的成功，很大程度上依赖于大量训练数据。而在现实世界的真实场景下，某些类别只有少量数据或少量标注数据，而对无标签数据进行标注将会消耗大量时间和人力。与此相反，人类非常擅长通过极少量的样本识别一个新物体，比如小孩子只需要书中的一些图片就可以认识什么是“老虎”，什么是“大象”。在人类的快速学习能力的启发下，研究人员希望机器学习模型在学习了一定类别的大量数据后，对于新的类别，只需要少量的样本就能快速学习，这就是few-shot learning要解决的问题。

2、目前小样本学习主要分为三大类别：基于迁移学习、基于度量学习和基于元学习。基于迁移学习已被广泛应用于许多领域，其是在一个经过预训练的基础网络上通过一定量的已标注数据进行微调。基于度量学习的方法主要是对样本间距离进行建模，使得在度量空间中同类样本紧凑异类样本远离。基于元学习方法旨在创建一个模型使得其可以适应多任务学习的场景，而对于小样本学习任务，由于每次的训练输入类别不一样，因此可以将每次的训练任务当成不同的学习任务，因此可以使用元学习的方法进行模型训练。

3、基于度量的小样本图像分类的核心思想是直接度量查询图像与支持图像之间的关系，从而学习可转移的特征嵌入。最近的一些工作表明，基于局部特征进行度量学习比基于图像级度量具有更加丰富的表示。例如li等人提出联合查

4、本专利技术提出新的模型结构，可以实现局部特征关系选择和更具代表性的全局特征分布。

技术实现思路

1、本专利技术提供一种融合关系选择和多尺度分布的小样本图像分类方法。该方法主要分为两大部分，第一部分围绕局部特征关系选择设计了一个全新模块用于关系筛选，自适应地对重要关系进行加权，抑制平凡关系。第二部分就是基于原始特征生成多尺度特征分布来衡量类的特征分布，融合不同尺度特征的分布信息来缓解单一尺度特征分布不具代表性的问题。实验结果表明，该方法比基准具有更高的准确率。

2、一种融合关系选择和多尺度分布的小样本图像分类方法，其步骤如下：

3、步骤(1)、数据集获取和建立，采用公共数据集miniimagenet。在小样本学习场景下，将数据集分为三个集合，训练阶段的支持集、查询集,以及测试阶段的辅助集。

4、步骤(2)、采用conv-64f作为特征提取器，将rgb图像输入该特征提取器得到初始特征对fq,fs。

5、步骤(3)、将初始特征对fq,fs分别输入到局部关系选择度量分支和全局特征分布度量分支。局部关系选择度量分支通过关系选择模块自主加权求和查询图像与支持类的局部关系，得到查询图像初步预测分数ⅰ；全局特征分布度量分支基于局部特征的统计信息来衡量查询图像与支持类之间分布的差异性，得到查询图像初步预测分数ⅱ；

6、步骤(4)、将步骤(3)两种策略下分别得到的查询图像初步预测分数ⅰ、ⅱ进行合并，再输入到自适应融合层，得到查询图像属于各个类别的最终分数。

7、步骤(5)、最大分数对应的类别即为预测类别，与查询图像对应真实样本图像类别计算交叉熵损失函数并进行梯度回传更新模型参数。

8、进一步的，步骤(1)中支持集和查询集共享相同的标签空间，与一般分类任务不同的是支持集和查询集都用于训练阶段。如果支持集s包含n类，每个类别包含k(例如1或5)个样本，则称这个小样本分类任务为n-way k-shot。需要说明的是，支持集在每个类中只有少量样本，对于一般分类任务是无法训练一个有效的深度学习网络。因此，通常引入辅助集作为测试阶段使用来学习可转移知识。与一般分类任务最大不同的是，一般辅助集比支持集拥有更多的类别且与支持集的标签空间不重叠。

9、步骤(2)、特征提取网络采用的是conv-64f，该结构包含4个卷积块，每个卷积块包含conv2d、batchnorm2d、relu、maxpool2d处理过程。该特征提取网络为rgb图像提取丰富的局部特征fω，具体公式表达如下：

10、

11、其中，fω是一个三维特征矩阵，ω表示网络参数。将fω(x)看成c×n个局部特征组成的特征矩阵，xi表示特征矩阵中第i个局部特征，c表示特征通道数，n表示局部特征数目，也就是n＝w×h，w、h分别表示特征矩阵的宽和高。对于每一个支持类，该类中所有图像都映射到空间中用来表示该类的原始特征分布情况，对于每个查询图像，n个局部特征用来估计该查询图像在空间中的分布。

12、步骤(3)中对于局部关系选择度量分支，本专利技术设计了一个局部关系选择模块。局部关系就是查询图像在空间中每个特征向量与查询集某一类在空间中所有局部特征之间的余弦相似度，取最大值即为该局部特征与该支持类的余弦相似度。更进一步说，对查询图像的所有局部特征进行类似操作，得到该查询图像属于该类的原始余弦相似度分数ⅰ，具体公式表达如下：

13、

14、其中，s表示支持集某一类所有样本，k1表示该类样本数量，q表示待预测的查询图像。topk(.)表示从某一类所有样本s中选择k个最高相似度分数作为q在某一处局部特征与该类的相似度，local表示局部关系选择度量分支。预测的查询图像q中n个局部特征计算的相似度分数之和，即就是该待预测的查询图像q属于s类别的分数值。

15、待预测的查询图像q的n个局部特征并不能完全代表图像前景特征，可能有背景特征干扰。因此，该专利技术设计了一个局部特征关系选择模块用于对这n个局部特征相似度进行加权求和，自适应选择前景特征对应的重要关系，抑制背景特征对应的平凡关系，而不是公式2中的简单求和。

16、局部特征关系选择模块的输入是特征提取模块得到的特征对fq，fs，输出的是待预测的查询图像q对应的相似度权重图aq。首先使用1*1卷积核对特征对fq，fs进行降维，即通道数c转为c'，降维后特征对变为接着计算降维后特征对的余弦相似度公式如下：

17、

18、其中，x表示特征图的局部特征，xq表示查询图像的局部特征，xs表示支持集某一类图像的局部特征；sim(.,.)表示两个局部特征之间的余弦相似度。然后将余弦相似度输入到由两层四维卷积的模块得到优化后的相似度张量目的是消除不可靠的相似度，将优化后的相似度张量计算相似度权重图aq。aq揭示了查询图像各个局部特征在衡量查询图像属于某一类可能性的权重，具体公式表达本文档来自技高网...

【技术保护点】

1.一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于包括如下步骤：

2.根据权利要求1所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(1)中支持集和查询集共享相同的标签空间，且在该方法中支持集和查询集都用于训练阶段。

3.根据权利要求1所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(2)中特征提取网络采用的是Conv-64F，该结构包含4个卷积块，每个卷积块包含Conv2d、BatchNorm2d、Relu、MaxPool2d处理过程；该特征提取网络为RGB图像提取丰富的局部特征Fω，具体公式表达如下：

4.根据权利要求1或2或3所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(3)中的局部关系选择度量分支设计有一个局部关系选择模块；计算该查询图像属于支持集某一类的原始余弦相似度分数Ⅰ，具体公式表达如下：

5.根据权利要求4所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(3)中的全局特征分布度量分支采用卷积注意力机制模块，在输入

6.根据权利要求5所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于将特征提取器提取的特征对Fq，Fs，即将查询图像对应的特征Fq，支持集对应的某一类特征Fs输入到卷积注意力机制模块提取不同尺度特征，采用21*21、15*15、10*10、7*7作为输出特征尺度集L；对于某一种尺度，分别计算出查询图像特征Fq和支持集某一类特征Fs的分布统计信息；假设服从高斯分布，查询图像特征分布服从支持集某一类的特征分布服从其中分别表示均值向量和协方差矩阵；利用KL散度计算查询图像与支持集某一类在某一尺度下特征分布的相似度，将所有尺度下的特征分布相似度进行求和得到基于多尺度特征分布度量结果，具体公式表达如下：

7.根据权利要求6所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(4)设计有自适应融合模块，将局部关系选择度量分支得到的查询图像初步预测分数Ⅰ和全局特征分布度量分支得到的查询图像初步预测分数Ⅱ进行自适应加权求和；该自适应融合模块采用一个可学习的二维权值向量[ω1,ω2]，来实现自主加权两种分数，具体公式表达如下：

...

【技术特征摘要】

1.一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于包括如下步骤：

3.根据权利要求1所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(2)中特征提取网络采用的是conv-64f，该结构包含4个卷积块，每个卷积块包含conv2d、batchnorm2d、relu、maxpool2d处理过程；该特征提取网络为rgb图像提取丰富的局部特征fω，具体公式表达如下：

4.根据权利要求1或2或3所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(3)中的局部关系选择度量分支设计有一个局部关系选择模块；计算该查询图像属于支持集某一类的原始余弦相似度分数ⅰ，具体公式表达如下：

5.根据权利要求4所述的一种融合关系选择和多尺度分布的小样本图像分类方法，其特征在于步骤(3)中的全局特征分布度量分支采用卷积注意力机制模块，在输入特征图上串行执行通道级注意力模块、空间级注意力模块；给定特征提取器提取的特征对fq，fs，通道级注意力模块得到各个通道的权重关系；通道注意力模...

【专利技术属性】
技术研发人员：谭敏，金涛，卢陈烨，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人