基于类间距离扩张的实例级小样本学习方法技术

技术编号：41303132 阅读：4 留言：0更新日期：2024-05-13 14:49

本发明专利技术涉及一种基于类间距离扩张的实例级小样本学习方法，属于图像处理技术领域。该方法为：S1：划分数据集，将小样本数据集划分为训练集、验证集和测试集，并在每个划分数据集内划分支持集和查询集；S2：构建网络模型，通过复杂的卷积神经网络提取图像特征；S3：通过基于实例的预训练让模型学习到可转移的分类能力，通过扩张损失在小样本训练阶段让不同类间距离扩张以获取清晰的类别边界；S4：将支持集和查询集图片输入训练好的网络提取特征，再经过距离度量函数判别每个查询图片对应的支持集类别。本发明专利技术能够缓解相似类在特征空间中的类别边界过于邻近导致误分类的情况。基于旋转角度分类的预训练帮助模型学习到更多可泛化知识。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理，涉及一种基于类间距离扩张的实例级小样本学习方法。

技术介绍

1、深度学习已经在图像分类、自然语言处理等任务中取得了优异成绩。但许多以深度学习为基础的算法和模型都严重依赖于大量训练数据。但实际中，可能存在某些类别图像数据缺乏或者标记样本较少，导致大量的标记数据难以获取，因此会严重影响到分类模型对不同物体的识别。而反观人类识别物体的方式，人类只需要通过少量数据就能做到快速学习。例如，对于一个从未见过真实北极熊的人来说，想让他认出北极熊并不难，只需要给他一张北极熊图像的照片，通过对比就能认出哪个动物是北极熊。这与机器学习需要大量数据训练才能具备识别能力的方式完全不同，因此为了让机器学习更加靠近人类思维，缩小机器和人类之间在图像识别上的差距，小样本学习的概念被提出。

2、近年来，小样本学习在自然图像领域也展现出了巨大优势，目前研究领域的工作主要分为三个类别：1)基于数据增强的小样本算法是利用辅助数据或者辅助信息，通过生成或者扩充样本从而扩充同类别的参考数据集，进而增强类内样本方差、实现类内样本的多样化，最终让该类的决策边界更加明显；2)度量学习是指通过距离度量函数去计算两个样本之间的距离值，但由于直接计算两个未经处理的样本之间的距离会严重受到图像本身一些不相关因素的影响，所以在进行度量之前会先通过卷积神经网络过滤掉图像的一些高维特征，侧重获取图像本身的语义特征；3)元学习是指让模型学会学习的过程。通过在大量任务上进行训练，模型可以学会如何在新任务上快速适应。

技术实现思路</b>

1、有鉴于此，本专利技术的目的在于提供一种基于类间距离扩张的实例级小样本学习方法，通过优化得到清晰的类别边界，同时复杂分类任务帮助模型学习到快速适应新任务的能力，从而有助于分类。

2、为达到上述目的，本专利技术提供如下技术方案：

3、基于类间距离扩张的实例级小样本学习方法，该方法包括以下步骤：

4、s1：读取小样本数据集，对小样本数据集进行预处理，然后将预处理后得到的图像划分为训练集、验证集和测试集；

5、s2：构建网络，包括特征提取网络和角度相关性网络；

6、s3：将训练集数据进行四个角度的旋转，输入网络进行旋转角度分类预训练；

7、s4：将训练集输入小样本分类网络进行训练，并结合扩张损失优化类间距离、利用角度相关性网络为图像附加与其他图片的对比信息遮盖层以助于分类；

8、s5：然后将验证集输入训练好的小样本分类网络模型得到每个带查询图像属于每个类别的概率。

9、进一步，所述s1中，对小样本数据集进行预处理具体包括以下步骤：

10、s11：加载数据集，将数据集划分为三个数据集，图像默认长宽为84像素；

11、s12：对图像进行归一化，对每个通道除以255.0，以将它们从原始的像素值，在0到255之间，转换为0到1之间的值；

12、s13：将每张图像长宽调整为92像素；

13、s14：从图像中心裁剪出长宽为64像素大小的图像。

14、进一步，所述s2中，网络的编码结构包括由卷积神经网络构成的特征提取器和由transformer网络构成的角度信息捕获网络，特征提取器负责对输入的图像进行编码，提取图像中相关的特征信息并生成对应的特征向量；角度信息捕获网络由多个网络模块构成，在应用于图像的transformer网络中，数据集被分成一系列固定大小的批次，这些批次的图像通过自注意力机制进行交互，以建模图像的上下文信息；自注意力机制允许每个批次的图像关注其他所有批次的图像的信息，捕捉到图像的全局信息；除自注意力机制外，transformer网络还包含两个额外的层：前馈神经网络和位置编码；前馈神经网络用于捕捉局部特征，而位置编码则用于捕捉每个批次图片的位置信息。

15、进一步，所述s3中，进行旋转角度分类预训练的流程为：输入训练集中的单个训练集样例(ei)并进行四个角度的旋转得到并记录对应的角度信息对er和ei经过特征提取器进行编码得到对应特征向量(pr,pi)，通过计算旋转pi与其他旋转特征向量pr进行对比得到其对应的旋转角度，最后通过交叉熵损失函数计算损失，进行训练；通过该阶段的预训练可以让模型学习对图像的表征能力，让模型在面对新的、未见过的数据时，能够提供一种“先验知识”，帮助模型更好地理解新的数据。

16、进一步，所述s4中，模型在训练集中进行小样本训练，每次训练任务为一个情节，包括支持集样本sbase和查询集样本qbase，将所有样本同样经过四个角度旋转后，输入上述网络经过特征提取，首先通过度量函数判别查询集特征向量类别，计算每个类别原型与其他类别原型的距离并结合距离损失约束类间距离以进行距离优化的小样本训练；其次在小样本场景下进行旋转角度分类预训练；最后通过transformer为每个样本附加与其他样本的互相关信息并进行旋转角度分类训练。

17、进一步，所述s4中，transformer网络的结构为：

18、attention(q,k,v)＝(fi*wq，fi*wk，fi*wv)

19、

20、ri＝max(0,zw1+b1)w2+b2

21、

22、其中，fi代表输入的第i个样本，(wq、wk、wv)分别代表注意力网络中三个全连接层的参数，dk是特征维度层数，(w1、w2、b1、b2)为前馈神经网络的权重和偏差。

23、本专利技术的有益效果在于：本专利技术利用旋转策略进行增强的多分类任务能让模型学习到更多的可转移知识，有助于转移到新任务分类。另外，通过类间距离优化损失扩大类间距离，缓解了在小样本分类场景下相似类别的误分类情况。

24、本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。

本文档来自技高网...

【技术保护点】

1.基于类间距离扩张的实例级小样本学习方法，其特征在于：该方法包括以下步骤：
2.根据权利要求1所述的基于类间距离扩张的实例级小样本学习方法，其特征在于：所述S1中，对小样本数据集进行预处理具体包括以下步骤：
3.根据权利要求1所述的基于类间距离扩张的实例级小样本学习方法，其特征在于：所述S2中，网络的编码结构包括由卷积神经网络构成的特征提取器和由Transformer网络构成的角度信息捕获网络，特征提取器负责对输入的图像进行编码，提取图像中相关的特征信息并生成对应的特征向量；角度信息捕获网络由多个网络模块构成，在应用于图像的Transformer网络中，数据集被分成一系列固定大小的批次，这些批次的图像通过自注意力机制进行交互，以建模图像的上下文信息；自注意力机制允许每个批次的图像关注其他所有批次的图像的信息，捕捉到图像的全局信息；除自注意力机制外，Transformer网络还包含两个额外的层：前馈神经网络和位置编码；前馈神经网络用于捕捉局部特征，而位置编码则用于捕捉每个批次图片的位置信息。
4.根据权利要求1所述的基于类间距离扩张的实例级小样
5.根据权利要求4所述的基于类间距离扩张的实例级小样本学习方法，其特征在于：所述S4中，模型在训练集中进行小样本训练，每次训练任务为一个情节，包括支持集样本Sbase和查询集样本Qbase，将所有样本同样经过四个角度旋转后，输入上述网络经过特征提取，首先通过度量函数判别查询集特征向量类别，计算每个类别原型与其他类别原型的距离并结合距离损失约束类间距离以进行距离优化的小样本训练；其次在小样本场景下进行旋转角度分类预训练；最后通过Transformer为每个样本附加与其他样本的互相关信息并进行旋转角度分类训练。
6.根据权利要求5所述的基于类间距离扩张的实例级小样本学习方法，其特征在于：所述S4中，Transformer网络的结构为：
...

【技术特征摘要】

1.基于类间距离扩张的实例级小样本学习方法，其特征在于：该方法包括以下步骤：
2.根据权利要求1所述的基于类间距离扩张的实例级小样本学习方法，其特征在于：所述s1中，对小样本数据集进行预处理具体包括以下步骤：
3.根据权利要求1所述的基于类间距离扩张的实例级小样本学习方法，其特征在于：所述s2中，网络的编码结构包括由卷积神经网络构成的特征提取器和由transformer网络构成的角度信息捕获网络，特征提取器负责对输入的图像进行编码，提取图像中相关的特征信息并生成对应的特征向量；角度信息捕获网络由多个网络模块构成，在应用于图像的transformer网络中，数据集被分成一系列固定大小的批次，这些批次的图像通过自注意力机制进行交互，以建模图像的上下文信息；自注意力机制允许每个批次的图像关注其他所有批次的图像的信息，捕捉到图像的全局信息；除自注意力机制外，transformer网络还包含两个额外的层：前馈神经网络和位置编码；前馈神经网络用于捕捉局部特征，而位置编码则用于捕捉每个批次图片的位置信息。
4.根据权利要求1所述的基于类间距离扩张的实例级小...

【专利技术属性】
技术研发人员：栾晓，何子剑，叶昌昊，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种光器件胶水固化装置制造方法及图纸
下一篇：一种汽车座椅骨架定型设备制造技术

相关技术

一种无人机全方位无线充电装置及充电方...

一种基于条件代理重加密的智能网联汽车...

一种基于斑块元胞自动机的土地利用变化...

一种基于聚合时空多图卷积网络改进的交...

基于数字孪生的车联网任务卸载方法技术

一种营销话题关键用户的识别方法、装置...

一种基于格的低轨卫星网络轻量级接入认...

一种骨导传感器辅助的广义旁瓣消除方法...

基于光子晶体的太赫兹波导缝隙天线及系...

一种基于STM32的微型湿度传感器制...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

一种安全可逆的人脸图像处理方法及系统...

一种自动化车型软件升级方法、装置、设...

生成表情动画的方法、装置、存储介质及...

基于向量化的异构多域处理器的LBM自...

一种提高连铸结晶器内腔锥度设计精度的...

一种直流特高压输电线路简化抗震分析方...

一种城市排水网络优化设计方法及系统技...

指纹注册方法、装置、电子设备及存储介...