System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于数据增强的小样本学习方法技术_技高网

一种基于数据增强的小样本学习方法技术

技术编号:40927087 阅读:2 留言:0更新日期:2024-04-18 14:49
本发明专利技术提供了一种基于数据增强的小样本学习方法。该方法包括:通过RotMix模块和RotCom模块对源数据进行数据增强处理,将增强后的数据传输给MixNet模型;MixNet模型通过特征提取模块、类别多样性编码模块对增强后的数据集进行特征提取与编码,得到特征表示;MixNet模型通过对比学习模块对所述特征表示进行对比学习,得到优化后的特征表示,通过比较不同样本对的特征表示,优化MixNet模型的区分能力;将优化后的特征表示转换为源数据的分类结果,并进行展示。本发明专利技术方法从数据增强开始,通过RotMix和RotCom引入多样性和复杂性,再经由MixNet模型进行深度特征提取和类别多样性编码。对比学习模块进一步优化了模型的区分能力。最终将处理结果以用户友好的方式呈现。

【技术实现步骤摘要】

本专利技术涉及机器学习,尤其涉及一种基于数据增强的小样本学习方法


技术介绍

1、小样本学习(few-shot learning,fsl)是机器学习领域的一个重要分支,它致力于解决如何让模型在仅有少量样本的情况下进行有效学习和泛化的问题。这一领域的研究对于实现更加智能和适应性强的人工智能系统至关重要,尤其是在那些难以获取大量标记数据的应用场景中。

2、元学习(meta-learning)是fsl中常用的一种方法,通过训练模型学习如何快速适应新任务,即“学会学习”。例如,模型在多种任务上进行训练,每个任务仅提供少量样本,以此来提高模型对新任务的适应能力。

3、嵌入学习(embedding learning)通常用于特征提取,目的是将高维数据转换为低维空间中的紧凑表示。这种方法使得模型能够更有效地区分不同类别的样本。

4、为了克服样本不足的问题,数据增强技术被广泛应用于fsl。这些技术通过变换原始样本(如旋转、缩放、剪裁)来人为增加数据多样性。在小样本学习领域,模型通常面临的挑战是必须从极少量的样本中学习并能够有效地适应和识别新的、未见过的类别。这一挑战的核心在于,传统的深度学习模型通常需要大量的标记数据来训练,以达到良好的性能。然而,在现实世界的许多应用场景中,尤其是那些需要快速适应新类别的场合,获取大量的标记数据是不现实的。因此,如何使深度学习模型在只有少量标记样本的情况下仍能有效学习并适应新类别,成为了一项紧迫的技术问题。

5、现有技术中的一种数据增强技术cutmix通过从一个图像中切割出一个区域并将其粘贴到另一个图像中,以此来创建新的混合图像。cutmix方法的重点是在图像之间进行局部区域的混合,而不是全图的混合或旋转。

6、现有技术中的另一种数据增强技术mixup通过线性组合两个图像及其对应的标签来生成新的训练样本。mixup方法是在像素级别的线性混合,而不涉及旋转或颜色变换。

7、现有技术中的另一种数据增强技术autoaugment使用搜索算法来探索最佳的增强策略组合,包括颜色调整、剪裁和旋转等操作。autoaugment的方法是基于算法自动确定最佳策略,而不是固定的旋转和颜色变换组合。

8、上述现有技术中的数据增强方法的缺点包括:这些现有方法需要大量标记数据来实现有效训练。这种依赖限制了模型在标记数据稀缺的场景中的应用。在实际应用中,尤其是新领域或特定任务中,获取大量高质量标记数据既困难又昂贵。

9、这些现有方法往往专注于在大数据集上的性能优化,可能导致模型对训练数据过拟合,而在未见过的新类别上表现不佳。这种方法在小样本学习或快速适应新类别的任务中效果不佳,泛化能力有限。

10、这些现有方法采用如旋转、缩放等简单的几何变换,它们主要设计用于处理大规模的标记数据,在fsl场景中无法提供足够的样本多样性来支持模型学习更复杂的特征,这些方法在提升模型对新领域或复杂任务的适应性方面有限。


技术实现思路

1、本专利技术的实施例提供了一种基于数据增强的小样本学习方法,以实现有效地提高小样本学习的性能。

2、为了实现上述目的,本专利技术采取了如下技术方案。

3、一种基于数据增强的小样本学习方法,包括:

4、通过rotmix模块和rotcom模块对源数据进行数据增强处理,将增强后的数据传输给mixnet模型;

5、所述mixnet模型通过特征提取模块、类别多样性编码模块对增强后的数据集进行特征提取与编码,得到特征表示;

6、所述mixnet模型通过对比学习模块对所述特征表示进行对比学习,得到优化后的特征表示,通过比较不同样本对的特征表示,优化mixnet模型的区分能力;

7、将优化后的特征表示转换为源数据的分类结果,并进行展示。

8、优选地,所述的通过rotmix模块和rotcom模块对源数据进行数据增强处理,将增强后的数据传输给mixnet模型,包括:

9、接收输入的源数据,该源数据包括图像数据,通过rotmix模块对原始图像进行旋转操作,生成多个旋转后的图像,在混合过程中两个或多个旋转后的图像被结合在一起,得到包含了原始图像的特征的新图像;

10、通过rotcom模块对原始图像进行旋转操作,通过在不同角度旋转图像来模拟不同的视角和环境条件,对旋转后的图像进行颜色变换,颜色变换包括调整图像的色调、饱和度和亮度,得到包含了原始图像的特征的新图像;

11、将所述rotmix模块和所述rotcom模块处理后的新图像组成增强后的数据集。

12、优选地,所述的mixnet模型通过特征提取模块、类别多样性编码模块对增强后的数据集进行特征提取与编码,得到特征表示,包括:

13、增强后的数据输入到mixnet模型,mixnet模型通过特征提取模块中的卷积层、池化层对增强后的数据进行特征提取,在特征提取的基础上,通过类别多样性编码模块对数据进行编码,得到所述源数据的具有类别信息的特征表示。

14、优选地,所述的mixnet模型通过特征提取模块、类别多样性编码模块对增强后的数据集进行特征提取与编码,得到特征表示,包括:

15、将优化后的特征表示转换为所述源数据的分类结果,使用损失函数来评估mixnet模型的分类性能,得到mixnet模型的分类准确率数据,根据所述分类准确率数据通过优化器调整mixnet模型的参数;

16、将所述源数据的分类结果通过用户界面或应用程序编程接口api传送给用户。

17、由上述本专利技术的实施例提供的技术方案可以看出,本专利技术实施例方法从数据增强开始,通过rotmix和rotcom引入多样性和复杂性,再经由mixnet模型进行深度特征提取和类别多样性编码。对比学习模块进一步优化了模型的区分能力。最终将处理结果以用户友好的方式呈现。

18、本专利技术附加的方面和优点将在下面的描述中部分给出,这些将从下面的描述中变得明显,或通过本专利技术的实践了解到。

本文档来自技高网...

【技术保护点】

1.一种基于数据增强的小样本学习方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述的通过RotMix模块和RotCom模块对源数据进行数据增强处理,将增强后的数据传输给MixNet模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述的MixNet模型通过特征提取模块、类别多样性编码模块对增强后的数据集进行特征提取与编码,得到特征表示,包括:

4.根据权利要求2所述的方法,其特征在于,所述的MixNet模型通过特征提取模块、类别多样性编码模块对增强后的数据集进行特征提取与编码,得到特征表示,包括:

【技术特征摘要】

1.一种基于数据增强的小样本学习方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述的通过rotmix模块和rotcom模块对源数据进行数据增强处理,将增强后的数据传输给mixnet模型,包括:

3.根据权利要求2所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:张宝鹏马昆昆滕竹张振梁谷秋航龚爽
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1