一种基于小样本训练数据增强得到高精度模型的方法技术

技术编号:36552391 阅读:14 留言:0更新日期:2023-02-04 17:06
本发明专利技术公开了一种基于小样本训练数据增强得到高精度模型的方法,用基类数据对单分支网络进行预训练,得到第一网络,将第一网络作为双分支网络的一个分支,再用基类数据对双分去网络进行训练,得到第二网络,用新类数据和基类数据,采用数据增强方法进行数据扩展,基于扩展的数据变量集,对第二网络进行参数微调,得到高精度模型;数据增强方法包括在检测过程的每个阶段,分别提取该阶段的基类数据和新类数据的变量,将基类数据变量与新类数据相应的变量进行完全交叉叠加,得到扩展的数据变量集。本申请拓展了应用范围,节约了成本。节约了成本。节约了成本。

【技术实现步骤摘要】
一种基于小样本训练数据增强得到高精度模型的方法


[0001]本专利技术涉及网络训练
,尤其是涉及一种基于小样本训练数据增强得到高精度模型的方法。

技术介绍

[0002]深度学习目标检测方法,依赖样本的数据的分布与数量,需要足够多的已标注样本的来支持检测效果。但是这样会引入较高的制作成本。在有大量样本数据的情况下,模型训练误差很小。如果样本数量足够大,模型训练误差甚至可以趋于0。
[0003]目前主流的无监督、半监督模型无法很好的拟合实际业务需求,因此现阶段主要使用的是先进的基于监督学习的模型(yolo系列,faster/mask RCNN系列),而监督学习模型需要大量的带标注数据(图片)进行模型的训练随着深度学习的兴起,基于监督学习模型的计算机视觉技术得到了不断的发展,其中尤为显著的便是以目标检测和实例分割为代表的物体检测技术,在各行各业都有着不错的落地方案,但是由于监督学习模型需要大量的标注数据进行针对于特定场景的拟合,在实际落地应用场景中很难提取到大量高质量的图像进行模型训练。在初高中化学实验的智能考评系统中,在传统的深度学习框架及流程下,学校端提供的视频和公司内部员工录制的视频不足以支撑高精度、大批量的模型训练,小样本目标检测方法主要基于目标检测中的小样本学习。目前主流的目标检测方法分为基于候选区域的方法和不需要候选区域的方法。前者主要是在深度学习框架中卷积层提取特征图之后生成一系列候选区域,然后根据这些区域进行分类和边界框回归借此得到少量拟合目标物体的边界框。后者是在卷积网络体征提取之后直接预测边界框和相对应的分类标注。
[0004]目前主流的小样本学习方法主要分为三种:最优化法、参数生成法、度量学习法。最优化法主要是优化训练步骤,旨在用最少的步骤,完成对于图像新特征的学习,比如Model

Agnostic Meta

Learning (MAML);参数生成法主要是基于注意力权重生成器针对新的特征类生成一系列的分类参数;度量学习法是基于训练数据的基类去学习一个可泛化的相似度度量空间,来拟合小样本训练数据和真实预测数据的差距,典型的有利用prototypical网络,通过对小样本全局特征求平均值后再利用最近领域搜索法进行分类操作计算新类的典例。
[0005]最后,基于小样本的目标检测方法主要分为单分支和双分支两种。小样本检测方法和传统检测方法本质的区别是前者不仅可以通过已知的少量样本对全新样本进行识别,还能对其进行定位。单分支小样本检测主要是基于长尾训练数据中的基类和新类,对FasterRCNN模型进行优化,在神经网络末端分类层的检测头中构建多尺度的分类器。双分支小样本检测通常是构建耦合网络,分别同时提取query特征和support特征,然后基于度量学习方法如:特征融合、特征一致、图卷积网络等来计算两个分支的相似性,该类方法相较于单分支小样本检测而言在新类上无需构建多尺度分类器,所以泛化性更好。
[0006]如何在小样本时增加训练数据量,提高模型精度,是目前亟待解决的问题。

技术实现思路

[0007]本专利技术的目的是提供一种基于小样本训练数据增强得到高精度模型的方法,在检测过程的每一阶段,将基类数据与新类数据的变量进行完全交叉,得到扩展的数据集,用于模型训练,提高模型精度。
[0008]第一方面,本专利技术的上述专利技术目的通过以下技术方案得以实现:一种基于小样本训练数据增强的方法,在检测过程的每个阶段,分别提取该阶段的基类数据和新类数据的变量,将基类数据变量与新类数据相应的变量进行完全交叉叠加,得到扩展的数据变量集。
[0009]本专利技术进一步设置为:所述变量包括需要请求进行访问模型的第一变量、每个第一变量所对应指令的第二变量、每个第二变量所代表的指令变量的第一值;将基类数据的第二变量、新类数据的第二变量、基类数据的第一值、新类数据的第一值进行相互的交叉叠加,得到四个信息量不同的第二变量、第一值配对组,在每个配对组中进行基类数据的第一变量、新类数据的第一变量的交叉,得到扩展的数据变更集。
[0010]本专利技术进一步设置为:在每个配对组中进行基类数据的第一变量、新类数据的第一变量的交叉点乘,得到扩展的数据变更集。
[0011]本专利技术进一步设置为:将新类数据的第一变量复制N倍,得到新类数据的第一集合,将基类数据的第二变量、第一集合数据的第二变量、基类数据的第一值、第一集合数据的第一值进行相互的交叉叠加,得到四个信息量不同的第二变量、第一值配对组。
[0012]本专利技术进一步设置为:在检测头部分,第一变量提取完候选框之后,经过ROIalign层,得到ROI特征和与新类分支对应图像的相似度过程中,对新类数据进行全局平均操作,得到新类数据的第二集合,分别提取基类数据和第二集合数据的变量,将基类数据变量与第二集合数据相应的变量进行完全交叉叠加,得到扩展的数据变量集,用于检测头部分训练。
[0013]本专利技术进一步设置为:对新类数据进行全局平均操作包括:在每一个候选区域,对所有的候选框新类数据求和后再除以N,得到新类数据的第二集合。
[0014]本专利技术进一步设置为:基于扩展的数据变量集,进行至少一次的数据增强,在每一阶段,分别提取该阶段的基类数据和新类数据的变量,将基类数据变量与新类数据相应的变量进行完全交叉叠加,得到再次扩展的数据变量集。
[0015]第二方面,本专利技术的上述专利技术目的通过以下技术方案得以实现:一种基于小样本训练数据增强的结构,包括依次链接的完全交叉注意力特征主干网络、完全交叉注意力ROI特征提取器、成对匹配机制,候选框生成器位于完全交叉注意力特征主干网络、完全交叉注意力ROI特征提取器之间,完全交叉注意力特征主干网络用于基类数据变量与新类数据变量的完全交叉叠加,候选框生成器用于生成候选框,完全交叉注意力ROI特征提取器用于提取ROI特征并进行数据平均后,再进行数据完全交叉叠加。
[0016]第三方面,本专利技术的上述专利技术目的通过以下技术方案得以实现:一种基于小样本训练得到高精度模型的方法,用基类数据对单分支网络进行预训练,得到第一网络,将第一网络作为双分支网络的一个分支,再用基类数据对双分去网络进
行训练,得到第二网络,用新类数据和基类数据,采用所述数据增强方法,基于扩展的数据变量集,对第二网络进行参数微调,得到高精度模型。
[0017]第四方面,本专利技术的上述专利技术目的通过以下技术方案得以实现:一种基于小样本训练得到高精度模型终端,包括存储器、处理器、以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请所述方法。
[0018]与现有技术相比,本申请的有益技术效果为:1.本申请通过在检测的每个阶段,将基类数据的变量与新类数据变量进行完全交叉,增强了数据量;2.进一步地,本申请将新类数据变量复制N倍,用于与基类数据变量进行完全交叉,进一步增强了数据量;3.进一步地,本申请基于单支小样本和双分支小样本模型,采用拓展数据对双分支小样本模型进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于小样本训练数据增强的方法,其特征在于:在检测过程的每个阶段,分别提取该阶段的基类数据和新类数据的变量,将基类数据变量与新类数据相应的变量进行完全交叉叠加,得到扩展的数据变量集。2.根据权利要求1所述基于小样本训练数据增强的方法,其特征在于:所述变量包括需要请求进行访问模型的第一变量、每个第一变量所对应指令的第二变量、每个第二变量所代表的指令变量的第一值;将基类数据的第二变量、新类数据的第二变量、基类数据的第一值、新类数据的第一值进行相互的交叉叠加,得到四个信息量不同的第二变量、第一值配对组,在每个配对组中进行基类数据的第一变量、新类数据的第一变量的交叉,得到扩展的数据变更集。3.根据权利要求2所述基于小样本训练数据增强的方法,其特征在于:在每个配对组中进行基类数据的第一变量、新类数据的第一变量的交叉点乘,得到扩展的数据变更集。4.根据权利要求2所述基于小样本训练数据增强的方法,其特征在于:将新类数据的第一变量复制N倍,得到新类数据的第一集合,将基类数据的第二变量、第一集合数据的第二变量、基类数据的第一值、第一集合数据的第一值进行相互的交叉叠加,得到四个信息量不同的第二变量、第一值配对组。5.根据权利要求1所述基于小样本训练数据增强的方法,其特征在于:在检测头部分,第一变量提取完候选框之后,经过ROIalign层,得到ROI特征和与新类分支对应图像的相似度过程中,对新类数据进行全局平均操作,得到新类数据的第二集合,分别提取基类数据和第二集合数据的变量,将基类数据变量与第二集合数据相应的变量进行完全交叉叠加,得到扩展的数据变量集,用于检测头部分训练。6.根据权利要求5所述基于...

【专利技术属性】
技术研发人员:刘利非李丽王庆峰
申请(专利权)人:上海锡鼎智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1