一种基于小样本训练数据增强得到高精度模型的方法技术

技术编号：36552391 阅读：14 留言：0更新日期：2023-02-04 17:06

本发明专利技术公开了一种基于小样本训练数据增强得到高精度模型的方法，用基类数据对单分支网络进行预训练，得到第一网络，将第一网络作为双分支网络的一个分支，再用基类数据对双分去网络进行训练，得到第二网络，用新类数据和基类数据，采用数据增强方法进行数据扩展，基于扩展的数据变量集，对第二网络进行参数微调，得到高精度模型；数据增强方法包括在检测过程的每个阶段，分别提取该阶段的基类数据和新类数据的变量，将基类数据变量与新类数据相应的变量进行完全交叉叠加，得到扩展的数据变量集。本申请拓展了应用范围，节约了成本。节约了成本。节约了成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于小样本训练数据增强得到高精度模型的方法

[0001]本专利技术涉及网络训练
，尤其是涉及一种基于小样本训练数据增强得到高精度模型的方法。

技术介绍

[0002]深度学习目标检测方法，依赖样本的数据的分布与数量，需要足够多的已标注样本的来支持检测效果。但是这样会引入较高的制作成本。在有大量样本数据的情况下，模型训练误差很小。如果样本数量足够大，模型训练误差甚至可以趋于0。
[0003]目前主流的无监督、半监督模型无法很好的拟合实际业务需求，因此现阶段主要使用的是先进的基于监督学习的模型（yolo系列，faster/mask RCNN系列），而监督学习模型需要大量的带标注数据（图片）进行模型的训练随着深度学习的兴起，基于监督学习模型的计算机视觉技术得到了不断的发展，其中尤为显著的便是以目标检测和实例分割为代表的物体检测技术，在各行各业都有着不错的落地方案，但是由于监督学习模型需要大量的标注数据进行针对于特定场景的拟合，在实际落地应用场景中很难提取到大量高质量的图像进行模型训练。在初高中化学实验的智能考评系统中，在传统的深度学习框架及流程下，学校端提供的视频和公司内部员工录制的视频不足以支撑高精度、大批量的模型训练，小样本目标检测方法主要基于目标检测中的小样本学习。目前主流的目标检测方法分为基于候选区域的方法和不需要候选区域的方法。前者主要是在深度学习框架中卷积层提取特征图之后生成一系列候选区域，然后根据这些区域进行分类和边界框回归借此得到少量拟合目标物体的边界框。后者是在卷积网络体征提取之后直接预测...

【技术保护点】

【技术特征摘要】
1.一种基于小样本训练数据增强的方法，其特征在于：在检测过程的每个阶段，分别提取该阶段的基类数据和新类数据的变量，将基类数据变量与新类数据相应的变量进行完全交叉叠加，得到扩展的数据变量集。2.根据权利要求1所述基于小样本训练数据增强的方法，其特征在于：所述变量包括需要请求进行访问模型的第一变量、每个第一变量所对应指令的第二变量、每个第二变量所代表的指令变量的第一值；将基类数据的第二变量、新类数据的第二变量、基类数据的第一值、新类数据的第一值进行相互的交叉叠加，得到四个信息量不同的第二变量、第一值配对组，在每个配对组中进行基类数据的第一变量、新类数据的第一变量的交叉，得到扩展的数据变更集。3.根据权利要求2所述基于小样本训练数据增强的方法，其特征在于：在每个配对组中进行基类数据的第一变量、新类数据的第一变量的交叉点乘，得到扩展的数据变更集。4.根据权利要求2所述基于小样本训练数据增强的方法，其特征在于：将新类数据的第一变量复制N倍，得到新类数据的第一集合，将基类数据的第二变量、第一集合数据的第二变量、基类数据的第一值、第一集合数据的第一值进行相互的交叉叠加，得到四个信息量不同的第二变量、第一值配对组。5.根据权利要求1所述基于小样本训练数据增强的方法，其特征在于：在检测头部分，第一变量提取完候选框之后，经过ROIalign层，得到ROI特征和与新类分支对应图像的相似度过程中，对新类数据进行全局平均操作，得到新类数据的第二集合，分别提取基类数据和第二集合数据的变量，将基类数据变量与第二集合数据相应的变量进行完全交叉叠加，得到扩展的数据变量集，用于检测头部分训练。6.根据权利要求5所述基于...

【专利技术属性】
技术研发人员：刘利非，李丽，王庆峰，
申请(专利权)人：上海锡鼎智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人