一种图像数据自动增强的方法技术

技术编号:26224005 阅读:52 留言:0更新日期:2020-11-04 10:57
本发明专利技术公开一种图像数据自动增强的方法,首先将图像形成图像块后建立图模型,将图像块建立为图节点,将数据增强的操作和参数抽象成图结构中边,再将图像送入基于特征金字塔网络进行图像检测,只输出人体用边界框标记的人体图像;图像裁剪成预定格式大小,并通过自动数据增强的图模型将参数传入姿态估计模型中,形成训练数据;利用训练数据,训练融合空洞卷积Dilated conv的神经网络的人体图像关键点姿态估计模型,得到能够对人体图像进行姿态估计以得到人体关键点图像的深度神经网络模型:用该模型反馈优化约束自动数据增强当中的损失函数。本发明专利技术可将针对特定任务的人工设置调参的数据增强,转化为特定任务反馈优化的自动数据增强。

【技术实现步骤摘要】
一种图像数据自动增强的方法
本专利技术涉及图像处理
,特别是涉及一种图像数据自动增强的方法。
技术介绍
深度学习中的多层神经网络可通过大量训练数据提取相关语义特征,在浅层神经网络中可通过对数据进行特征提取得到更多的空间信息,通过深层神经网络可得到数据更多的语义信息。但没有足够的标记数据常常导致过度拟合,这意味着模型将无法归纳为未发现的示例,这可通过数据扩充来缓解。但人工设计数据增强的操作和参数往往需要大量工程经验进行参数调整,而不合适的参数调整反而会给模型训练带来噪声数据,进而带来负面影响降低模型的性能。现有的数据增广策略,虽然在自动数据增广和基于特定任务的数据增广均有进展,但是这些理论和方法对于任务的泛化性能较差,如何提升特定任务下的抵抗噪声能力的数据增广和如何优化自动数据增广计算开销与速度,仍然是亟待解决的问题。
技术实现思路
本专利技术的目的是针对现有技术中存在的技术缺陷,首先提出一种通过联合实际人体姿态估计网络的自动数据增强的方法,以降低在深度学习当中手动调参进行数据增广的所到来的噪声影响。本专利技术通本文档来自技高网...

【技术保护点】
1.一种图像数据自动增强的方法,其特征在于,包括步骤:/nS1.将图像送入基于空洞卷积的特征金字塔网络检测,输出人体用边界框标记的人体图像,并将上述人体图像裁剪成预定格式大小输出;/nS2.建立图像数据增强操作模型;创建搜索空间,将图像数据增强操作模型中多个图像节点通过可微分的搜索方法自动搜索学习形成最优路径,搜索结束时通过用预定操作替换每个混合操作来获得离散的数据扩充序列,形成训练数据;所述最优路径与不同图像节点所对应的操作,构成自动搜索的图像增强策略;/nS3.以裁剪完成的含有人体图像和对应人体骨架关键点的标注信息,以及通过反馈设置的自动图像数据增强模型的参数为输入,以训练集中用x、y轴坐...

【技术特征摘要】
1.一种图像数据自动增强的方法,其特征在于,包括步骤:
S1.将图像送入基于空洞卷积的特征金字塔网络检测,输出人体用边界框标记的人体图像,并将上述人体图像裁剪成预定格式大小输出;
S2.建立图像数据增强操作模型;创建搜索空间,将图像数据增强操作模型中多个图像节点通过可微分的搜索方法自动搜索学习形成最优路径,搜索结束时通过用预定操作替换每个混合操作来获得离散的数据扩充序列,形成训练数据;所述最优路径与不同图像节点所对应的操作,构成自动搜索的图像增强策略;
S3.以裁剪完成的含有人体图像和对应人体骨架关键点的标注信息,以及通过反馈设置的自动图像数据增强模型的参数为输入,以训练集中用x、y轴坐标形式标出的表现为json文件的人体关键点标注信息像作为GroundTruth,训练深度神经网络模型中的全局网络和矫正网络,获得从人体图像到人体关键点图像的人体姿态估计模型;
S4.不断地优化人体姿态估计模型的损失函数,实时反馈到图像数据增强操作中,自动交替优化图像数据增强模型的损失函数,完成图像数据增强的操作。


2.根据权利要求1所述图像数据自动增强的方法,其特征在于,所述搜索空间由K个子策略组成,每个子策略由N个增强操作组成,上述增强操作按顺序应用于单个人体图像,将选定的增强操作以指定的概率P应用于单个人体图像,根据数据扩充的范围M对单个人体图像进行增强操作。


3.根据权利要求2所述图像数据自动增强的方法,其特征在于,所述可微搜索算法,具体步骤是,令O为一组候选数据扩充,其中每个增强操作表示要应用的函数o(·),将指定增强操作的分类选择放宽到所有增强操作上的softmax,序列搜索的任务为学习一组连续变量α={α(i,j)};搜索结束时,通过用预定操作替换每个混合操作来获得离散的数据扩充序列。


4.根据权利要求1所述图像数据自动增强的方法,其特征在于,所述自动交替优化图像数据增强模型的损失函数包括Ltrain和Lval,分别表示训练损失和验证损失,两种损失均由数据增强序列架构α和网络中的权重w决定;
通过联合优化L2+Ltrain+Lval得到一个自动增强图像数据的网...

【专利技术属性】
技术研发人员:侯峦轩马鑫赫然孙哲南
申请(专利权)人:天津中科智能识别产业技术研究院有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1