一种深度学习训练样本优化方法技术

技术编号:19179953 阅读:40 留言:0更新日期:2018-10-17 00:51
本发明专利技术公开一种深度学习训练样本优化方法,涉及数据处理领域;对子图像信息进行预处理,通过边缘检测处理,对子图像信息进行压缩剪裁,消除标注过程中人为标注导致的样本元素边界的误差,提升标注图像质量,提高训练样本生成效率,进而缩短深度学习模型训练有效用时,并且通过对子图像信息交叠部分进行分割补全处理,消除遮挡对样本元素影响,提高训练样本品质,提升训练效率,加速深度学习模型的优化、部署与应用。

A sample optimization method for deep learning training

The invention discloses a method for optimizing training samples in depth learning, which relates to the field of data processing, preprocesses the sub-image information, compresses and cuts the sub-image information through edge detection processing, eliminates the error of sample element boundary caused by artificial annotation in the process of annotation, improves the quality of the annotated image, and improves the training. Training the efficiency of sample generation, and then shorten the effective time of depth learning model training, and through the information overlap part of sub-image segmentation and completion processing, eliminate the influence of occlusion on sample elements, improve the quality of training samples, improve training efficiency, accelerate the optimization, deployment and application of depth learning model.

【技术实现步骤摘要】
一种深度学习训练样本优化方法
本专利技术公开一种深度学习训练样本优化方法,涉及数据处理领域。
技术介绍
在诸如自动驾驶等应用场景中,为实现物体检测精准性,深度学习模型对大量且具有高质量的输入数据集进行学习训练,这个数据集一般足够大、具有代表性以及拥有相对清楚的标签。而深度学习具有较强的学习能力或拟合能力,网络模型越复杂,其能力越强,也就需要更多的训练数据,否则容易产生过拟合。目前高质量的训练数据集一般由人工输出,截取大量的摄像头数据,对包含的元素进行人工标注。在标注过程中,很难保证所有标注出的图像边线紧贴目标物体,被标注物超出边框或离边框距离太远都将增大深度学习模型训练时精确度和复杂度的难度。并且有时元素经常出现交叠情况,标注时只能将前景图像算入被遮挡物体,致使标注数据质量大受影响。而本专利技术公开了一种深度学习训练样本优化方法,通过边缘检测处理,对原始标注图像进行压缩剪裁,消除标注过程中人为标注导致的样本元素边界的误差,提升标注图像质量,提高训练样本生成效率,进而缩短深度学习模型训练有效用时,通过对原始标注图像交叠部分进行分割补全处理,消除遮挡对样本元素影响,提高训练样本品质,提升本文档来自技高网...

【技术保护点】
1.一种深度学习训练样本优化方法,其特征是获取训练样本原图像及原始样本标注信息,根据原始样本标注信息,得到训练样本的子图像信息,其中子图像信息包括单一的子图像信息和交叠的子图像信息;对单一的子图像信息和交叠的子图像信息分别进行预处理,对预处理后的单一的子图像信息和交叠的子图像信息分别进行边缘检测,得到单一的子图像轮廓信息和交叠的子图像轮廓信息,根据单一的子图像轮廓信息对单一的子图像信息进行压缩剪裁处理,得到压缩剪裁优化的子图像标注信息,根据交叠的子图像轮廓信息对交叠的子图像信息中交叠的图像分别进行分割补全处理,得到优化的子图像标注信息。

【技术特征摘要】
1.一种深度学习训练样本优化方法,其特征是获取训练样本原图像及原始样本标注信息,根据原始样本标注信息,得到训练样本的子图像信息,其中子图像信息包括单一的子图像信息和交叠的子图像信息;对单一的子图像信息和交叠的子图像信息分别进行预处理,对预处理后的单一的子图像信息和交叠的子图像信息分别进行边缘检测,得到单一的子图像轮廓信息和交叠的子图像轮廓信息,根据单一的子图像轮廓信息对单一的子图像信息进行压缩剪裁处理,得到压缩剪裁优化的子图像标注信息,根据交叠的子图像轮廓信息对交叠的子图像信息中交叠的图像分别进行分割补全处理,得到优化的子图像标注信息。2.根据权利要求1所述的方法,其特征是若为多个样本图像交叠的子图像信息,则根据交叠的子图像轮廓信息划分出与交叠的样本图像数量相等的各个图像,进行分割补全处理,得到优化的子图像标注信息。3.根据权利要求2所述的方法,其特征是对各个图像进行分割补全处理...

【专利技术属性】
技术研发人员:王子彤姜凯聂林川
申请(专利权)人:济南浪潮高新科技投资发展有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1