一种基于离线数据增强的固废数据集生成方法技术

技术编号：31489020 阅读：17 留言：0更新日期：2021-12-18 12:25

一种基于离线数据增强的固废数据集生成方法，具体包括：手动标注第一固废数据集A1；对第一固废数据集A1进行离线数据增强生成第二固废数据集A2，合并第一固废数据集A1和第二固废数据集A2，形成合并固废数据集；使用深度学习模型对合并固废数据集进行训练；使用训练好的深度学习模型对未标注的固废数据集D进行预测；通过查询函数找出深度学习模型预测不准确的图像集，并进行手动标注得到第三固废数据集B1；对第三固废数据集B1进行离线数据增强生成第四固废数据集B2。本发明专利技术提出的方法可以生成大量固废数据集，快速有效地构扩充固废数据集，从而有助于深度学习模型的训练，进一步提升固废识别的准确率。升固废识别的准确率。升固废识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于离线数据增强的固废数据集生成方法

[0001]本专利技术涉及深度学习及固废识别领域，特别涉及基于离线数据增强的固废固废数据集生成方法。

技术介绍

[0002]随着近年来的快速发展，深度学习在越来越多的领域发挥作用，其中就包括固废检测领域。为了让深度学习能够在固废上取得良好的效果，企业往往需要获得高质量的固废数据集。对于企业来说，获取图像数据是很容易的。只要搭建好检测平台，通过工业相机的连续拍摄仅需一天就能获得上万张图像。然而，对于用于检测的深度学习网络模型来说，用于模型训练的固废数据集不是单一的图像数据，而是带有标签的图像。为了获取高质量的标签，现阶段常见的方法是请专业的人员对每张图像进行仔细标注，而繁琐的标注过程不仅会耗费大量人力，而且需要长时间的标注才能得到所需数量要求的固废数据集。
[0003]此外，由于背景的变化、光照的影响等等，使用某一场景下标注好的固废数据集进行训练的深度学习模型，换个场景就可能检测效果不好，这往往会导致工程师需要重新采集大量的图像并进行长时间的标注。如果仅是采用人工标注模式来得到固废数据集，会延长项目的研发周期，从而拖慢生产进程。

技术实现思路

[0004]本专利技术的主要目的在于克服现有技术中的上述缺陷，提出一种基于离线数据增强的固废数据集生成方法，能够快速有效地扩充标注的固废数据集，代替人工标注，节省时间人力，并提高深度学习模型检测的性能，进一步提升固废识别的准确率。
[0005]本专利技术采用如下技术方案：
[0006]一种基于离线数...

【技术保护点】

【技术特征摘要】
1.一种基于离线数据增强的固废数据集生成方法，其特征在于，方法具体步骤如下：手动标注第一固废数据集A1；对第一固废数据集A1进行离线数据增强生成第二固废数据集A2，合并第一固废数据集A1和第二固废数据集A2，形成合并固废数据集；使用深度学习模型对合并固废数据集进行训练；使用训练好的深度学习模型对未标注的固废数据集D进行预测；通过查询函数找出深度学习模型预测不准确的图像集，并进行手动标注得到第三固废数据集B1；对第三固废数据集B1进行离线数据增强生成第四固废数据集B2。2.根据权利要求1所述的一种基于离线数据增强的固废数据集生成方法，其特征在于，所述的深度学习模型包括但不限于实例分割模型和目标检测模型。3.根据权利要求1所述的一种基于离线数据增强的固废固废数据集生成方法，其特征在于，所述的固废数据集离线数据增强，包括如下步骤：读取需要进行离线数据增强的固废数据集的标签，分离出固废数据集中每个物体以及物体的标签信息；将分离出的物体进行几何变换、改变图像亮度与图像对比度，得到增强的物体以及标签信息；随机将N个增强之后的物体粘贴到一个图像模板上，同时将该N个物体的标签信息存入该模板对应的标签文件当中，N为整数。4.根据权利要求2所述的一种基于离线数据增强的固废数据集生成方法，固废数据集其特征在于，所述标签信息包括物体的轮廓信息以及物体的类别信息。5.根据权利要求2所述的一种基于离线数据增强的固废数据集生成方法固废数据集，...

【专利技术属性】
技术研发人员：李建涛，杨建红，计天晨，房怀英，林柏宏，杨宇轩，杨天成，陈伟鑫，
申请(专利权)人：华侨大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人