一种图像数据增广方法技术

技术编号：38684428 阅读：7 留言：0更新日期：2023-09-02 22:57

本发明专利技术属于图像数据处理技术领域，尤其涉及一种图像数据增广方法，包括首先采集标准场景下的图像，并按照预设的场景标签进行标注，生成训练数据集以及获取目标数据；然后根据训练数据集训练构建生成对抗网络；最后将目标数据、预设的场景标签取值范围以及训练数据集中图像对应的场景标签个数输入至生成对抗网络中，并预设采样范围和预设采样个数输入至生成对抗网络，输出增广后的图像数据；所述生成对抗网络包括生成器、判别器、场景映射网络以及场景编码器。本发明专利技术能够解决现有技术中的针对采集的训练数据进行的图像增广方法存在未考虑场景的不均衡，导致在部分场景下深度学习模型的精度降低的问题。型的精度降低的问题。型的精度降低的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像数据增广方法

[0001]本专利技术属于图像数据处理
，尤其涉及一种图像数据增广方法。

技术介绍

[0002]随着人工智能的发展，深度学习模型已成为研究的热门；深度学习模型广泛应用于语音识别和图像识别等领域中，尤其是在图像识别领域中，深度学习模型由多级提取抽象特征的学习处理层构成，利用深度神经网络和传播算法学习、处理和分析图像特征，以达到识别各种不同模式的目标和对象。
[0003]深度学习网络为了获得更好的泛化能力，需要大量高质量的多样化测试数据，在实际收集大量测试数据时，尤其是不同场景下的数据，往往存在较大的困难，一方面是数据存在不足，采集成本高，另一方面是数据质量较差，传统的数据处理方式包括旋转、翻转、裁剪以及集成到训练框架中进行处理，但传统的处理方式仍然不能获得大量高质量的数据，为此，现有技术中的图像数据增广方法，假定图像噪声服从正态分布，通过生成器利用三个层级的特征图像，分别为特征图、先验约束和约束特征向量，并进行通道拼接，先验约束采用正态分布的随机噪声，但实际上噪声的分布往往是高斯分布和泊松噪声等多种噪声的融合，因此数据集只限于已标定的，生成的数据存在场景不均衡的问题。

技术实现思路

[0004]本专利技术所解决的技术问题在于提供一种图像数据增广方法，以解决现有技术中的针对采集的训练数据进行的图像增广方法存在未考虑场景的不均衡，导致在部分场景下深度学习模型的精度降低的问题。
[0005]本专利技术提供的基础方案：一种图像数据增广方法，包括：
[0006]...

【技术保护点】

【技术特征摘要】
1.一种图像数据增广方法，其特征在于：包括：S1：采集标准场景下的图像，并按照预设的场景标签进行标注，生成训练数据集一，并获取用于目标检测的目标数据；S2：基于训练数据集一，训练建立多场景融合参数融合的生成对抗网络；所述生成对抗网络包括生成器、判别器、场景映射网络以及场景编码器；S3：将目标数据、预设的场景标签取值范围以及目标数据中图像对应的场景标签个数输入至生成对抗网络中，并预设采样范围和预设采样个数输入至生成对抗网络，输出增广后的图像数据。2.根据权利要求1所述的一种图像数据增广方法，其特征在于：所述S1中预设的场景标签包括色温参数、亮度参数和运动模糊度参数。3.根据权利要求2所述的一种图像数据增广方法，其特征在于：所述S2中包括：S2
‑
1：将色温参数、亮度参数取对数后，和运动模糊度参数按照预设采样范围和预设采样个数经采样后组成掩码向...

【专利技术属性】
技术研发人员：张大飞，
申请(专利权)人：重庆锐明信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人