基于深度学习的图像扩充方法和装置、存储介质和计算机制造方法及图纸

技术编号：32138430 阅读：8 留言：0更新日期：2022-02-08 14:31

本发明专利技术提供一种图像扩充方法和装置、存储介质和计算机。所述图像扩充方法包括：提供包括有多张原始图像的第一图像集和生成对抗网络；对所述原始图像进行图像处理以得到处理后图像，多张处理后图像构成第二图像集，基于第一图像集和第二图像集形成第三图像集；利用第三图像集中的图像来训练所述生成对抗网络，得到最终的生成对抗网络；最终的生成对抗网络的基于第三图像集生成多张生成图像，并判断所述多张生成图像的真伪，被判断为真的多张生成图像形成第四图像集，基于第三图像集和第四图像集形成第五图像集。这样可以有效的扩充优质的图像集，以便为后续图像分类或目标检测的卷积神经网络模型训练提供优质的图像源。神经网络模型训练提供优质的图像源。神经网络模型训练提供优质的图像源。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的图像扩充方法和装置、存储介质和计算机

[0001]本专利技术涉及深度学习领域，尤其涉及一种基于深度学习的图像扩充方法和装置、存储介质和计算机。

技术介绍

[0002]深度学习凭借其在识别应用中较高的预测准确率，在图像分类、图像语义分割领域中表现不凡，主要利用卷积神经网络(CNN)，在图像中寻找特征，或将目标从背景中分离出来，或将不同类别的目标区分开来。
[0003]然而，建立一个优质的神经网络模型的前提，就是拥有一个优质的图像训练集，这不仅在数量上有所要求，还需针对环境差异化具有一定容纳性，这一点在工业应用时尤为重要，因为造成图片变化的不可抗因素极多，工业环境中，光源、相机、镜头等硬件性能的衰落，外部环境的变化与干扰，都会影响到模型的鲁棒性，但在已有的图像数据中无法完全体现出来。
[0004]因此，有效的图像扩充方式是达到工业环境高适应性的重要途径。

技术实现思路

[0005]本专利技术的目的在于提供一种图像扩充方法和装置、存储介质和计算机，其可以有效的扩充优质的图像集，以便为后续图像分类或目标检测的卷积神经网络模型训练提供优质的图像源。
[0006]为实现专利技术目的，根据本专利技术的一个方面，本专利技术提供一种图像扩充方法，其包括：提供第一图像集和生成对抗网络，其中第一图像集包括有多张原始图像，所述生成对抗网络包括生成模型和判别模型；对所述原始图像进行图像处理以得到处理后图像，多张处理后图像构成第二图像集，其中所述图像处理包括图形变换、光效处理、色彩及细节处理...

【技术保护点】

【技术特征摘要】
1.一种图像扩充方法，其特征在于，其包括：提供第一图像集和生成对抗网络，其中第一图像集包括有多张原始图像，所述生成对抗网络包括生成模型和判别模型；对所述原始图像进行图像处理以得到处理后图像，多张处理后图像构成第二图像集，其中所述图像处理包括图形变换、光效处理、色彩及细节处理、特殊处理中的一种或多种，基于第一图像集和第二图像集形成第三图像集；利用第三图像集中的图像来训练所述生成对抗网络，得到最终的生成对抗网络；最终的生成对抗网络的生成模型基于第三图像集生成多张生成图像，最终的生成对抗网络的判别模型判断所述多张生成图像的真伪，被判断为真的多张生成图像形成第四图像集，基于第三图像集和第四图像集形成第五图像集。2.如权利要求1所述的图像扩充方法，其特征在于，对第五图像集中的图像进行标记，利用标记后的第五图像集来训练卷积神经网络模型，得到训练后的卷积神经网络模型。3.如权利要求1所述的图像扩充方法，其特征在于，所述图形变换包括翻转、旋转、畸变、缩放中的一种或几种；所述光效处理包括亮度处理、对比度处理、高光暗部处理、光照渐变处理中的一种或几种；所述色彩及细节处理包括饱和度处理、色相处理、色温处理、噪声处理、清晰度处理中的一种或几种；所述特殊处理包括遮挡处理、变形处理中的一种或几种，第三图像集包括第一图像集的部分或全部和第二图像集的部分或全部，第五图像集包括第三图像集的部分或全部和第四图像集的部分或全部。4.如权利要求1所述的图像扩充方法，其特征在于，利用第三图像集中的图像来训练所述生成对抗网络以使得所述判别模型的判断准确率最大化以及所述生成模型具有最大化欺骗所述判别模型的能力，所述生成模型包括编码器、噪声添加模块和解码器，所述编码器包括卷积层、池化层、多个密集块、分别连接于对应的密集块输出端的多个过渡层，所述解码器包括多个密集块和分别连接于对应的密集块输出端的多个反卷积过渡层，所述噪声添加模块连接于编码器的输出端和解码器的输入端之间，所述解码器输出对应输入图像相同尺寸的生成图像，所述判别模型属于二分类模型，其包括池化层、卷积层、多个密集块、连接于多个密集块之间的过渡层、全局池化层和全连接层，当一张输入图像输入所述生成对抗网络后，先由所述生成模型的编码器对输入图像进行特征提取，由噪声添加模块添加随机噪声后，再由所述生成模型的解码器输出对应输入图像相同尺寸的生成图像，然后将所述生成图输入所述判别模型，所述判别模型对所述生成图像进行特征提取，所述判别模块还对所述输入图像进行特征提取，所述判别模块根据从所述生成图像中提取的特征与从所述输入图像中提取的特征输出所述生成图像对应真伪类别的概率值，最终确定所述生成图像是真是伪。5.如权利要求4所述的图像扩充方法，其特征在于，所述编码器包括1个卷积层、1个池化层、4个密集块和4个过渡层，所述编码器的1个卷积层、1个池化层、4个密集块依次相连，4个过渡层分别连接于对应的密集块的输出端，每个密集块与位于其后方的每个过渡层相
连；所述解码器包括4个密集块和分别连接于对应的密集块输出端的4个反卷积过渡层，每个密集块与位于其后方的每个反卷积过渡层相连，所述判别模型包括依次相连的1个池化层、1个卷积层、4个密集块、分别连接于4个密集块之间的3个过渡层、1个全局池化层和1个全连接层，每个密集块与位于其后方的每个过渡层相连。6.如权利要求4所述的图像扩充方法，其特征在于，利用第三图像集中的图像对所述生成模型和所述判别模型进行交替训练，通过梯度下降算法最小化损失函数，对所述生成模型和所述判别模型的参数进行反向调节，迭代训练指定次数后获取较小的损失函数，生成最终的生成对抗网络。7.一种图像扩充装置，其特征在于，其包括：预扩充模块，其对第一图像集内的多张...

【专利技术属性】
技术研发人员：韩旭，颜聪，
申请(专利权)人：东声苏州智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人