一种基于深度卷积对抗生成网络的图像反射去除方法技术

技术编号：16102937 阅读：52 留言：0更新日期：2017-08-29 23:01

本发明专利技术公开了一种基于深度卷积对抗生成网络的图像反射去除方法，包括步骤：1)数据获取；2)数据处理；3)模型构建；4)损失定义；5)模型训练；6)模型验证。本发明专利技术结合了深度卷积神经网络提取高层图像语义信息的能力以及对抗生成网络灵活的损失函数定义能力，突破了传统方法仅使用低层像素信息的限制，因此对一般化的图像反射去除问题具有更强的适应能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度卷积对抗生成网络的图像反射去除方法
本专利技术涉及计算机图像处理的
，尤其是指一种基于深度卷积对抗生成网络的图像反射去除方法。
技术介绍
当我们在室内透过玻璃拍摄室外的景物时，得到的照片中往往会包含有室内物体的反射影像。专业摄影师可能会选择使用偏振镜等专业的仪器设备来解决这个问题。但是对于普通消费者而言，使用反射去除算法来对照片进行后期处理会是更可行的做法。一张带有反射影像的照片可以看做是由一张反射图像(室内景物)和一张目标图像(室外景物)叠加而成的混合图像。反射去除问题的本质是从这样一张混合图像中分解得到两张图像。这个问题有明显的不适定性(ill-posed)，即对于一张给定的混合图像，可能的分解方法是不唯一的。为了求解这样的不适定问题，我们需要为原问题增加足够的先验知识(prioriknowledge)作为额外的约束，使得求解得到的结果尽可能地接近目标结果。在过去的研究中，由于缺乏可靠的高层语义信息作为先验知识，大部分工作中使用的先验知识都是基于低层像素信息的。例如，在论文Learningtoperceivetransparencyfromthestatisti本文档来自技高网...

【技术保护点】
一种基于深度卷积对抗生成网络的图像反射去除方法，其特征在于，包括以下步骤：1)数据获取训练深度卷积对抗生成网络需要大量的训练数据，因此需要使用大规模的自然图像数据集，得到的图像数据集需要划分为训练数据集以及验证数据集，其中训练数据集用于模型训练阶段，验证数据集用于模型验证阶段；2)数据处理将图像数据集的图像通过预处理转化为训练深度卷积对抗生成网络所需要的形式；3)模型构建根据训练目标以及模型的输入输出形式，构造出一个适用于图像反射去除问题的深度卷积对抗生成网络；4)损失定义根据训练目标以及模型的架构，定义出所需的损失函数；5)模型训练初始化各层网络的参数，持续输入训练样本，根据损失函数计算出网...

【技术特征摘要】
1.一种基于深度卷积对抗生成网络的图像反射去除方法，其特征在于，包括以下步骤：1)数据获取训练深度卷积对抗生成网络需要大量的训练数据，因此需要使用大规模的自然图像数据集，得到的图像数据集需要划分为训练数据集以及验证数据集，其中训练数据集用于模型训练阶段，验证数据集用于模型验证阶段；2)数据处理将图像数据集的图像通过预处理转化为训练深度卷积对抗生成网络所需要的形式；3)模型构建根据训练目标以及模型的输入输出形式，构造出一个适用于图像反射去除问题的深度卷积对抗生成网络；4)损失定义根据训练目标以及模型的架构，定义出所需的损失函数；5)模型训练初始化各层网络的参数，持续输入训练样本，根据损失函数计算出网络的损失值，通过反向传播计算出各层网络的参数的梯度，通过随机梯度下降算法对各层网络的参数进行更新；6)模型验证使用验证数据对训练得到的模型进行验证，测试其泛化性能。2.根据权利要求1所述的一种基于深度卷积对抗生成网络的图像反射去除方法，其特征在于，所述步骤2)包括以下步骤过程：2.1)将数据集中的图像在保持长宽比例不变的情况下缩放到较短的边为144像素大小；2.2)随机在缩放后的图像上裁剪得到长宽均为128像素大小的正方形图像；2.3)以0.5的概率随机水平翻转裁剪后的图像；2.4)将随机翻转后的图像从[0,255]转换到[-1,1]的范围内。3.根据权利要求1所述的一种基于深度卷积对抗生成网络的图像反射去除方法，其特征在于，所述步骤3)包括以下步骤过程：3.1)构造编码器模型编码器是用于从输入的混合图像中提取出高层的语义信息并保存到一个低维的编码中，编码器的输入为3×128×128的混合图像，输出为1024×4×4的低维编码，为了实现从输入到输出的转换，编码器包含了多个级联的下采样层，下采样层由串联的卷积层、批量正则化层、以及非线性激活层组成，其中，卷积层设置卷积步长为2，在增大感受野的同时逐渐减小了图像的尺寸，批量正则化层通过归一化同一个批次的输入样本的均值和标准差，起到了稳定和加速模型训练的作用，非线性激活层的加入防止了模型退化为简单的线性模型，提高了模型的描述能力；3.2)构造解码器模型解码器是用于从低维的编码中拆解并还原出反射图像和目标图像，解码器的输入为1024×4×4的低维编码，输出为6×128×128的复原图像，得到的复原图像能够简单地直接拆解为两张3×128×128的输出图像，这两张拆解得到的图像即为还原出来的反射图像和目标图像；为了实现低维编码到复原图像的转换，解码器包含了多个级联的上采样层，上采样层由串联的反卷积层、批量正则化层、以及非线性激活层组成，其中，反卷积层设置反卷积步长为2，起到了从低维编码放大图像尺寸的作用，批量正则化层和非线性激活层的作用与编码器中同样；3.3)构造判别器模型判别器是用于约束解码器的输出结果，使其输出更接近自然图像；判别器的输入是两张3×128×128的图像，输出为一个用于指示输入的类型的标量；判别器的结构与编码器一样，也由级联的下采样层组成，所不同的是，判别器的首层输入是由两张输入图像叠加得到的6×128×128的层叠图像，而输出则是单一的标量；输入判别器的两张图像能够是由编解码器拆解还原得到的反射图像和目标图像，也能够是从数据集中抽取得到的原始图像；判别器的作用是读取输入的两张图像，尽可能地区分出它们是复原后的图像还是原始图像；如果判断是原始图像，则判别器应该输出一个尽可能大的值；相反，如果判断是复原图像，则判别器应该输出一个尽可能小的值。4.根据权利要求1所述的一种基于深度卷积对抗生成网络的图像反射去除方法，其特征在于，所述步骤...

【专利技术属性】
技术研发人员：徐雪妙，周乐，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人