一种深度特征对抗式学习的交互式灰度图像着色方法技术

技术编号：19482253 阅读：377 留言：0更新日期：2018-11-17 10:48

本发明专利技术提出了一种深度特征对抗式学习的交互式灰度图像着色方法，基于生成式对抗网络理论，构建以U型网络结构为基础的全卷积神经网络作为生成器，可处理任意尺寸的图像。通过随机模拟交互笔画的方式自动生成灰度图像着色训练数据，同时对判别器和生成器两个神经网络进行对抗式训练。最终训练出灰度图像着色神经网络模型，实现交互式的灰度图像着色。本发明专利技术可以对带有用户笔画交互的灰度图像进行上色，在高效自动化处理的同时，也支持用户的个性化上色需求，实现艺术化的创作。

全部详细技术资料下载

【技术实现步骤摘要】
一种深度特征对抗式学习的交互式灰度图像着色方法
本专利技术涉及图像处理、深度学习和增强现实
，具体地说是一种深度特征对抗式学习的交互式灰度图像着色方法。
技术介绍
灰度图像着色是一个经典的图像编辑问题，即输入一张单通道的灰度图像，将其转化为RGB三通道的彩色图像，且与图像表达的语义内容相符。人们在早期拍摄的大量老照片、老电影等很多都是黑白色的，将这些图像视频重新上色，可以使其产生新的活力。另外，画家、艺术家等在创作绘画时，动画制作者在创作新的漫画、动画作品时，常常首先创作出黑白底色的初品，然后再对其进行上色处理。因此，对灰度图像进行自动化、智能化着色，不管对于经典老照片、老视频修复处理，还是现代的艺术创作，都有着非常重要的需求，一直是图像编辑领域的一个研究热点。早期的基于用户交互的图像着色是通过用户笔画对颜色选取及着色区域进行控制，通过编辑传播等方法将用户的笔画传播到其他特征相似的区域。2004年，以色列耶路撒冷希伯来大学的Levin等人提出了基于编辑传播的灰度图像着色方法，通过笔画交互，将颜色传播到相似的像素上面。2008年，美国达特茅斯学院的An等人提出了一种基于像素相似性的图像视频编辑传播方法。2010年，以色列耶路撒冷希伯来大学的Farbman等人提出了基于扩散映射的图像编辑传播方法，利用扩散距离衡量像素之间的相似度。2012年，北京航空航天大学的Chen等人提出了一种特征流形结构保持的图像视频编辑传播方法，该方法利用局部线性嵌入实现编辑传播，保持了特征空间的流形结构。除了通过画笔交互对图像局部进行控制外，还出现了利用颜色模板等对全局进行控制...

【技术保护点】
1.一种深度特征对抗式学习的交互式灰度图像着色方法，其特征在于，包含以下步骤：(1)通过模拟笔画交互的方式生成灰度图像着色训练集；所述的模拟笔画交互是指对于每一幅彩色图像，将其转化为灰度图像，然后在Lab颜色空间的ab通道进行随机采样，将采样像素的颜色值赋予灰度图像相应位置的像素，生成带有笔画交互的训练数据；(2)设计生成式对抗网络，并利用步骤(1)生成的训练数据集对网络进行训练，所述生成式对抗网络包括生成器神经网络和判别器神经网络；(3)生成式对抗网络训练结束后，向生成器神经网络中输入带有笔画交互的灰度图像，生成器神经网络会输出着色后的彩色图像。

【技术特征摘要】
1.一种深度特征对抗式学习的交互式灰度图像着色方法，其特征在于，包含以下步骤：(1)通过模拟笔画交互的方式生成灰度图像着色训练集；所述的模拟笔画交互是指对于每一幅彩色图像，将其转化为灰度图像，然后在Lab颜色空间的ab通道进行随机采样，将采样像素的颜色值赋予灰度图像相应位置的像素，生成带有笔画交互的训练数据；(2)设计生成式对抗网络，并利用步骤(1)生成的训练数据集对网络进行训练，所述生成式对抗网络包括生成器神经网络和判别器神经网络；(3)生成式对抗网络训练结束后，向生成器神经网络中输入带有笔画交互的灰度图像，生成器神经网络会输出着色后的彩色图像。2.根据权利要求1所述的一种深度特征对抗式学习的交互式灰度图像着色方法，其特征在于：步骤(2)中，所述生成器神经网络为一种全卷积神经网络，网络的输入为一张灰度图像以及用户的交互其中表示实数空间，H表示图像像素高度，W表示图像像素宽度；在Lab颜色空间下，灰度图像对应L亮度通道，用户交互G对应ab颜色通道；网络的输出为预测出的所有像素在ab通道的颜色值，即全卷积神经网络通过最小化如下公式得到：其中，表示深度网络模型，θ为此网络模型需要求解的参数；表示损失函数，即的输出与训练集中标准值Y的差值。通过最小化损失函数来求解网络模型参数θ，以此进行训练。3.根据权利要求1或2所述的一种深度特...

【专利技术属性】
技术研发人员：李健伟，周彬，赵沁平，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人