一种基于卷积神经网络的灰阶图像着色方法及其装置制造方法及图纸

技术编号：15650384 阅读：744 留言：0更新日期：2017-06-17 03:22

本发明专利技术实施例公开了一种基于卷积神经网络的灰阶图像着色方法及其装置，其中，该方法包括：收集图片集；选择向量化的卷积神经网络模型VCNN，并构造相应的网络结构；修改所述向量化的卷积神经网络模型VCNN；对所述图片集中的图片进行转换，获得相应YUV颜色空间的图片，从中随机抽取64x64的Y值块，同时抽取相应位置的U值块和V值块；训练网络，利用反向传播算法和随机梯度下降法更新网络参数；得到经过训练的网络后，利用网络进行着色，输入灰度块，输出相应的U值和V值，获得彩色图片。实施本发明专利技术实施例，解决了需要人为提供涂鸦或样例图片的缺点，实现全自动的图片着色，并解决了着色速度慢、着色效果不稳定的缺点，使得着色效果较自然而且稳定。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的灰阶图像着色方法及其装置
本专利技术涉及图像处理
，尤其涉及一种基于卷积神经网络的灰阶图像着色方法及其装置。
技术介绍
随着信息科学技术的进步，图形处理器(GraphicsProcessingUnit，GPU)技术的飞速发展大大提高了计算机的计算能力，同时也促进了图形与图像处理领域的飞速发展。由于以前的摄影技术的不足，只能拍摄黑白的照片，所以留下了很多珍贵的黑白照片，因为想要对这些黑白照片着色，所以有了对黑白照片着色的技术需求。在ICCV发表的《Deepcolorization》利用了全连接网络，以单个像素所提取的低、中、高水平特征对像素进行着色。具体的做法是训练一个全连接网络，网络的输入是单个像素的128维特征，输出是YUV颜色空间的U,V值。其中，低水平的特征为像素周围的7x7区域的灰度值，即49维；中等水平的特征为2010在IEEEtransaction发表的《DAISY:AnEfficientDenseDescriptorAppliedtoWide-BaselineStereo》文章中的DAISY特征，共32维；高水平特征是利用最新的语义特征提取算法，得到47维。即一个像素可以得到128维的特征描述，然后训练全连接网络，使这128维的特征回归到U,V值，即可以从灰度图得到各个像素的128维特征后，放入训练好的全连接网络后，即可得到U,V值。另有现有技术，设计了一个用卷积神经网络进行着色的模型，在训练的时候是以一整张图片提取全集特征，然后提取中层特征，考虑了图片全局因素对于着色效果的影响，在网络的中间融合了中层特征和全局特...
一种基于卷积神经网络的灰阶图像着色方法及其装置

【技术保护点】
一种基于卷积神经网络的灰阶图像着色方法，其特征在于，所述方法包括：收集图片集；选择向量化的卷积神经网络模型VCNN，并构造相应的网络结构；修改所述向量化的卷积神经网络模型VCNN；对所述图片集中的图片进行转换，获得相应YUV颜色空间的图片，从中随机抽取64x64的Y值块，同时抽取相应位置的U值块和V值块；训练网络，利用反向传播算法和随机梯度下降法更新网络参数；得到经过训练的网络后，利用网络进行着色，输入灰度块，输出相应的U值和V值，获得彩色图片。

【技术特征摘要】
1.一种基于卷积神经网络的灰阶图像着色方法，其特征在于，所述方法包括：收集图片集；选择向量化的卷积神经网络模型VCNN，并构造相应的网络结构；修改所述向量化的卷积神经网络模型VCNN；对所述图片集中的图片进行转换，获得相应YUV颜色空间的图片，从中随机抽取64x64的Y值块，同时抽取相应位置的U值块和V值块；训练网络，利用反向传播算法和随机梯度下降法更新网络参数；得到经过训练的网络后，利用网络进行着色，输入灰度块，输出相应的U值和V值，获得彩色图片。2.如权利要求1所述的基于卷积神经网络的灰阶图像着色方法，其特征在于，所述选择向量化的卷积神经网络模型VCNN，并构造相应的网络结构的步骤，包括：选择向量化的卷积神经网络模型VCNN作为整个着色网络的基础网络模型；根据所述向量化的卷积神经网络模型VCNN构造相应的网络结构。3.如权利要求1所述的基于卷积神经网络的灰阶图像着色方法，其特征在于，所述对所述图片集中的图片进行转换，获得相应YUV颜色空间的图片，从中随机抽取64x64的Y值块，同时抽取相应位置的U值块和V值块的步骤，包括：将下载的RGB颜色空间的图片转换为YUV颜色空间的图片；随机抽取YUV颜色空间的图片，再随机抽取图片中的64x64的区域，抽取出64x64的Y值作为训练网络的输入，以及相同位置的U值和V值，作为与训练网络的输出作对比的真实U,V值。4.如权利要求3所述的基于卷积神经网络的灰阶图像着色方法，其特征在于，所述将下载的RGB颜色空间的图片转化为YUV颜色空间的图片的步骤，包括：根据下述公式将下载的RGB颜色空间的图片转化为YUV颜色空间的图片：Y'＝0.299*R'+0.587*G'+0.114*B'；U'＝-0.147*R'-0.289*G'+0.436*B'；V'＝0.615*R'-0.515*G'-0.100*B'。5.如权利要求1所述的基于卷积神经网络的灰阶图像着色方法，其特征在于，在所述获得彩色图片的步骤之后，包括：将...

【专利技术属性】
技术研发人员：梁湘国，苏卓，李波，冷成财，罗笑南，
申请(专利权)人：中山大学，南昌航空大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人