基于深度学习的深度图超分辨率方法技术

技术编号：18863054 阅读：27 留言：0更新日期：2018-09-05 15:16

本发明专利技术属于计算机图像处理领域，为提出一种利用对应的高分辨率的彩色图像，可以有效对深度图进行超分辨率，获得锐利的深度图边缘的方法。为此，本发明专利技术采取的技术方案是，基于深度学习的深度图超分辨率方法，包括下列步骤：1)从公共数据集中选取一定数量的纹理丰富的深度图和与之对应的彩色图；2)数据增强；3)将得到的深度彩色图像对进行数据预处理；4)设计深度卷积神经网络结构；5)用预处理好的数据集训练所设计的卷积神经网路，训练好卷积神经网络后，将低分辨率的深度图和对应的彩色图输入到训练好的网络中，在输出层输出完成超分辨率后的深度图。本发明专利技术主要应用于图像处理。

Depth map super-resolution method based on deep learning

The invention belongs to the field of computer image processing. In order to present a method for obtaining sharp edges of depth maps by super-resolution of depth maps with corresponding high-resolution color images. To this end, the present invention adopts a depth map super-resolution method based on depth learning, which includes the following steps: 1) selecting a certain number of texture-rich depth maps and corresponding color maps from a common data set; 2) data enhancement; 3) preprocessing the obtained depth color images; 4) designing the depth color images; Deep convolution neural network structure; 5) The convolution neural network is trained with the preprocessed data set. After training the convolution neural network, the low-resolution depth map and the corresponding color map are input into the trained network, and the super-resolution depth map is output in the output layer. The invention is mainly applied to image processing.

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的深度图超分辨率方法
本专利技术属于计算机图像处理领域，具体涉及一种基于卷积神经网络的利用深度彩色图像对的深度图超分辨率方法。
技术介绍
深度信息是三维目标视觉感知的一个重要信息，在自动驾驶，人机交互，三维场景重建及虚拟现实等方面的应用都依赖于高性能高质量的深度图。但是，目前的消费级的深度相机，包括微软的Kinect，华硕的XtionPro以及其它基于飞行时间法(timeofflight,TOF)技术的TOF相机，由于硬件条件的限制，获得的深度图像分辨率都非常低，远远低于彩色图像的分辨率。这在实际应用中带来很大的限制，因此，为了更有效地利用深度信息数据，深度图的超分辨率方法发挥着重要的作用。传统的深度图超分辨率方法包括局部滤波的方法，空域正则项方法和字典学习的方法。用以上方法获取的高分辨率的深度图过程中，一部分方法存在着计算复杂度大，需要很长的计算时间的问题，一部分方法也存在着在一些情况下结果会出现人工痕迹，效果不理想的问题。随着卷积神经网络的出现和迅速推广，卷积神经网络在图像处理领域有了广泛的应用和快速的发展，深度图超分辨率的方法也因为引入卷积神经网络而获得了很大的提升。
技术实现思路
为克服现有技术的不足，本专利技术旨在提出一种利用对应的高分辨率的彩色图像，可以有效对深度图进行超分辨率，获得锐利的深度图边缘的方法。为此，本专利技术采取的技术方案是，基于深度学习的深度图超分辨率方法，包括下列步骤：1)从公共数据集中选取一定数量的纹理丰富的深度图和与之对应的彩色图，将每对深度彩色图像命名一致；2)数据增强：将每一对图片都进行旋转90°，180°和2...

【技术保护点】
1.一种基于深度学习的深度图超分辨率方法，其特征是，包括下列步骤：1)从公共数据集中选取一定数量的纹理丰富的深度图和与之对应的彩色图，将每对深度彩色图像命名一致；2)数据增强：将每一对图片都进行旋转90°，180°和270°的操作，图片数量增大为原来的4倍；3)将得到的深度彩色图像对进行数据预处理：首先将深度图进行下采样后，再利用双三次插值方法将图像恢复到原来大小的尺寸，得到低分辨率的深度图；其中，需要将图片裁剪成128×128的小块，裁剪过程中步长设定为100，分别对原深度图，彩色图和低分辨率的深度图进行裁剪，三种类型的图像块命名都一一对应；其中从彩色图和低分辨率的深度图裁剪出来的图像块作为训练卷积神经网络的输入数据，从原深度图裁剪出来的图像块作为训练卷积神经网络的数据标签，也就是真值；特别的，对彩色图做相关处理，即利用Canny边缘检测算子获取低分辨率的深度图的边缘区域，利用高斯核模糊平滑这些区域的边缘以后，只保留对应的彩色图的这些区域的内容；用Ih表示由高分辨率彩色图得到的灰度图，先将彩色图进行预处理的操作得到边缘引导图Eh。利用Canny边缘检测算子，从低分辨率深度图Dl中获取...

【技术特征摘要】
1.一种基于深度学习的深度图超分辨率方法，其特征是，包括下列步骤：1)从公共数据集中选取一定数量的纹理丰富的深度图和与之对应的彩色图，将每对深度彩色图像命名一致；2)数据增强：将每一对图片都进行旋转90°，180°和270°的操作，图片数量增大为原来的4倍；3)将得到的深度彩色图像对进行数据预处理：首先将深度图进行下采样后，再利用双三次插值方法将图像恢复到原来大小的尺寸，得到低分辨率的深度图；其中，需要将图片裁剪成128×128的小块，裁剪过程中步长设定为100，分别对原深度图，彩色图和低分辨率的深度图进行裁剪，三种类型的图像块命名都一一对应；其中从彩色图和低分辨率的深度图裁剪出来的图像块作为训练卷积神经网络的输入数据，从原深度图裁剪出来的图像块作为训练卷积神经网络的数据标签，也就是真值；特别的，对彩色图做相关处理，即利用Canny边缘检测算子获取低分辨率的深度图的边缘区域，利用高斯核模糊平滑这些区域的边缘以后，只保留对应的彩色图的这些区域的内容；用Ih表示由高分辨率彩色图得到的灰度图，先将彩色图进行预处理的操作得到边缘引导图Eh。利用Canny边缘检测算子，从低分辨率深度图Dl中获取其中的边缘位置，也就是对应高分辨率彩色图中有用的信息的位置，由于用Canny边缘检测算子得到的边缘信息宽度只有一个像素，因此卷积上一个高斯模糊核扩宽边缘区域，接下来进行二值化的操作，将之前的值为1的区域的宽度由1个像素值扩大为带状，为了避免引入新的边界，再次卷积一个高斯模糊核将边缘区域的边界模糊化，将高分辨率强度图Ih与边缘区域相对应的位置的值相乘，将多余的信息滤除掉；4)设计深度卷积神经网络结构：网络结构为两路，将网络设计成全卷积形式，每个卷积层的步长都设为1，这样网络的输入、每一层的特征图以及输出都保持尺寸一致；卷积神经网络在高分辨率彩色图的引导下，学习低分辨率深度图和高分辨率深度图之间一个端到端的映射，该映射表示为：Dh＝F(Dl,Gh,{W,b})+Dl(2)其中，Dh表示高分辨率深度图，Dl表示低分辨率深度图，Gh表示用来做引导的由对应的高分辨率彩色图得到的强度图，F(·)代表要学习的映射，W和b分别表示卷积神经网络中的权重和偏置，具体的，该网络可以分为三个部分：特征提取部分、...

【专利技术属性】
技术研发人员：杨敬钰，蓝浩，宋晓林，李坤，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人