一种基于深度卷积神经网络的深度图完善方法技术

技术编号：19345588 阅读：21 留言：0更新日期：2018-11-07 15:10

本发明专利技术公开了一种基于深度卷积神经网络的深度图完善方法，包括步骤：1)将训练数据中的深度图片和RGB图片提取样本和标签，并提取正方形图片块；2)对训练数据提取出的正方形图片块样本进行数据增强，包括旋转、扭曲操作；3)将增强后的训练数据通过深度卷积神经网络进行训练；4)将需要处理的深度图和RGB图片通过预处理；5)将预处理过的深度图和RGB通过训练过的神经网络对深度进行完善。本发明专利技术方法充分利用了RGB图片中结构信息，左右深度的相互的关系，通过神经卷积神经网络强大的特征提取能力，解决了设备采集的深度图质量不高问题，从而更好地应用于工业和生活领域。

A depth map perfect method based on deep convolution neural network

The invention discloses a depth map improvement method based on depth convolution neural network, which includes steps: 1) extracting samples and labels from depth images and RGB images in training data, and extracting square image blocks; 2) data enhancement of square image block samples extracted from training data, including rotation and distortion operations. (3) The enhanced training data are trained by deep convolution neural network; (4) the depth maps and RGB images that need to be processed are preprocessed; and (5) the depth maps and RGB images that need to be processed are perfected by the trained neural network. The method of the invention makes full use of the structure information in RGB pictures and the relationship between left and right depths, solves the problem of low quality of depth maps collected by equipment through the powerful feature extraction ability of neural convolution neural network, and thus is better applied in industrial and life fields.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度卷积神经网络的深度图完善方法
本专利技术涉及无人驾驶和深度重建的
，尤其是指一种基于深度卷积神经网络的深度图完善方法。
技术介绍
随着科技的发展，深度摄像机逐渐步入人们的生活。普通的摄像机能够捕捉可见光并成像于平面的图片上，其中每个像素点的值是红绿蓝三种光的分量；而深度相机拍摄的图片每个像素点的值则是该点的距离相机拍摄平面的距离。无论工业还是娱乐行业，对高质量的深度图的使用和需求已经越来越多。在工业领域，深度图是无人车，无人机导航系统的必要输入，没有它就不能感知周围环境；在机器人领域，深度图能对机器人，机械臂的操作提供定位指导；在智能家居中，关于手势的人机交互方式会逐渐取缔传统的按键交互方式；在游戏中，体感游戏，虚拟现实，增强现实，都需要深度摄像机采集的深度图片。可以说总有一天，深度摄像机会像可见光摄像机那样成为标配。目前市面上的深度摄像机大致可分为两种。一种是基于红外光的，例如Kinect，Kinect2，LeapMotion，RealSense等等，其中又可以细分为基于编码光和TOF技术的。另一种是基于双目匹配的，其原理类似人眼的双目视觉成像，能够从两张关于同一景物的可见光图片中得到深度图。可是无论是哪种方法，都有严重的缺点。基于红外光的深度摄像机只能在室内环境具有实用性，在室外环境噪声过大将导致设备不能使用，即使是在室内环境下，噪声也是一个问题。而基于双目匹配的深度摄像机由于双目相机遮挡的原因，会出现一些区域的深度不可求情况。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足，提出了一种基于深度卷积神经网络的深度图完善方法，将...

【技术保护点】
1.一种基于深度卷积神经网络的深度图完善方法，其特征在于，包括以下步骤：1)将训练数据中的深度图片和RGB图片提取样本和标签，并提取正方形图片块；2)对训练数据提取出的正方形图片块样本进行数据增强，包括旋转、扭曲操作；3)将增强后的训练数据通过深度卷积神经网络进行训练；4)将需要处理的深度图和RGB图片通过预处理；5)将预处理过的深度图和RGB通过训练过的神经网络对深度进行完善。

【技术特征摘要】
1.一种基于深度卷积神经网络的深度图完善方法，其特征在于，包括以下步骤：1)将训练数据中的深度图片和RGB图片提取样本和标签，并提取正方形图片块；2)对训练数据提取出的正方形图片块样本进行数据增强，包括旋转、扭曲操作；3)将增强后的训练数据通过深度卷积神经网络进行训练；4)将需要处理的深度图和RGB图片通过预处理；5)将预处理过的深度图和RGB通过训练过的神经网络对深度进行完善。2.根据权利要求1所述的一种基于深度卷积神经网络的深度图完善方法，其特征在于：在步骤3)中，构造神经网络并训练，对于基于红外光的深度相机，RGB和待完善的深度图只有一组，所以网络的训练输入包括一组RGB的正方形图片块和待完善深度图的正方形图片块，标签是完善过的正方形图片块，将输入数据通过特征提取卷积层提取出丰富的特征，再经过多尺度感知域残差网络进行特征筛选，最后采用MSE作为代价函数；对于双目匹配结构...

【专利技术属性】
技术研发人员：袁书聪，青春美，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人