一种基于深度神经网络的双目深度估计方法技术

技术编号：20427686 阅读：26 留言：0更新日期：2019-02-23 09:22

本发明专利技术涉及一种基于深度神经网络的双目深度估计方法，步骤如下：1)对输入的左、右视点图像通过预处理使数据增强；2)构建双目深度估计的多尺度网络模型，模型包含多个卷积层、激活层、残差连接、多尺度池化连接以及线性上采样层；3)设计损失函数使其在不断的训练过程中取得最小化结果，从而获得最优的网络权重；4)将待处理的图像输入到网络模型中，得到对应的深度图，并不断重复以上这几个步骤直到网络收敛或达到训练次数。本发明专利技术采用无监督学习的思想，仅利用双目相机获取的左右视点图像作为网络输入。该网络的自适应性设计将相机内外参数设置为单独的模型参数，因此能够在不需要修改网络的前提下适用于多个相机系统。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度神经网络的双目深度估计方法
本专利技术属于多媒体图像处理领域，涉及到计算机视觉、深度学习技术，由其是一种基于深度神经网络的双目深度估计方法。技术背景深度估计一直是计算机视觉领域的热门研究方向，深度图提供的三维数据为三维重建、增强现实(AugmentedReality,AR)、智能导航等应用的实现提供了所需信息。同时，深度图表达的位置关系在众多图像任务中极为重要，能够使得图像处理算法进一步简化。目前较为常见的深度估计主要分为两类，即单目深度估计和双目深度估计。单目深度估计方法只使用一个相机，传统算法中相机捕获连续的图像帧，通过帧间的运动模型进行投影变换从而估计图像深度。基于深度学习的单目深度估计则是利用带有真实深度信息的数据集训练深度神经网络，利用学习得到的深度神经网络来回归深度。此类算法设备简单，成本较低，可适用于动态场景。但同时因为缺少尺度信息，通常深度信息不够准确，在未知场景中性能往往严重退化。双目估计方法使用两台经过校准的摄像头，从两个不同的视角观测同一物体。找到不同视角下的同一空间点，计算出对应像素点间的视差，然后通过三角测量即可将视差转换为深度。传统的双目估计采用立体匹配算法，计算量较大，对低纹理场景效果较差。基于深度学习的双目深度估计多采用监督学习方法，由于神经网络强大的学习能力，比起传统方法，目前此类方法不管是在精度还是速度上都有了极大的提升。然而有监督学习通常过于依赖真实值，但真实值可能存在误差和噪音、深度信息较为稀疏、硬件设备很难校准等问题，从而使得估计出的深度值不够准确。无监督学习方法一直被认为是人工智能能够在真实世界真...

【技术保护点】
1.一种基于深度神经网络的双目深度估计方法，步骤如下：1)对输入的左、右视点图像通过预处理使数据增强；2)构建双目深度估计的多尺度网络模型，模型包含多个卷积层、激活层、残差连接、多尺度池化连接以及线性上采样层；3)根据设计的多尺度网络模型设置初始化参数，设计损失函数使其在不断的训练过程中取得最小化结果，从而获得最优的网络权重；4)将待处理的图像输入到网络模型中，得到对应的深度图，并不断重复以上这几个步骤直到网络收敛或达到训练次数。

【技术特征摘要】
1.一种基于深度神经网络的双目深度估计方法，步骤如下：1)对输入的左、右视点图像通过预处理使数据增强；2)构建双目深度估计的多尺度网络模型，模型包含多个卷积层、激活层、残差连接、多尺度池化连接以及线性上采样层；3)根据设计的多尺度网络模型设置初始化参数，设计损失函数使其在不断的训练过程中取得最小化结果，从而获得最优的网络权重；4)将待处理的图像输入到网络模型中，得到对应的深度图，并不断重复以上这几个步骤直到网络收敛或达到训练次数。2.根据权利要求1所述的基于深度神经网络的双目深度估计方法，其特征在于：所述的多尺度网络模型采用三个残差网络结构对输入进行多尺度卷积，每个残差模块包括两个卷积层和一个恒等映射，网络中第二层、第六层和第十四层为多尺度池化模块，对第二层和第六层输出进行平均池化操作，并与第十四层输出一同进行1*1的卷积。3.根据权利要求2所述的基于深度神经网络的双目深度估计方法，其特征在于：左右视图通过前端网络处理，通过多尺度池化模块后采用特征相关操作关联左右视图的特征信息，计算两图间特征相关性：c(x1，x2)＝∑o∈[-k，k]×[-k，k]<fl(x1+o)，fr(x2+o)>c为左图特征以x1为中心的图像块与右图特征以x2为中心的...

【专利技术属性】
技术研发人员：侯永宏，吕晓冬，许贤哲，陈艳芳，赵健，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人