The invention discloses a binocular parallax estimation method based on three-dimensional convolution. It includes the following steps: calibrating the binocular camera with the method of double-target calibration to get the binocular correction map; correcting the estimated binocular image to get the corrected binocular image; feeding the corrected binocular image into the preset two-dimensional convolution neural network to get the feature map after feature transformation; carrying out the feature map of the current frame and the feature map of the previous multi-frame image. Stitching and feeding into the three-dimensional convolution neural network, the feature map of multi-frame image is obtained. The feature map of multi-frame image is transposed and convoluted, and then transformed back to the pixel domain to obtain the disparity estimation map. Compared with the existing binocular disparity estimation method based on convolution neural network, the present invention extracts the information on time dimension through three-dimensional convolution, and estimates the binocular disparity map of the current frame by combining the binocular information of the current frame with the binocular information of the previous multiple frames. Compared with the original method, this method improves the accuracy and coherence between the front and back frames.
【技术实现步骤摘要】
一种基于三维卷积的双目视差估计方法
本专利技术属于计算机视觉
,具体地说,是对输入的双目摄像头信息进行处理,生成相应的视差图的方法。
技术介绍
获取准确的双目视差图是深度估计的前提,深度估计是双目立体视觉领域中一个重要的研究课题,在机器人导航,精密工业测量、物体识别、虚拟现实、场景重建,勘测等众多领域都有应用。在左右摄像头观察一个物体,获取在双目视角下的图像,根据图像之间像素的匹配关系可以获得视差图。通过三角测量原理计算出像素之间的偏移来获取物体的三维信息。得到了物体的景深信息,就可以计算出物体与相机之间的实际距离,物体三维大小,两点之间实际距离。早期的双目视差估计是基于小窗口的区域匹配,提取的特征值大多为灰度、颜色等信息。后来开发出自适应窗口技术,针对特征值也开发出对光照鲁棒性的变换值,如Census变换等。其后,逐步发展出基于局部的立体匹配、基于全局的立体匹配和基于半全局的立体匹配。近年来,基于卷积神经网络的双目视差估计方法取得了较多进展,包括利用卷积神经网络进行块匹配、利用全卷积神经网络直接生成整张双目视差估计图等方法。基于卷积神经网络的双目视差估计方法相较于早期的双目视差估计方法,在准确度、处理速度上都有了较大提升。但现有的卷积神经网络的双目视差估计方法在准确度、前后帧间的连贯性上还有待进一步改进。
技术实现思路
本专利技术的专利技术目的在于:针对上述存在的问题,提供现有的基于卷积神经网络的双目视差估计方法对每帧图像单独处理。当输入信息是连续视频时,由于没有利用前后帧的信息,从时间维度上看连续性存在一定的问题。本专利技术旨在通过三维卷积利用前后帧 ...
【技术保护点】
1.一种基于三维卷积的双目视差估计方法,其特征在于,包括下列步骤:双目摄像头标定步骤:对双目摄像头进行标定,分别得到左、右目摄像头的内参数矩阵以及外参数矩阵;双目图像校正步骤:通过内参数矩阵,分别对左、右目摄像头拍摄的图像进行去畸变处理;再结合内参数矩阵与外参数矩阵进行双目图像校正处理,将三维空间中的同一点投影到二维左、右目图像的同一水平扫描线上;二维特征提取步骤:选取二维卷积神经网络,并进行神经网络训练,作为二维特征提取器;将矫正后的双目图像送入二维特征提取器,进行前向传播,得到经过特征变换后的特征图;三维特征提取步骤:选取三维卷积积神经网络,并进行神经网络训练,作为三维特征提取器,所述三维特征提取器用于在空间维度与时间维度上进行多级的特征提取与变换,以融合空间维度和时间维度的信息,得到多帧信息融合的特征图;对二维特征提取所得到的特征图,将当前帧的特征图和之前多帧图像的特征图在特征维度上进行叠加后,再送入维特征提取器,进行前向传播提取特征,得到多帧图像的特征图;视差估计步骤:对三维提取步骤得到的多帧图像的特征图进行转置卷积,重新变换回像素域,得到视差估计图。
【技术特征摘要】
1.一种基于三维卷积的双目视差估计方法,其特征在于,包括下列步骤:双目摄像头标定步骤:对双目摄像头进行标定,分别得到左、右目摄像头的内参数矩阵以及外参数矩阵;双目图像校正步骤:通过内参数矩阵,分别对左、右目摄像头拍摄的图像进行去畸变处理;再结合内参数矩阵与外参数矩阵进行双目图像校正处理,将三维空间中的同一点投影到二维左、右目图像的同一水平扫描线上;二维特征提取步骤:选取二维卷积神经网络,并进行神经网络训练,作为二维特征提取器;将矫正后的双目图像送入二维特征提取器,进行前向传播,得到经过特征变换后的特征图;三维特征提取步骤:选取三...
【专利技术属性】
技术研发人员:李宏亮,邓志康,颜海强,尹康,袁欢,梁小娟,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。