一种基于双流卷积神经网络的立体匹配方法组成比例

技术编号：16176433 阅读：63 留言：0更新日期：2017-09-09 03:44

本发明专利技术公开了一种基于双流卷积神经网络的立体匹配方法。该方法利用一种双流卷积神经网络，学习并计算出左右视图中目标区域的匹配代价，并以交叉聚合算法作为辅助，有效地获得目标图像的视差图。双流网络结构不仅继承了卷积神经网络计算量小，性能稳定等优点，同时拥有较大的接受域，并且更充分地提取了目标点邻近区域的特征，拥有更高的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双流卷积神经网络的立体匹配方法
本专利技术涉及计算机视觉的立体匹配与深度学习
，具体讲的是一种基于双流卷积神经网络的双视点图像立体匹配方法。
技术介绍
立体视觉匹配是计算机视觉和非接触测量研究中最基本的关键问题之一，立体匹配的目标是找出不同视角的图像之间的对应点关系，获得视差图，得到了视察图之后，就可以很容易地得到原始图像的深度信息和三维信息。因此，立体匹配问题普遍被视为立体视觉中最关键的问题。视差图的获取是立体匹配问题的关键，关于计算像素点视差值的算法，根据采用图像表示的基元不同，可以分为：区域立体匹配算法，基于特征的立体匹配算法，基于相位的立体匹配算法。根据采用优化理论的方法不同，又可分为：局部立体匹配和全局立体匹配。立体匹配问题作为立体视觉中最困难的问题，是因为有以下挑战：遮挡问题，也就是一张图的某些区域因为遮挡原因，在另一个视角的图中没有对应的匹配点。其次是弱纹理的问题，如果只从局部的角度计算，就会出现大量的匹配点。传统的方法通过全局能量代价函数来检测遮挡，利用增大窗口的方法处理弱纹理的问题，但是效果有限[2]。近几年，深度学习在计算机视觉方面获得了重大进展，在图像分类，物体检测，视觉显著性检测等很多传统计算机图像与视觉方面的问题取得了巨大成功[4]。其中，最为典型的是卷积神经网络CNN，它通过卷积和池化操作提取了目标特征，并降低了特征分辨率，减少了计算量[1]。将池化的结果通过激活函数，将线性的卷积操作与非线性的激活函数结合，使得网络可以模拟出更为复杂多样的映射关系，使网络获得很好的特征提取的能力。参考文献[1]Krizhevsky...
一种基于双流卷积神经网络的立体匹配方法

【技术保护点】
一种基于双流卷积神经网络的立体匹配方法，其特征在于该方法包括：步骤(1)：构建一种基于交叉熵二值分类问题的训练数据，将训练数据分割出正负样本；步骤(2)：提出一种双流卷积神经网络结构用于计算两张图像的相似度，并利用步骤(1)构建的数据去训练网络的参数；所述的双流卷积神经网络由两个孪生卷积神经网络组成，再将它们的结果汇总并输出，每一个孪生卷积神经网络都有左右两个子网络，左右子网络在网络结构上一样，具体如下：以32×32的窗口作为输入；后接一个3×3，步长为1的卷积层+ReLU激活层；后接一个2×2，步长为2的下采样层，下采样采用maxpooling；后接三个3×3，步长为1的卷积层+ReLU激活层；孪生卷积神经网络的两个子网络最后得到两个9×9的窗口，子网络参数共享；左右子网络的不同在于：左侧子网络的输入是左图的窗口，右侧子网络的输入是右图的窗口；两个孪生卷积神经网络的结构也是一样的，不同在于：其中一个的输入为原图中解析度为32×32的窗口，另一个的输入是将同一个点为中心的64×64的窗口下采样成32×32的窗口；两个孪生卷积神经网络汇总时进入决策层，结构如下：一个324×1024全连接...

【技术特征摘要】
1.一种基于双流卷积神经网络的立体匹配方法，其特征在于该方法包括：步骤(1)：构建一种基于交叉熵二值分类问题的训练数据，将训练数据分割出正负样本；步骤(2)：提出一种双流卷积神经网络结构用于计算两张图像的相似度，并利用步骤(1)构建的数据去训练网络的参数；所述的双流卷积神经网络由两个孪生卷积神经网络组成，再将它们的结果汇总并输出，每一个孪生卷积神经网络都有左右两个子网络，左右子网络在网络结构上一样，具体如下：以32×32的窗口作为输入；后接一个3×3，步长为1的卷积层+ReLU激活层；后接一个2×2，步长为2的下采样层，下采样采用maxpooling；后接三个3×3，步长为1的卷积层+ReLU激活层；孪生卷积神经网络的两个子网络最后得到两个9×9的窗口，子网络参数共享；左右子网络的不同在于：左侧子网络的输入是左图的窗口，右侧子网络的输入是右图的窗口；两个孪生卷积神经网络的结构也是一样的，不同在于：其中一个的输入为原图中解析度为32×32的窗口，另一个的输入是将同一个点为中心的64×64的窗口下采样成32×32的窗口；两个孪生卷积神经网络汇总时进入决策层，结构如下：一个324×1024全连接层，输出维度为1024，并经过ReLU激活；一个1024×1的全链接层，输出维度为1，并经过Sigmoid激活；步骤(3)：分段处理双流卷积神经网络前向计算过程中分流和汇总两个模块，并保存中间数据，节省大量计算量；步骤(4)：将网络输出结果转化为匹配代价，并利用交叉聚合算法将聚合区域内的匹配代价平均化；步骤(5)：基于赢者通吃策略计算每一个像素点的视差，并用插值法对结果进行亚像素增强。2.根据权利要求1所述的方法，其特征在于：步骤1)中所有数据和对应的标签均从KITTI数据库获取，只使用灰度图像数据，并对所有灰度值归一化；对于训练用数据，为每一个像素点构建一个正样本和负样本，便于之后建立基于二分类问题的交叉熵残差。3.根据权利要求2所述的方法，其特征在于：设为一组样本，表示左图中以p点为中心的大小为n×n的窗口区域，表示右图中以q点为中心的大小为n×n的窗口区域；假设p＝(x,y)：对于一个正样本：q＝(x-dt,y)对于一个负样本：q＝(x-dt+...

【专利技术属性】
技术研发人员：戴国骏，罗姚翔，周文晖，张桦，沈方瑶，梁麟开，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人