基于双重注意力机制和位置编码约束的立体匹配方法组成比例

技术编号：38324262 阅读：15 留言：0更新日期：2023-07-29 09:06

本发明专利技术提供一种基于双重注意力机制和位置编码约束的立体匹配方法，涉及计算机视觉领域，包括以下步骤：(1)特征提取，对左右视图进行特征抽取得到channel为C

全部详细技术资料下载

【技术实现步骤摘要】
基于双重注意力机制和位置编码约束的立体匹配方法

[0001]本专利技术涉及一种立体图像对的视差估计方法，更具体的说是涉及一种双重注意力机制和位置编码约束的立体匹配方法，属于计算机视觉领域。

技术介绍

[0002]目前，机器视觉领域使用主动式传感技术和被动式传感技术来获取图像深度信息。主动式传感技术包括飞行时间、结构光和激光雷达，但由于分辨率、传感距离、光源影响和成本昂贵等问题，存在一定的局限性。相比之下，被动式传感技术中双目立体视觉具有低成本、易实现和易扩展等优点，因此在无人驾驶、增强现实和智能机器人等领域得到广泛应用，并具有巨大的应用前景和社会意义。
[0003]双目立体视觉是机器视觉领域的重要分支，自上世纪60年代中期以来，该技术得到了广泛的研究和应用。随着计算机硬件和算法的不断发展，双目立体视觉在计算机视觉、自动驾驶、遥感测绘、缺陷检测、三维重建等领域应用极为广泛。该技术的基本原理类似于人眼，通过左右眼视角的差异来获取物体在不同视角下的图像信息，利用三角定位法来获得二维图像上的一点在三维空间内的位置坐标，并通过相关的三维重建技术来获得重建目标的三维信息。
[0004]一个完整的双目立体视觉系统由多个部分组成，包括图像获取、相机标定、特征提取、立体匹配、深度确定和重建等。其中，双目立体视觉的核心步骤是立体匹配，它对于最终结果具有重要的影响。在进行立体匹配时，需要经过校正的左右图像，使用匹配搜索算法来寻找对应像素点，并计算出左右视差值。这类方法的难点在于左右相机图片的匹配，匹配的精确程度会直接影响最...

【技术保护点】

【技术特征摘要】
1.一种基于双重注意力机制和位置编码约束的立体匹配方法，其特征在于，包括以下步骤：(1)图像特征提取：给定一个图像对，分别用作源图像和目标图像，采用沙漏形编码器
‑
解码器架构来提取多尺度图像特征，编码器由五个残差块组成，然后是一个SPP模块，解码部分使用转置卷积，dense
‑
blocks和最后的卷积输出层，得到的特征图和原图尺寸一样；(2)特征匹配：采用交替注意力机制：自注意力计算同一图像中沿着极线的像素之间的注意力，而交叉注意力计算左右图像中对应极线上像素的注意力；在N
‑
1层中交替计算自注意力和交叉注意力；这种交替方案根据图像上下文和相对位置不断更新特征描述符；在最后的交叉注意力层中，使用最受关注的像素来估计视差；(3)位置编码：优化对于弱纹理区域的适应能力，引入用于相对位置建模的位置编码；(4)注意力掩码：在最后的交叉注意力层中引入了一个的二进制掩码，左图中的每个像素只需关注右图中在相同坐标x
L
左侧的像素，减小了匹配过程中的计算量；(5)唯一性约束：对立体匹配过程添加唯一性约束，即右图像中的每个像素最多分配给左图像中的一个像素；采用熵正则化的最优输运的方案来建立左右视图间的唯一性约束；(6)视差估计：根据之前步骤的计算结果预测输入图像视差。2.根据权利要求1所述的基于双重注意力机制和位置编码约束的立体匹配方法，其特征在于：所述步骤(6)中使用一种改进的赢者通吃方法进行视差估计，通过从最优传输分配矩阵中找到最可能匹配的位置(记为k)来计算视差，并在其周围构建一个3px的窗口N3(k)；对3px窗口内的匹配概率进行重新归一化处理，使其总和为1；候选视差的加权和即为估计视差3.根据权利要求1所述的基于双重注意力机制和位置编码约束的立体匹配方法，其特征在于：所述步骤(1)的具体方法为：采用沙漏形编码器
‑
解码器架构来提取多尺度图像特征；编码器由五个残差块组成，然后是一个SPP模块，以实现更高效的全局上下文信息采集；解码部分使用转置卷积，dense
‑
blocks和最后的卷积输出层；经过上面两个过程对特征进行抽取得到的是channel为C
e
，空间分辨率与原输入尺度(I
h
,...

【专利技术属性】
技术研发人员：李旭琛，
申请(专利权)人：三峡大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人