一种基于多重注意力网络的立体匹配算法制造技术

技术编号:26479500 阅读:63 留言:0更新日期:2020-11-25 19:24
本发明专利技术公开了一种基于多重注意力网络的立体匹配算法,属于计算机视觉研究技术领域,一种基于多重注意力网络的立体匹配算法,主要包括特征提取、代价卷构建、代价聚合和视差预测等步骤,特征提取中引入了沙漏位置注意力模块,可以有效地聚合每个位置的全局上下文信息,有效的保证了无纹理和重复纹理区域的精确匹配,代价卷构建中通过特征融合的方式将互相关卷与级联卷结合在一起,不仅可以保留特征维度,还能有效的度量特征之间的相似度,代价聚合中设计了一个多尺度的视差注意力模块,可以聚合不同视差维度的特征信息,并通过回归的方式获得最终视差,本方法相较于现有技术的立体匹配算法,有效的提高了准确性和立体匹配计算速度。

【技术实现步骤摘要】
一种基于多重注意力网络的立体匹配算法
本专利技术涉及计算机视觉研究
,更具体地说,涉及一种基于多重注意力网络的立体匹配算法。
技术介绍
双目立体视觉是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。双目立体视觉融合两只眼睛获得的图像并观察它们之间的差别,使我们可以获得明显的深度感,建立特征间的对应关系,将同一空间物理点在不同图像中的映像点对应起来,这个差别,我们称作视差图像。双目立体视觉测量方法具有效率高、精度合适、系统结构简单、成本低等优点,非常适合于制造现场的在线、非接触产品检测和质量控制。对运动物体测量中,由于图像获取是在瞬间完成的,因此立体视觉方法是一种更有效的测量方法。双目立体视觉系统是计算机视觉的关键技术之一,获取空间三维场景的距离信息也是计算机视觉研究中最基础的内容。双目立体视觉是计算机视觉研究的一个重要的分支,它通过模拟人的视觉系统来处理现实世界。具体地,它一般使用两台同型号的摄像机,在一定的设置下拍摄同本文档来自技高网...

【技术保护点】
1.一种基于多重注意力网络的立体匹配算法,其特征在于:包括以下步骤:/nS1、输入图像至特征提取网络;/nS2、进行特征提取得到一致性特征;/nS3、利用一致性特征构造代价卷;/nS4、将代价卷输入至代价聚合模块中进行代价聚合,通过回归方式获得预测的视差图。/n

【技术特征摘要】
1.一种基于多重注意力网络的立体匹配算法,其特征在于:包括以下步骤:
S1、输入图像至特征提取网络;
S2、进行特征提取得到一致性特征;
S3、利用一致性特征构造代价卷;
S4、将代价卷输入至代价聚合模块中进行代价聚合,通过回归方式获得预测的视差图。


2.根据权利要求1所述的一种基于多重注意力网络的立体匹配算法,其特征在于:所述S2中,具体采用沙漏位置注意模块进行一致性特征提取。


3.根据权利要求2所述的一种基于多重注意力网络的立体匹配算法,其特征在于:所述S2具体包括以下步骤:
S21、通过使用一系列的下采样来扩大感受野并获得相关的细节信息:使用两层3×3,stride为2的卷积将特征图尺寸减少为原图像的四分之一;
S22、使用位置注意机制捕获全局空间信息:一个局部特征输入到卷积层分别产生两个新的特征和将{B,C}的维度变为代表所有像素个数,对C和B的转置进行矩阵乘法,并应用softmax层来计算空间注意力图计算公式为再将A送入卷积层以产生新特征并将其维度变为然后对S和D进行矩阵乘法并将结果维度变为α初始化为0,并逐渐通过学习分配更多权重。
S23、通过使用一系列的上采样重建输出:使用两层4×4,stride为2的转置卷积将特征图尺寸还原到原图像尺寸大小。
S24、重复S21-S23获得最终输出:使用与S31-S23同样的结构对S23输出的特征图再处理一遍,得到最终输出。


4.根据权利要求1所述...

【专利技术属性】
技术研发人员:郭龙源周武威段厚裕欧先锋张国云吴健辉鲁敏滕书华
申请(专利权)人:湖南理工学院湖南拓视觉信息技术有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1