【技术实现步骤摘要】
双目立体匹配的方法、装置、设备以及存储介质
[0001]本公开涉及人工智能
,尤其涉及深度学习、计算机视觉技术等领域。
技术介绍
[0002]随着技术的发展,可以通过人工智能改善硬件性能,所适用的应用场景多种多样,比如涉及双目立体匹配、单目标深度估计、单目标跟踪、图像处理、视频处理等与计算机视觉相关的应用场景的硬件设计中,都可以采用人工智能技术,即:将训练好的模型部署于硬件中,以提高硬件的处理速度及处理准确率。
[0003]其中,双目立体匹配作为计算机视觉领域的一项核心任务,由于真实环境的复杂性、目标对象本身的不稳定性以及目标对象本身分辨率等原因导致双目立体匹配的精度不高,即便可以在特定数据集上满足精度要求,但是对于除特定数据集之外的其他数据集而言,泛化性差,因此,在实际应用中如何提高双目立体匹配的精度和泛化性是要解决的问题。
技术实现思路
[0004]本公开提供了一种双目立体匹配的方法、装置、设备以及存储介质。
[0005]根据本公开的一方面,提供了一种双目立体匹配的方法,包括:
[0006]对通过双目摄像头采集同一场景得到的第一图像和第二图像进行多尺度特征提取,得到多尺度的第一子图像特征和多尺度的第二子图像特征;
[0007]对该多尺度的第一子图像特征和该多尺度的第二子图像特征采用预设维度的代价卷进行多尺度特征融合,以构建金字塔型代价卷;
[0008]根据该金字塔型代价卷进行双目立体匹配处理,得到初始的第一视差图。
[0009]根据本公开的另一 ...
【技术保护点】
【技术特征摘要】
1.一种双目立体匹配的方法,包括:对通过双目摄像头采集同一场景得到的第一图像和第二图像进行多尺度特征提取,得到多尺度的第一子图像特征和多尺度的第二子图像特征;对所述多尺度的第一子图像特征和所述多尺度的第二子图像特征采用预设维度的代价卷进行多尺度特征融合,以构建金字塔型代价卷;根据所述金字塔型代价卷进行双目立体匹配处理,得到初始的第一视差图。2.根据权利要求1所述的方法,其中,所述第一图像,为双目摄像头的第一图像传感器采集到的图像;所述第二图像,为所述双目摄像头的第二图像传感器采集到的图像。3.根据权利要求1所述的方法,其中,所述对通过双目摄像头采集同一场景得到的第一图像和第二图像进行多尺度特征提取,得到多尺度的第一子图像特征和多尺度的第二子图像特征,包括:将所述第一图像和所述第二图像构成的图像对输入多尺度特征提取网络;在所述多尺度特征提取网络中,对所述图像对进行不同图像分辨率的多尺度特征提取,得到所述多尺度的第一子图像特征和所述多尺度的第二子图像特征。4.根据权利要求3所述的方法,其中,所述多尺度特征提取网络包括多个卷积层;其中,所述多个卷积层中不同卷积层的尺寸不同。5.根据权利要求3所述的方法,其中,所述对所述多尺度的第一子图像特征和所述多尺度的第二子图像特征采用预设维度的代价卷进行多尺度特征融合,以构建金字塔型代价卷,包括:根据所述多尺度的第一子图像特征和所述多尺度的第二子图像特征,得到特征金字塔;根据所述特征金字塔,构建预设维度的金字塔型代价卷。6.根据权利要求5所述的方法,其中,所述根据所述特征金字塔,构建预设维度的金字塔型代价卷,包括:将所述特征金字塔中非原始图像分辨率的多个特征图输入多尺度特征融合网络;在所述多尺度特征融合网络中对所述多个特征图进行所述多尺度特征融合的四维代价卷构建,得到多尺度的四维融合代价卷;其中,所述金字塔型代价卷包括所述多尺度的四维融合代价卷。7.根据权利要求6所述的方法,还包括:将所述特征金字塔中原始图像分辨率的一个或多个特征图输入视差补偿网络;在所述视差补偿网络中,结合所述一个或多个特征图对所述初始的第一视差图进行三维代价卷构建,得到三维翘曲代价卷;其中,所述金字塔型代价卷还包括所述三维翘曲代价卷。8.根据权利要求7所述的方法,其中,所述根据所述金字塔型代价卷进行双目立体匹配处理,得到初始的第一视差图,包括:根据所述金字塔型代价卷中的多尺度四维融合代价卷进行多尺度代价卷融合,得到所述初始的第一视差图。9.根据权利要求8所述的方法,还包括:通过所述视差补偿网络对所述初始的第一视差
图进行优化,得到优化后的第二视差图;其中,所述优化后的第二视差图的图像分辨率高于所述初始的第一视差图的图像分辨率。10.根据权利要求6或7所述的方法,其中,所述多尺度特征融合网络包括:k个编码块、k个融合块及k个解码块;其中,所述k个编码块中第i个编码块的输入为第i个四维融合代价卷,第j个编码块的输入为第j
‑
1个融合块的输出;其中,所述i为等于1的整数,所述j为大于1的整数;所述k个融合块中第j
‑
1个融合块的输入为第j
‑
1个编码块的输出和第j
‑
1个四维融合代价卷;所述k个解码块中第k个解码块的输入为第k个融合块,第m个解码块的输入为第m个融合块的输出和第m
‑
1个解码块的输出;其中,m和k为整数且1≤m<k。11.根据权利要求7
‑
9中任一项所述的方法,其中,所述视差补偿网络的输入为多模态数据,所述多模态数据包括:第一图像特征、三维翘曲代价卷、初始的第一视差图及重建错误参数;其中,所述第一图像特征,为所述特征金字塔中一个或多个用于表征所述第一图像的特征;所述第二图像特征,为所述特征金字塔中一个或多个用于表征所述第二图像的特征;所述三维翘曲代价卷,为由所述特征金字塔中一个或多个所述第一图像特征和所述第二图像特征进行代价运算得到的代价卷;所述初始的第一视差图,为由所述多尺度特征融合网络输出的视差图;所述重建错误参数,为所述特征金字塔中一个或多个所述第一图像特征和所述第二图像特征进行误差比对所得到的参数。12.一种双目立体匹配的装置,包括:提取模块,用于对通过双目摄像头采集同一场景得到的第一图像和第二图像进行多尺度特征提取,得到多尺度的第一子图像特征和多尺度的第二子图像特征;构建模块,用于对所述多尺度的第一子图像特征和所述多尺度的第二子图像特征采用预设维度的代价卷进行多尺度特...
【专利技术属性】
技术研发人员:沈哲伦,张良俊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。