【技术实现步骤摘要】
基于重参数化的三阶段双目深度估计的方法及装置
[0001]本专利技术涉及双目深度估计领域,尤其是涉及一种基于重参数化的三阶段双目深度估计的方法及装置。
技术介绍
[0002]从双目相机获取的立体图像对中进行深度估计是三维重建的关键一步,其在三维建模、机器人、无人机、增强现实和自动驾驶等领域有着广泛的应用。给定一对立体图像,立体匹配的目的是在左右图像的像素之间建立紧密的对应关系。不同于传统立体匹配算法,近年来,自然语言处理领域的Transformer和计算机视觉领域的结合,催生出视觉Transformer并且迅速崛起,已经有赶超卷积神经网络的势头,依靠深度学习的立体匹配算法已经在精度方面得到显著提升。然而,这也带来了大量的计算成本,使得基于深度学习的立体匹配算法在计算速度和延迟上无法媲美传统的立体匹配算法,因而很多算法只能存在于实验室中,不能落地在实际应用当中。
[0003]基于有监督学习的端到端双目深度估计神经网络是在最近五年才发展起来的,发展到现在,网络的结构已基本定型,大体可分为:体征提取、成本量构建、代价聚合和视差回归等这几步。对于特征提取,虽然视觉Transformer在精度上比卷积神经网络有优势,但是其严重依赖庞大的数据集和高性能显卡,使得基于Transformer的深度估计算法仍处在高速发展的阶段,而以往的基于卷积神经网络的深度估计算法仍具备巨大的优势,并没有衰减的势头,反而因为Transformer网络的崛起,使得人们不断通过实验验证推敲过往卷积神经网络中大量不合理的实验方式。因而催生出将训练和 ...
【技术保护点】
【技术特征摘要】
1.一种基于重参数化的三阶段双目深度估计的方法,其特征在于,包括:S1、利用基于MobileOne重参数化模块的特征提取器将输入图像对做特征提取,获得相对于输入图像1/4、1/8和1/16分辨率的特征图;S2、使用获得的1/16分辨率特征图来构建分组相关成本量;S3、分组相关成本量通过带有三维卷积的代价聚合网络后,得到聚合后的匹配成本量;S4、聚合后的匹配成本量通过基于方差的视差回归网络生成1/16分辨率的粗估计视差图,并通过双线性插值上采样成全尺寸,得到第一阶段视差图;S5、第一阶段1/16分辨率的粗估计视差图通过双线性插值上采样成1/8分辨率的视差图,并通过视差范围不确定性估计网络生成视差样本,使用该视差样本、左图特征和扭曲的右图像特征构建距离相关成本量,距离相关成本量通过带有二维卷积的代价聚合网络后,得到聚合后的匹配成本量,聚合后的匹配成本量通过基于方差的视差回归网络生成1/8分辨率的微粗估计视差图,并再次通过双线性插值上采样成全尺寸,得到第二阶段视差图;S6、重复S5得到1/4分辨率的精估计视差图,并通过双线性插值上采样成全尺寸,得到第三阶段视差图;S7、在大型虚拟数据集SceneFlow上进行预训练,然后在混合的KITTI 2012和KITTI 2015训练集上进行微调,并在KITTI的验证集上进行验证结果,最后将结果上传至KITTI官网进行测试,使用Adam优化器进行优化模型;S8、利用TensorRT对优化后的模型进行推理加速。2.根据权利要求1所述的方法,其特征在于,所述S1具体包括:利用基于MobileOne重参数化模块的特征提取器将输入图像对做特征提取,获得相对于输入图像1/4、1/8和1/16分辨率的特征图;特征提取器第一步通过步长为2,填充为3的7
×
7卷积层对特征图进行卷积,使得特征图的尺寸减小为相对于原始输入图像1/2,再通过四个连续的MobileOne重参数化模块;第二步通过步长为2的2
×
2卷积层将特征图的尺寸减小为相对于原始输入图像1/4,再通过两个连续的MobileOne重参数化模块;重复第二步的操作直至特征图的尺寸减小为相对于原始输入图像1/16,期间不断增大特征通道的大小,MobileOne重参数化模块的步骤包括:第一步通过三个分支,分别为重参数化跳连分支、重参数化卷积分支和重参数化尺度分支,重参数化跳连分支使用了一个BN层;重参数化卷积分支是k个带有一个3
×
3卷积层和一个BN层的模块;重参数化尺度分支使用了一个3
×
3卷积层和一个BN层;之后三个分支相加汇入一个RELU激活函数;第二步从第一步RULU激活函数输出,通过两个分支,分别为重参数化跳连分支和重参数化卷积分支,重参数化跳连分支使用了一个BN层;重参数化卷积分支是k个带有一个3
×
3卷积层和一个BN层的模块;之后两个分支相加汇入一个RELU激活函数输出最终结果。3.根据权利要求2所述的方法,其特征在于,所述S2具体包括:将左图特征和右图特征划分为若干组,然后逐组计算相关图,这可以获得多个相关成本量匹配方案,最后将该匹配方案合并成一个分组相关成本量,分组相关成本量Cgwc的具体公式分别为:
其中,<
·
,
·
>表示计算两个特征之间的内积,d表示视差,x和y...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。