基于分组混合的两阶段实时双目深度估计方法及装置制造方法及图纸

技术编号：36193474 阅读：12 留言：0更新日期：2022-12-31 21:14

本说明书实施例提供了一种基于分组混合的两阶段实时双目深度估计方法及装置，其中，方法包括：对原始输入图像进行特征提取，获得相对于原始输入图像1/4和1/8分辨率的特征图；使用1/8分辨率的特征图构建分组距离代价量，得到聚合后的匹配代价量，进一步得到第一阶段视差图；将1/8分辨率的粗估计视差图放大成1/4分辨率视差图，构建分组相关代价量，生成1/4分辨率精估计的视差图，并进一步得到第二阶段视差图；基于第一阶段视差图和第二阶段视差图，使用Adam优化器对损失函数进行模型优化，得到优化模型，使用TensorRT优化器对优化模型的网络层进行推理加速。络层进行推理加速。络层进行推理加速。

全部详细技术资料下载

【技术实现步骤摘要】
基于分组混合的两阶段实时双目深度估计方法及装置

[0001]本文件涉及计算机
，尤其涉及一种基于分组混合的两阶段实时双目深度估计方法、装置、电子设备及存储介质。

技术介绍

[0002]双目深度估计算法广泛应用于机器人导航、增强现实、智能城市和自动驾驶等领域。因此，准确和快速的双目深度估计算法对于资源受限的嵌入式平台具有重要的意义。近年来，随着深度卷积神经网络不断创新，基于深度卷积网络的双目深度估计算法在精度方面得到显著提升。然而，目前高精度的双目深度估计算法通常存在高计算代价、高功耗和高延迟等问题，这使得现有的算法难以在资源受限的嵌入式平台上进行实时地部署。
[0003]双目深度估计算法的步骤主要包括：特征提取、构建代价量、代价聚合和视差回归。其中特征提取、构建代价量和代价聚合这三个步骤对网络的精度和推理速度起着决定性作用。对于特征提取步骤，已有方法主要采用U
‑
Net网络进行提取立体输入图像的特征。具体地，该网络是一种对称的特征编码和特征解码架构，可以同时输出不同尺寸的特征图。然而，U
‑
Net的编码过程中往往会丢失一些重要的特征信息。对于构建代价量步骤，已有方法主要采用全距离、全相关和分组相关代价量来计算匹配代价。具体地，全距离为每个视差级别生成一个单通道距离图，全相关为每个视差级别生成一个单通道相关图。由于全距离和全相关只生成一个单通道距离图和相关图，因此会丢失很多特征信息。分组相关将左右特征划分为若干组，然后逐组计算相关图，这可以获得多个代价匹配方案，最后将该...

【技术保护点】

【技术特征摘要】
1.一种基于分组混合的两阶段实时双目深度估计方法，其特征在于，包括：利用基于切块卷积的特征提取器对原始输入图像进行特征提取，获得相对于原始输入图像1/4和1/8分辨率的特征图；使用1/8分辨率的特征图构建分组距离代价量，通过轻量化的代价聚合网络对所述分组距离代价量进行正则化处理，得到聚合后的匹配代价量，将聚合后的匹配代价量通过视差回归生成1/8分辨率的粗估计视差图，并通过双线性插值上采样成全尺寸，得到第一阶段视差图；将所述1/8分辨率的粗估计视差图放大成1/4分辨率视差图，根据所述1/4分辨率视差图和左图特征进行动态偏移量构建分组相关代价量，将所述分组相关代价量通过代价聚合网络和视差回归获得一个残差图，将所述残差图添加到放大的1/4分辨率视差图中，生成1/4分辨率精估计的视差图，并通过双线性插值上采样成全尺寸，得到第二阶段视差图；基于第一阶段视差图和第二阶段视差图，使用Adam优化器对损失函数进行模型优化，得到优化模型，使用TensorRT优化器对优化模型的网络层进行推理加速。2.根据权利要求1所述的方法，其特征在于，利用基于切块卷积的特征提取器对原始输入图像进行特征提取，获得相对于原始输入图像1/4和1/8分辨率的特征图具体包括：利用基于切块卷积的特征提取器，首先使用切块卷积将原始输入图像逐级下采样到1/2分辨率、1/4分辨率和1/8分辨率，然后对1/4分辨率和1/8分辨率的特征实施深程度的特征提取，，获得相对于原始输入图像1/4和1/8分辨率的特征图。3.根据权利要求1所述的方法，其特征在于，使用1/8分辨率的特征图构建分组距离代价量具体包括：根据公式1，使用1/8分辨率的特征图构建分组距离代价量：其中||
·
‑
·
||1表示计算两个特征之间的L1距离，C
gwd
表示输入图片中像素点相似度的分组距离代价值，d表示视差，x和y表示特征向量，g表示特征组的编号，f
l
和f
r
分别表示左图特征和右图特征。4.根据权利要求1所述的方法，其特征在于，根据所述1/4分辨率视差图和左图特征进行动态偏移量构建分组相关代价量具体包括：基于公式2，根据所述1/4分辨率视差图和左图特征进行动态偏移量构建分组相关代价量：其中，<
·
，
·
>表示计算两个特征之间的内积，C
gwc
表示输入图片中像素点相似度的分组相关代价值，d表示视差，x和y表示特征向量，，g表示特征组的编号，f
l
和f
r
分别表示左图特征和右图特征。5.根据权利要求1所述的方法，其特征在于，所述轻量化的代价聚合网络包括：四个卷积核大小为5
×5×
5的三维卷积层，其中，，第一个5
×5×
5的三维卷积用于提高成本量的维度，第二个和第三个5
...

【专利技术属性】
技术研发人员：杨红，梁必发，黄锦皓，刘成，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人