一种基于多尺度特征融合的单目深度估计方法技术

技术编号：31717695 阅读：27 留言：0更新日期：2022-01-01 11:25

本发明专利技术涉及一种基于多尺度特征融合的单目深度估计方法，属于三维场景感知领域，包括以下步骤：S1：引入Non

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多尺度特征融合的单目深度估计方法

[0001]本专利技术属于三维场景感知领域，涉及一种基于多尺度特征融合的单目深度估计方法。

技术介绍

[0002]目前主流的单目深度估计方法分为无监督学习方法和有监督学习方法。无监督学习方法不需要采集真实的深度标签，训练时利用原图像和目标图像构成的立体图像对，首先利用编码器预测原图像的深度图，然后用解码器结合目标图片和预测的深度图重构原图，将重构的图片与原图对比计算损失。有监督学习方法是目前最流行的方法之一，通常利用深度相机或激光雷达采集深度标签，把图像深度估计作为回归任务或者是分类任务进行处理。大多数单目深度估计模型的编码网络由于特征提取不充分及特征提取阶段会丢失空间结构信息，并且由于实际场景结构复杂，普通的局部卷积模块难以考虑特征上下文之间的空间结构关系，造成估计深度图尺度模糊和失真的现象发生。针对这个问题，文献“Chen等人，Structure
‑
aware residual pyramid network for monocular depth estimation.In th本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度特征融合的单目深度估计方法，其特征在于：包括以下步骤：S1：引入Non
‑
Local注意力机制，构造混合的归一化函数；S2：在特征提取网络的本层特征、深层特征和浅层特征之间引入注意力机制，计算特征图上特征之间的关联信息矩阵；S3：构建多尺度特征融合模块；S4：在解码网络引入空洞空间金字塔池化模块，扩大卷积的感受野，迫使网络学习更多的局部细节信息。2.根据权利要求1所述的基于多尺度特征融合的单目深度估计方法，其特征在于：所述步骤S1包括：在Non
‑
Local的基础上，构造混合的SoftMox层作为归一化函数，归一化函数的计算公式如下：式如下：其中是第n个部分的相似度得分，i是特征图上的当前像素点，j是特征图上的所有像素点，π
n
表示第n个聚合权重，N表示特征图划分的数量，w
n
是一个网络训练中可学习的线性向量，是对应于特征图X上每个区域k
j
的算数均值。3.根据权利要求1所述的基于多尺度特征融合的单目深度估计方法，其特征在于：所述步骤S2具体包括以下步骤：S21：通过自转换，利用特征图上的其它特征点k
j
来对当前特征点q
i
进行关系建模，计算公式如下：公式如下：其中，w
i,j
表示空间注意力图，F
mos
(
·
)表示归一化函数，q
i,n
表示索引，k
j,n
表示键，表示逐元素相乘，表示自转换后的特征图，v
j
表示值；S22：通过自上而下的特征转换，利用高维的语义信息对低维特征的上下文信息进行建模，计算公式如下：w
i,j
＝F
mos
(F
eud
(q
i,n
,k
j,n
))式中，F
eud
(
·
)表示特征图上两个像素点之间的欧式距离；S23：通过自下而上的特征转换，在不同尺度的特...

【专利技术属性】
技术研发人员：周非，邓朝龙，张黎敏，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人