【技术实现步骤摘要】
基于几何约束的深度学习单目深度估计方法
[0001]本专利技术是一种基于几何约束的深度学习单目深度估计方法,属于三维立体视觉领域
。
技术介绍
[0002]单目深度估计是计算机视觉的一个重要研究方向,其目的是通过单张
RGB
场景图像估计对应图像的场景深度信息;单目深度估计在自动驾驶
、
机器人
、
三维建模等领域有着广泛的应用;基于几何约束的深度学习单目深度估计方法通过在深度学习过程中加入平面几何约束,通过学习几何参数的方法得到相应的特征图,并通过对这些特征图进行融合,最后得到对应图像每个像素的深度信息
。
[0003]虽然已有的多种算法取得较好的深度估计效果,但因在深度估计中采用的深度学习方法仅对图像数据进行学习,忽略了已有场景中的空间几何先验信息,导致已有方法的深度估计效果受限,并且存在深度学习网络难以收敛,学习速度慢,时间和资源消耗大的问题
。
技术实现思路
[0004]本专利技术的目的在于提出一种基于几何约束的深度学习单目深度估计方法,其可以在保证准确度和完整度的情况下,高效地对图像场景的深度信息进行估计
。
[0005]本专利技术通过在深度学习过程中引入平面几何约束的方式对图像场景深度进行估计;首先通过编码器对原始图像进行编码,然后通过引入了平面几何约束的解码器对编码得到的特征图进行解码,最后将解码得到的特征图传入自注意力模型生成对应的深度图
。
本专利技术通过在解码器中引入平面 ...
【技术保护点】
【技术特征摘要】
1.
基于几何约束的深度学习单目深度估计方法,可以在保证准确度和完整度的情况下,高效地对图像场景的深度信息进行估计,其特征在于提出了一套基于几何约束的深度学习单目深度估计方法,其特征主要包含如下步骤:
1)
读取原始图像
(H
×
W
×
3)
,输入编码器网络
Efficient Net B5
,编码器包括九个卷积层,并生成4种大小的特征图,分别是原始图像的
1/2、1/4、1/8、1/16、1/32
;
1/32
大小的特征图通过
3x3
卷积层并上采用后通过残差连接与
1/16
大小的特征图进行通道合并;
2)
合并后的特征图通过上采用后通过残差连接与
1/8
大小的特征图进行通道合并;
3)
合并后的特征图通过上采样后与
1/4
大小的特征图合并,然后通过残差连接与多个不同粒度的深度几何约束层进行通道合并,分别为1×1,2×2,4×4,8×8四种粒度;
4)
深度几何约束层的计算步骤如下:
5)
在空间中同一平面中的点
P
满足平面公式:
n
·
P+d
=
0#(1)
其中
n
=
(a,b,c)
T
,d
为平面参数;
6)
在针孔相机模型中,相机平面中的点
(u...
【专利技术属性】
技术研发人员:刘怡光,李灿斌,唐天航,陈杰,史雪蕾,于智诚,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。