【技术实现步骤摘要】
三维场景重建中低分辨率图像单目深度估计系统及方法
[0001]本专利技术涉及一种图像处理技术,具体的说是一种三维场景重建中低分辨率图像单目深度估计系统及方法。
技术介绍
[0002]像素级的深度信息往往采用深度传感器等代价昂贵的仪器来获得。随着计算机算力的不断发展,基于大数据驱动的深度学习算法的信息挖掘能力不断的增强。使得单目自监督算法在深度估计上的部署成为一种可能。在计算机视觉领域,随着各种特征提取网络的深度和宽度不断的提升,使得研究人员可以不断的得到图像的高维信息。单幅图像的深度估计本质上是建立一个图像的像素值和实际场景的深度值之间的一个映射关系。其本身上是一个不适定问题,即我们无法像深度传感器一样得到物体间的绝对深度关系,只能得到视野中各物体的相对位置关系。而在实际应用中,得到物体之间的相对深度就足够计算出场景中各个物体的相对位置关系,从而满足视频三维重建的任务要求。而部署价格昂贵的深度传感器得到的绝对深度的性价比比只部署单目摄像头的性价比要低得多。所以单目深度估计依然在场景重建,三维物体检测,机器人视觉和自动驾驶中发挥着巨大的作用。
[0003]深度估计方向整体分为单目深度估计和双目深度估计两个方面,早期的深度估计采用传统方法通过立体匹配算法和运动恢复结构从立体图像或者图像序列中来推算深度信息,但是这些方法严重的依赖于输入的多视图几何图像,双目深度估计或者多视点方法大多数都可以得到相当精准的深度信息,这是因为在多个视角中确定三维空间某一点在二维平面上的投影,在已知相机内参和视角之间的位置关系后,这个问 ...
【技术保护点】
【技术特征摘要】
1.一种三维场景重建中低分辨率图像单目深度估计方法,其特征在于:所述低分辨率图像单目深度估计方法包括如下步骤:步骤1、构建适合EDSR训练的数据库K
‑
DIV2K数据集,所述K
‑
DIV2K数据集由部分DIV2K数据集与KITTI数据集共同构成;步骤2、采用K
‑
DIV2K数据集分别训练EDSR放大2倍、放大3倍和放大4倍模型,得到具有不同放大能力的超分辨率放大模块,在训练时将KITTI图片和EDSR原本的图片进行交替输入;步骤3、将步骤2中得到的三种不同放大能力的超分辨率放大模块进行多尺度深度预测,得到12个尺度的输入图片;步骤4、将步骤3中其中九个尺度的输入图片送到单目深度估计网络架构中,采用空洞卷积提取图像中的特征图,最终恢复出深度信息图。2.根据权利要求1所述三维场景重建中低分辨率图像单目深度估计方法,其特征在于:在所述步骤1中,所述K
‑
DIV2K数据集的构建包括如下步骤:步骤1
‑
1、将KITTI数据集中的图片统一缩放到1200
×
300大小;步骤1
‑
2:缩放后对KITTI数据集进行等比例缩小两倍、缩小三倍和缩小四倍并在保存时打上标签;步骤1
‑
3:将原本的DIV2K数据集提取一部分与KITTI数据集共同构成K
‑
DIV2K数据集。3.根据权利要求1所述三维场景重建中低分辨率图像单目深度估计方法,其特征在于:在所述步骤3中,所述多尺度深度预测为九尺度深度预测。4.根据权利要求1所述三维场景重建中低分辨率图像单目深度估计方法,其特征在于:在所述步骤4中,所述单目深度估计网络架构由深度预测网络和位姿预测网络构成。5.根据权利要求4所述三维场景重建中低分辨率图像单目深度估计方法,其特征在于:所述深度预测网络是一个完全卷积的U
‑
Net网络,通过编码器提取输入图像的多维特征,然后通过解码器恢复出原图的深度图,采用的原理是通过位姿网络得到俩帧之间的时差,而深度即为视差的倒数。6.根据权利要求1所述三维场景重建中低分辨率图像单目深度估计方法,其特征在于:所述低分辨率图像单目深度估计方法采用重投影损失函数和光滑损失函数来作为训练过程的无监督约束。7.根据权利要求6所述三维场景重建中低分辨率图像单目深度估计方法,其特征在于:所述步骤6中的重投影损失L
p
由光度误差函数在Pe在t
′
...
【专利技术属性】
技术研发人员:程德强,韩成功,赵佳敏,寇旗旗,陈亮亮,赵凯,
申请(专利权)人:江苏华图矿业科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。