【技术实现步骤摘要】
一种基于深度估计网络的单目图像深度估计方法及系统
本专利技术涉及计算机视觉领域,尤其是涉及一种基于深度估计网络的单目图像深度估计方法及系统。
技术介绍
在计算机视觉领域,对图像进行深度估计是一项不可或缺的基本任务,在基于视觉的同时定位与建图、三维场景重建、增强现实等领域起着十分重要的作用。传统的深度估计方法通常采用多视图几何的原理,根据场景中的多个视图间的差异,通过几何约束关系建立图像间的对应像素点的关系,从而从二维图像中恢复三维场景的深度及几何形状。由于需要人为的从图像中提取相应特征,建立对应匹配关系,从而得到图像的深度信息,计算量大且复杂。而随着深度学习的迅速发展,并与各个领域相结合后呈现出巨大的潜力和商业价值。深度学习在计算机视觉领域也表现出了强大的解析与表达能力,使得从单张图像中估计深度成为可能,基于深度学习的单目图像深度估计问题也成为近年来研究者们关注的热点之一。但是,由于图像在成像过程中丢失了部分真实三维场景的信息,导致基于二维平面图像的计算机视觉技术存在固有的缺陷。并且由于现实场景的复杂性,存在动态物体 ...
【技术保护点】
1.一种基于深度估计网络的单目图像深度估计方法,具体为:构建深度估计网络,将目标图像输入训练好的深度估计网络,获得目标图像深度图;/n所述的训练过程中采用相机位姿估计步骤;/n其特征在于,所述的深度估计网络包括编码器和解码器,所述的编码器包括5层编码模块,每层编码模块基于ResNeXt50模型构建,所述的解码器包括5层包含跳跃连接的解码模块。/n
【技术特征摘要】
1.一种基于深度估计网络的单目图像深度估计方法,具体为:构建深度估计网络,将目标图像输入训练好的深度估计网络,获得目标图像深度图;
所述的训练过程中采用相机位姿估计步骤;
其特征在于,所述的深度估计网络包括编码器和解码器,所述的编码器包括5层编码模块,每层编码模块基于ResNeXt50模型构建,所述的解码器包括5层包含跳跃连接的解码模块。
2.根据权利要求1所述的一种基于深度估计网络的单目图像深度估计方法,其特征在于,所述的相机位姿估计步骤具体为:
建立相机位姿估计网络,采集包含若干图像序列的训练集,每组图像序列包含1张参考图It和多张对照图Is,将图像序列输入深度估计网络获得It深度图Dt和Is深度图Ds,将Dt和Ds输入位姿估计网络获取It与Is的相机位姿转换关系Tt→s,根据Tt→s和像素点深度得到在Dt的像素点在Ds中对应的像素点,对Is和Ds进行双线性采样获得合成参考图Is→t和合成参考图像深度图Ds→t,根据It、Is→t、Ds和Ds→t训练深度估计网络。
3.根据权利要求2所述的一种基于深度估计网络的单目图像深度估计方法,其特征在于,所述的相机位姿估计网络包括7层卷积模块和1层卷积层,其中每个卷积模块包括1层卷积层和1层ReLU激活函数层。
4.根据权利要求2所述的一种基于深度估计网络的单目图像深度估计方法,其特征在于,所述的训练过程中采用的损失函数πfinal的计算公式为:
πfinal=α*pe(It,Is)+β*Ldepth+γ*Ls
其中,α、β和γ为超参数,pe(It,Is)为重投影损失函数,Ldepth为几何一致性损失函数,Ls为深度图梯度平滑损失函数;
所述的pe(It,Is)的计算公式为:
其中,M为像素点总数;
所述的Ldepth的计算公式为:
所述的Ls计算公式为:
其中,和分别表示水平和竖直方向上的深度图梯度。
5.根据权利要求1所述的一种基于深度估计网络的单目图像深度估计方法,其特征在于,第1层解码模块由第5层编码模块依次连接卷积层和上采样层后与再与第4层编码模块跳跃连接构成,第2层解码模块由第1层解码模块依次连接卷积层和上采样层后与再与第3层编码模块跳跃连接构成,第3层解码模块由第2层解码模块依次连接卷积层和上采样层后与再与第2层编码模块跳跃连接构成,第4层解码模块由第3层解码模块依次连接卷积层和上采样层后与再与第1层编码模块构成跳跃连接产生,第5层解码模块由第4层解码模块依次连接卷积层和上采样层构成,第2~5层解码模块通过Sigmoid激活函数分别输出分辨率为输...
【专利技术属性】
技术研发人员:张皓,扈玲玲,王祝萍,黄超,
申请(专利权)人:同济大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。