【技术实现步骤摘要】
基于归一化回归函数单目深度估计系统训练方法和网络
本专利技术属于计算机视觉领域中的深度估计领域,特别是基于归一化回归函数单目深度估计系统训练方法和网络。
技术介绍
单目深度估计是计算机视觉领域的重要研究课题,其在机器人、自动驾驶、增强现实等领域拥有诸多广泛的应用。近年来出现了一些用无监督方法进行单目深度估计的系统,输入双目图像对,这些方法首先利用深度神经网络对目标图像预测深度,并利用该预测出来的深度图和另外一个参考图片重建出一个新的目标图像。重建出来的图片和原图片之间的光度误差用来优化整个深度神经网络。另外也有一些工作利用传统的立体匹配算法提前对输入的双目图像对进行预处理,得到粗糙的深度图,并利用该粗糙的深度图在系统训练中进行弱监督。但是,这些具有两种损失函数的单目深度估计系统存在一个问题,这两种损失函数形成的训练损失并不平衡,具体表现为,基于光度误差的损失函数会随着系统预测深度的变大而增大,基于回归误差的损失函数会随着系统预测深度的增大而减小,因此,在系统预测大深度值时,回归损失误差会远远超过光度损失误差,因此造成 ...
【技术保护点】
1.一种基于归一化回归函数单目深度估计系统训练方法,其特征在于,包括以下步骤:/nS1,选取数据集,从数据集中读取双目图像,双目图像包括目标图像和参考图像,利用立体匹配算法处理出深度图,作为代理深度标签;/nS2,从数据集的双目图像中选取目标图像输入训练网络,输出预测深度图;/nS3,利用回归函数对预测深度图以及代理深度标签进行回归监督;/nS4,利用预测深度图和双目图像之间的基线距离,先将目标图像的像素点投影到参考图像中,再从参考图像中的投影位置采样合成新像素,生成重建图片;/nS5,通过光度误差损失函数计算目标图像和重建图片之间的图像相似误差,通过深度连续性损失函数计算 ...
【技术特征摘要】
1.一种基于归一化回归函数单目深度估计系统训练方法,其特征在于,包括以下步骤:
S1,选取数据集,从数据集中读取双目图像,双目图像包括目标图像和参考图像,利用立体匹配算法处理出深度图,作为代理深度标签;
S2,从数据集的双目图像中选取目标图像输入训练网络,输出预测深度图;
S3,利用回归函数对预测深度图以及代理深度标签进行回归监督;
S4,利用预测深度图和双目图像之间的基线距离,先将目标图像的像素点投影到参考图像中,再从参考图像中的投影位置采样合成新像素,生成重建图片;
S5,通过光度误差损失函数计算目标图像和重建图片之间的图像相似误差,通过深度连续性损失函数计算预测深度图的光滑误差;
S6,重复S1至S5,直至光度误差损失函数、深度连续性损失函数以及回归函数达到收敛,完成训练。
2.根据权利要求1所述的基于归一化回归函数单目深度估计系统训练方法,其特征在于,所述S2中的立体匹配算法以左图为基准,计算出左图的视差图z后,利用已知的相机焦距f和双目基线距离b将左眼图像的视差图转换成深度图d′l,公式为:d′l=f*b/z。
3.根据权利要求1所述的基于归一化回归函数单目深度估计系统训练方法,其特征在于,所述S2的预测深度图与目标图像的尺寸相同。
4.根据权利要求1所述的基于归一化回归函数单目深度估计系统训练方法,其特征在于,所述S2中训练网络包括编码网络和解码网络,对编码网络进行预训练,解码网络进行初始化。
5.根据权利要求1所述的基于归一化回归函数单目深度估计系统训练方法,其特征在于,所述S3中回归函...
【专利技术属性】
技术研发人员:李承远,
申请(专利权)人:绍兴市北大信息技术科创中心,浙江省北大信息技术高等研究院,杭州未名信科科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。