【技术实现步骤摘要】
一种基于全卷积神经网络FCN的单目图像深度估计方法
本专利技术涉及一种基于全卷积神经网络FCN的单目图像深度估计方法,属于计算机视觉的三维图像重建的
技术介绍
从二维图像中恢复三维深度信息是计算机视觉领域的一个重要问题,也是理解场景几何关系的重要组成部分。图像深度信息在机器人学,场景理解,三维重建等方面有着重要应用。图像深度信息的获取,旨在得到图像中不同对象间的空间位置信息。目前获取图像深度信息的方式主要有两种。一种是通过硬件设备直接获取深度信息,如Kinect。另一种广泛采用的方式是利用同一场景的单幅或者多幅RGB图像序列进行深度估计,包括多视点、双目和单视点。单目图像深度估计,即基于单视点图像的深度估计,和传统的基于多视点以及双目立体匹配的方法不同,它只利用一个视点的视频序列和图像来进行深度估计。因为现实生活中绝大部分应用场景均提供单视点的数据,所以单目图像深度估计更贴近实际的应用需求。但由于单视点图像能提供的信息相对缺乏,因此单目图像深度估计是个比较困难的任务。目前,单目图像深度估计可大致分为两类:基于视觉线索和基于机器学习。基于视觉线索的方法是受 ...
【技术保护点】
一种基于全卷积神经网络FCN的单目图像深度估计方法,其特征在于,包括以下步骤:步骤1、获取训练图像数据;步骤2、将步骤1中得到的训练图像数据输入建立的全卷积神经网络FCN进行训练,其过程包括:将训练图像数据输入全卷积神经网络FCN,由全卷积神经网络FCN内的每一池化层依次输出得到特征图像;及从最后一个池化层开始将其输出特征图像进行放大处理,获得与其前一池化层输出特征图像尺寸一致的特征图像并将二者的特征图像融合,由利用从后向前顺序依次对每个池化层的输出特征图像融合以最终获得预测深度图像;且训练中利用随机梯度下降法SGD对全卷积神经网络FCN中的参数训练;步骤3、获取需要预测深 ...
【技术特征摘要】
1.一种基于全卷积神经网络FCN的单目图像深度估计方法,其特征在于,包括以下步骤:步骤1、获取训练图像数据;步骤2、将步骤1中得到的训练图像数据输入建立的全卷积神经网络FCN进行训练,其过程包括:将训练图像数据输入全卷积神经网络FCN,由全卷积神经网络FCN内的每一池化层依次输出得到特征图像;及从最后一个池化层开始将其输出特征图像进行放大处理,获得与其前一池化层输出特征图像尺寸一致的特征图像并将二者的特征图像融合,由利用从后向前顺序依次对每个池化层的输出特征图像融合以最终获得预测深度图像;且训练中利用随机梯度下降法SGD对全卷积神经网络FCN中的参数训练;步骤3、获取需要预测深度的RGB图像输入训练后的全卷积神经网络FCN,获得对应的预测深度图像。2.根据权利要求1所述基于全卷积神经网络FCN的单目图像深度估计方法,其特征在于:所述步骤1还包括利用数据扩充方法对训练图像样本数据扩充。3.根据权利要求2所述基于全卷积神经网络FCN的单目图像深度估计方法,其特征在于:所述数据扩充方法包括旋转、缩放、颜色转换、随机水平翻转、平...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。