一种融合稀疏已知标签的单目图像深度估计方法及装置制造方法及图纸

技术编号：20567377 阅读：19 留言：0更新日期：2019-03-14 09:48

本发明专利技术提出了一种融合稀疏已知标签的单目图像深度估计方法及装置，包括：获取待估计RGB图像；利用单线激光雷达获取稀疏已知标签；将所述待估计RGB图像输入到预先建立的深度估计模型中，得到待估计RGB图像的第一深度图；通过全连接层将所述第一深度图与稀疏已知标签融合，得到所述待估计RGB图像的最终深度图。本发明专利技术提供的技术方案通过融合稀疏已知标签，减少了从单目图像映射到深度图的不确定性，从而有效地估计出更加可靠的场景深度。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合稀疏已知标签的单目图像深度估计方法及装置
本专利技术涉及图像处理领域，具体涉及一种融合稀疏已知标签的单目图像深度估计方法及装置。
技术介绍
单目图像估计场景深度是理解场景内几何结构的重要方法，而且，在研究许多其他计算机视觉问题时，融入深度信息能够提高算法的性能，例如语义分割，姿态估计，目标检测。目前已经有可以获取RGB-D深度图像的深度传感器(如微软的Kinect)，但这类传感器感知深度的范围有限(小于4m)，强光下会产生大量的噪声，故而在各种应用场景有其局限性。现有的单目图像深度估计存在很多问题，例如，一张二维图像对应无穷多种真实的3D场景，这就使得将单幅图像映射到深度图存在不确定性，这种不确定性决定了计算机视觉模型在原理上不可能仅凭单幅图像估计出精确的深度值。因此本专利技术提供一种融合稀疏已知标签的单目图像深度估计方法及装置来解决现有技术的不足。
技术实现思路
本专利技术旨在提供一种融合稀疏已知标签的单目图像深度估计方法及装置，解决目前图像深度估计不精确的问题。根据本专利技术一方面，其提供了一种融合稀疏已知标签的单目图像深度估计方法，包括：获取待估计RGB图像；利用单线激光雷达获取稀疏已知标签；将所述待估计RGB图像输入到预先建立的深度估计模型中，得到待估计RGB图像的第一深度图；通过全连接层将所述第一深度图与稀疏已知标签融合，得到所述待估计RGB图像的最终深度图。进一步的，所述利用单线激光雷达获取稀疏已知标签，包括：将单线激光雷达扫描到的点投影到二维相平面，得到稀疏已知标签。进一步的，所述深度估计模型包括：获取多张RGB图像；利用全卷积的深度残差...

【技术保护点】
1.一种融合稀疏已知标签的单目图像深度估计方法，其特征在于，包括：获取待估计RGB图像；利用单线激光雷达获取稀疏已知标签；将所述待估计RGB图像输入到预先建立的深度估计模型中，得到待估计RGB图像的第一深度图；通过全连接层将所述第一深度图与稀疏已知标签融合，得到所述待估计RGB图像的最终深度图。

【技术特征摘要】
1.一种融合稀疏已知标签的单目图像深度估计方法，其特征在于，包括：获取待估计RGB图像；利用单线激光雷达获取稀疏已知标签；将所述待估计RGB图像输入到预先建立的深度估计模型中，得到待估计RGB图像的第一深度图；通过全连接层将所述第一深度图与稀疏已知标签融合，得到所述待估计RGB图像的最终深度图。2.根据权利要求1所述的方法，其特征在于，所述利用单线激光雷达获取稀疏已知标签，包括：将单线激光雷达扫描到的点投影到二维相平面，得到稀疏已知标签。3.根据权利要求1所述的方法，其特征在于，所述深度估计模型包括：获取多张RGB图像；利用全卷积的深度残差网络提取所述RGB图像的特征；利用全连接层将所述特征转换为特征向量；根据损失函数训练所述全卷积的深度残差网络，得到优化后的网络参数；根据优化后的网络参数构建深度估计模型。4.根据权利要求3所述的方法，其特征在于，所述根据损失函数训练所述全卷积的深度残差网络，得到优化后的网络参数，包括：所述损失函数如下式所示：其中，与yi分别为像素i的真实深度值和预测深度值；xi为像素i的真实深度值与预测深度值的差值；c为阈值。5.根据权利要求1所述的方法，其特征在于，所述通过全连接层将所述第一深度图与稀疏已知标签融合，得到所述待估计RGB图像的最终深度图，包括：根据所述第一深度图的特征和稀疏已知标签特征，利用全连接层得到融合稀疏已...

【专利技术属性】
技术研发人员：张一帆，李耀宇，
申请(专利权)人：中国科学院自动化研究所，中国科学院自动化研究所南京人工智能芯片创新研究院，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人