场景深度估计模型训练方法、场景深度估计方法及装置制造方法及图纸

技术编号：41847597 阅读：23 留言：0更新日期：2024-06-27 18:26

本说明书实施例公开了一种场景深度估计模型训练方法、场景深度估计方法及装置，该方法包括：获取包含真实图像、第一合成图像和第二合成图像的图像样本集，该第一合成图像是通过真实图像的场景模拟得到，且包含真实场景深度图；第二合成图像是第一合成图像基于真实图像的颜色信息迁移得到；将获取的图像样本集输入神经网络模型，输出图像样本的集中图像样本的预测场景深度图，基于预测场景深度图和真实场景深度图确定的三元损失函数值，调整神经网络模型的参数，如此反复调试将神经网络模型收敛为场景深度估计模型。这样，可以充分利用具有真实场景深度图的合成图像指导神经网络模型的训练，提升训练稳定性，以得到精准收敛的场景深度估计模型。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及计算机视觉，尤其涉及一种场景深度估计模型训练方法、场景深度估计方法及装置。

技术介绍

1、场景深度估计旨在确定某一特定空间区域内各点到探测器的距离，在三维重建、即时定位、机器人视觉导航等多种视觉计算场景中具有重要应用。

2、考虑到利用神经网络训练单目图像深度估计模型，需要大量带有深度信息(作为标签)的训练样本。由于对采集的真实单目图像进行逐像素深度信息的标记耗时且成本高，所以，大多基于无监督域自适应的单目图像深度估计方法；然而，这种无监督微调方式由于缺乏真实标签信息的引入导致训练不稳定。

3、可见，现有单目图像的场景深度估计模型的训练方案会导致训练得到的模型稳定性较差。

技术实现思路

1、本说明书实施例的目的是提供一种场景深度估计模型训练方法、场景深度估计方法及装置，以解决现有技术中单目图像的场景深度估计模型稳定性较差的问题。

2、为解决上述技术问题，本说明书实施例是这样实现的：

3、第一方面，提出了一种场景深度估计模型训练方法，包括：

本文档来自技高网...

【技术保护点】

1.一种场景深度估计模型训练方法，其特征在于，包括：

2.如权利要求1所述的模型训练方法，其特征在于，第一合成图像基于所述真实图像的颜色信息迁移得到第二合成图像时，包括：

3.如权利要求1所述的模型训练方法，其特征在于，将所述图像样本集输入神经网络模型，得到所述神经网络模型预测的所述图像样本的预测场景深度图，包括：

4.如权利要求3所述的模型训练方法，其特征在于，基于构造的多层级混合注意力映射，将所述多层级视觉编码特征逐级映射，得到所述图像样本集中每个图像样本的预测场景深度图，包括：

5.如权利要求4所述的模型训练方法，其特征在于，所述多层...

【技术特征摘要】

1.一种场景深度估计模型训练方法，其特征在于，包括：

2.如权利要求1所述的模型训练方法，其特征在于，第一合成图像基于所述真实图像的颜色信息迁移得到第二合成图像时，包括：

5.如权利要求4所述的模型训练方法，其特征在于，所述多层级混合注意力映射中，每一层级混合注意力映射包含：通道交叉注意力映射、空间交叉注意力映射和查询交叉注意力映射；

6.如权利要求1-5任一项所述的...

【专利技术属性】
技术研发人员：余家忠，李飞，靳志娟，梁清华，刘子伟，曹润东，刘昱含，
申请(专利权)人：中国铁塔股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人