【技术实现步骤摘要】
本说明书涉及计算机视觉,尤其涉及一种场景深度估计模型训练方法、场景深度估计方法及装置。
技术介绍
1、场景深度估计旨在确定某一特定空间区域内各点到探测器的距离,在三维重建、即时定位、机器人视觉导航等多种视觉计算场景中具有重要应用。
2、考虑到利用神经网络训练单目图像深度估计模型,需要大量带有深度信息(作为标签)的训练样本。由于对采集的真实单目图像进行逐像素深度信息的标记耗时且成本高,所以,大多基于无监督域自适应的单目图像深度估计方法;然而,这种无监督微调方式由于缺乏真实标签信息的引入导致训练不稳定。
3、可见,现有单目图像的场景深度估计模型的训练方案会导致训练得到的模型稳定性较差。
技术实现思路
1、本说明书实施例的目的是提供一种场景深度估计模型训练方法、场景深度估计方法及装置,以解决现有技术中单目图像的场景深度估计模型稳定性较差的问题。
2、为解决上述技术问题,本说明书实施例是这样实现的:
3、第一方面,提出了一种场景深度估计模型训练方法,
本文档来自技高网...
【技术保护点】
1.一种场景深度估计模型训练方法,其特征在于,包括:
2.如权利要求1所述的模型训练方法,其特征在于,第一合成图像基于所述真实图像的颜色信息迁移得到第二合成图像时,包括:
3.如权利要求1所述的模型训练方法,其特征在于,将所述图像样本集输入神经网络模型,得到所述神经网络模型预测的所述图像样本的预测场景深度图,包括:
4.如权利要求3所述的模型训练方法,其特征在于,基于构造的多层级混合注意力映射,将所述多层级视觉编码特征逐级映射,得到所述图像样本集中每个图像样本的预测场景深度图,包括:
5.如权利要求4所述的模型训练方法,
...【技术特征摘要】
1.一种场景深度估计模型训练方法,其特征在于,包括:
2.如权利要求1所述的模型训练方法,其特征在于,第一合成图像基于所述真实图像的颜色信息迁移得到第二合成图像时,包括:
3.如权利要求1所述的模型训练方法,其特征在于,将所述图像样本集输入神经网络模型,得到所述神经网络模型预测的所述图像样本的预测场景深度图,包括:
4.如权利要求3所述的模型训练方法,其特征在于,基于构造的多层级混合注意力映射,将所述多层级视觉编码特征逐级映射,得到所述图像样本集中每个图像样本的预测场景深度图,包括:
5.如权利要求4所述的模型训练方法,其特征在于,所述多层级混合注意力映射中,每一层级混合注意力映射包含:通道交叉注意力映射、空间交叉注意力映射和查询交叉注意力映射;
6.如权利要求1-5任一项所述的...
【专利技术属性】
技术研发人员:余家忠,李飞,靳志娟,梁清华,刘子伟,曹润东,刘昱含,
申请(专利权)人:中国铁塔股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。