基于动态不确定性的视觉深度估计模型的训练方法及装置制造方法及图纸

技术编号:46049216 阅读:8 留言:0更新日期:2025-08-11 15:38
本公开涉及一种基于动态不确定性的视觉深度估计模型的训练方法,该方法包括:获取训练集,训练集包含动态场景下时序帧对应的多组图像对;将训练集输入至待训练的视觉深度估计模型进行训练迭代,视觉深度估计模型包含:深度预测网络、位姿预测网络和语义分割网络;训练期间通过结合几何一致性自发现掩码和语义分割掩码综合确定待重构图像中各个像素点对应的动静对象状态;待重构图像为图像对中选择的一个图像;根据动静对象状态结合图像对的重构处理确定针对动态对象区域的目标损失函数。其中,在训练迭代的期间以降低目标损失函数为优化目标,训练完成的深度预测网络用于进行单目视觉深度估计,在动态场景下的推理准确性提升。

【技术实现步骤摘要】

本公开涉及机器视觉,尤其涉及一种基于动态不确定性的视觉深度估计模型的训练方法及装置


技术介绍

1、在计算机视觉领域,基于视觉的深度估计(尤其是单目深度估计)因其能够从二维观测中理解场景的三维几何结构、恢复场景深度信息而变得日益重要。经典的深度估计算法或训练方法中,一般需要获取深度真值作为训练标签来进行监督式训练,然而深度真值的获取难度高且标注成本也高,业内一个新趋势是采用自监督深度学习的方式来进行深度估计,不再需要获取深度真值。

2、在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问题:基于自监督深度学习的算法或方案中,训练数据基本都是处于静态场景,然而实际场景中大多数都是针对动态场景中的动态目标进行追踪或深度估计等,由于动态点违反对极几何约束,动态区域部分的重建过程存在异常,导致深度估计自监督学习效果变差;因此相关技术中的处理方式大都是基于一些检测方式来确定动态点所处的区域并剔除这些动态点,采用剔除动态点之后的图像数据用于训练;这样尽管可以减少训练期间一些动态点噪声对训练造成的损坏,但是由于这些动态区域在训练中没有充分正则本文档来自技高网...

【技术保护点】

1.一种基于动态不确定性的视觉深度估计模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述训练集输入至待训练的视觉深度估计模型进行训练迭代,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述预测深度、相对位姿和所述语义标签,确定待重构图像的各个像素点属于动态对象的目标概率矩阵,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第一概率取值按照像素点所在位置排布构成的;所述第二概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第二概率取值按照像素点所...

【技术特征摘要】

1.一种基于动态不确定性的视觉深度估计模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述训练集输入至待训练的视觉深度估计模型进行训练迭代,包括:

3.根据权利要求2所述的方法,其特征在于,根据所述预测深度、相对位姿和所述语义标签,确定待重构图像的各个像素点属于动态对象的目标概率矩阵,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第一概率取值按照像素点所在位置排布构成的;所述第二概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第二概率取值按照像素点所在位置排布构成的;

5.根据权利要求1-4中任一项所述的方法...

【专利技术属性】
技术研发人员:钱峻陆宽高宇晖娄博阳罗云纪士民
申请(专利权)人:东方聚智北京科技创新有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1