【技术实现步骤摘要】
本公开涉及机器视觉,尤其涉及一种基于动态不确定性的视觉深度估计模型的训练方法及装置。
技术介绍
1、在计算机视觉领域,基于视觉的深度估计(尤其是单目深度估计)因其能够从二维观测中理解场景的三维几何结构、恢复场景深度信息而变得日益重要。经典的深度估计算法或训练方法中,一般需要获取深度真值作为训练标签来进行监督式训练,然而深度真值的获取难度高且标注成本也高,业内一个新趋势是采用自监督深度学习的方式来进行深度估计,不再需要获取深度真值。
2、在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问题:基于自监督深度学习的算法或方案中,训练数据基本都是处于静态场景,然而实际场景中大多数都是针对动态场景中的动态目标进行追踪或深度估计等,由于动态点违反对极几何约束,动态区域部分的重建过程存在异常,导致深度估计自监督学习效果变差;因此相关技术中的处理方式大都是基于一些检测方式来确定动态点所处的区域并剔除这些动态点,采用剔除动态点之后的图像数据用于训练;这样尽管可以减少训练期间一些动态点噪声对训练造成的损坏,但是由于这些动态区域
...【技术保护点】
1.一种基于动态不确定性的视觉深度估计模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,将所述训练集输入至待训练的视觉深度估计模型进行训练迭代,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述预测深度、相对位姿和所述语义标签,确定待重构图像的各个像素点属于动态对象的目标概率矩阵,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第一概率取值按照像素点所在位置排布构成的;所述第二概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第二
...【技术特征摘要】
1.一种基于动态不确定性的视觉深度估计模型的训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,将所述训练集输入至待训练的视觉深度估计模型进行训练迭代,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述预测深度、相对位姿和所述语义标签,确定待重构图像的各个像素点属于动态对象的目标概率矩阵,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第一概率取值按照像素点所在位置排布构成的;所述第二概率矩阵是由待重构图像中各个像素点将自身属于动态对象的第二概率取值按照像素点所在位置排布构成的;
5.根据权利要求1-4中任一项所述的方法...
【专利技术属性】
技术研发人员:钱峻,陆宽,高宇晖,娄博阳,罗云,纪士民,
申请(专利权)人:东方聚智北京科技创新有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。