当前位置: 首页 > 专利查询>南京大学专利>正文

一种基于双目深度估计的数据增强方法技术

技术编号:41723277 阅读:46 留言:0更新日期:2024-06-19 12:47
本发明专利技术公开了一种基于双目深度估计的数据增强方法,通过调整数据集视差分布,提高双目深度估计网络在视差低占比区域的准确性,所述方法包括:对数据集进行随机采样,得到原始视差分布;数据集中每张视差图以50%的概率被选中进行后续操作,另外50%的数据不做增强,直接输出;对于进行后续操作的图像对,分别进行随机平移变换和缩放变换,通过改变图像对视差大小从而调整数据集视差分布;通过掩码操作使模型只关注指定视差范围,模型在数据增强后的数据集上进行训练。本发明专利技术借助双目视觉的方法调整图像对的视差大小,从而使整个数据集在目标视差范围达到均匀分布,提升网络在实际应用场景的推理能力与泛化能力。

【技术实现步骤摘要】

本专利技术涉及双目深度估计领域,特别是涉及了一种基于双目深度估计的数据增强方法


技术介绍

1、双目深度估计是计算机视觉领域中的一个具有挑战性的问题,其目标是在给定一对经过矫正的图像对的情况下,计算两个对应像素之间的位移,即视差。它可以用于许多应用,如自动驾驶、增强现实、模拟虚化渲染等。

2、传统双目深度估计算法主要基于视差计算,包括块匹配、自适应窗口匹配、角点匹配等方法。块匹配将图像分块,计算块间视差;自适应窗口匹配根据像素点纹理和亮度调整匹配窗口;角点匹配使用关键点检测算法。这些方法简单易实现,对纹理丰富、亮度一致的场景效果好。然而,它们对纹理贫乏、光照变化大的区域性能较差,需要高精度相机标定,且无法自动学习抽象特征。

3、随着深度学习的不断发展以及高精度数据集的提出,基于卷积神经网络(cnn)的双目深度估计算法逐渐达到了很高的性能。这些方法通过训练一个深度神经网络来学习从输入图像到深度图像的映射。为了提高算法的准确性,研究者们花费很大的精力在网络结构的设计上,包括使用卷积神经网络进行端到端的深度估计、使用自编码器进行无监督深度本文档来自技高网...

【技术保护点】

1.一种基于双目深度估计的数据增强方法,其特征在于,通过调整数据集视差分布,提高双目深度估计网络在在视差低占比区域的准确性。

2.根据权利要求1所述的基于双目深度估计的数据增强方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的基于双目深度估计的数据增强方法,其特征在于,所述随机平移变换,是通过目标视差与视差图中密集程度最高视差的关系,确定最大视差偏移量,调整图像对的视差从而使整个数据集视差分布更加均匀。

4.根据权利要求2所述的基于双目深度估计的数据增强方法,其特征在于,所述随机缩放变换,是通过目标视差与最大视差的关系,确定缩放因子,对左右图及...

【技术特征摘要】

1.一种基于双目深度估计的数据增强方法,其特征在于,通过调整数据集视差分布,提高双目深度估计网络在在视差低占比区域的准确性。

2.根据权利要求1所述的基于双目深度估计的数据增强方法,其特征在于,包括以下步骤:

3.根据权利要求2所述的基于双目深度估计的数据增强方法,其特征在于,所述随机平移变换...

【专利技术属性】
技术研发人员:李杨都思丹郑嘉璇吴佳昱陆天昊许署文
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1