当前位置: 首页 > 专利查询>浙江大学专利>正文

一种面向立体匹配网络的损失函数构建与视差估计方法技术

技术编号:41350512 阅读:19 留言:0更新日期:2024-05-20 10:04
本发明专利技术公开了一种面向立体匹配网络的损失函数构建与视差估计方法。包括以下步骤:首先,将训练集中的各真值视差图转换为多模态视差分布真值;接着,将训练集中的双目图像输入到立体匹配网络中,网络输出多模态视差分布预测值,计算多模态视差分布预测值和对应的多模态视差分布真值之间的交叉熵并作为损失函数,基于该损失函数对立体匹配网络进行训练,获得训练好的立体匹配网络;最后,将待预测的双目图像输入到训练好的立体匹配网络中,输出获得多模态视差分布预测值,基于多模态视差分布预测值进行视差估计,获得对应的视差图。本发明专利技术能够指导立体匹配网络学习有效的匹配模式,提高视差预测的精度以及网络泛化能力。

【技术实现步骤摘要】

本专利技术涉及计算机视觉中的一种立体匹配方法,特别是涉及了一种面向立体匹配网络的损失函数构建与视差估计方法


技术介绍

1、作为计算机视觉领域一个热门的主题,立体匹配在自动驾驶和虚拟现实等应用中发挥着重要作用。给定一个校正后的双目图像,立体匹配方法旨在为左图中每个像素从右图中寻找到对应的匹配点。传统的立体匹配方法在处理光照变化和弱纹理等方面的可靠性较差,而基于学习的立体匹配方法在这些复杂场景中显示出其优越性。一类典型的立体匹配网络包括4个步骤:特征提取、代价体构建、代价聚合、以及视差估计。

2、立体匹配通常被视为深度学习中的回归任务,并在视差估计阶段使用soft-argmax从输出分布中估计亚像素精度的视差。l1损失常被用作损失函数,但l1损失的主要问题在于其缺乏对代价体的直接监督,因此容易导致网络出现过拟合,并在边缘处产生过度平滑的伪影。

3、另一类研究将立体匹配视为分类任务并使用交叉熵作为损失函数来直接监督代价体。研究人员使用单模态拉普拉斯或高斯分布对真实视差分布进行建模,并仅在输出分布的单个模态范围内估计视差。但这种简单的单模本文档来自技高网...

【技术保护点】

1.一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述1)中,对于每张真值视差图中的每个有效像素,当前有效像素的多模态视差分布真值通过以下步骤计算获得:

3.根据权利要求2所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述1.2)中,将当前局部窗口的中心像素的视差真值作为其所在聚类簇对应的单模态分布的中心位置。

4.根据权利要求2所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述1.3)中,为...

【技术特征摘要】

1.一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述1)中,对于每张真值视差图中的每个有效像素,当前有效像素的多模态视差分布真值通过以下步骤计算获得:

3.根据权利要求2所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述1.2)中,将当前局部窗口的中心像素的视差真值作为其所在聚类簇对应的单模态分布的中心位置。

4.根据权利要求2所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述1.3)中,为当前局部窗口内所有有效像素设置不同的权重,将每个聚类簇中所有有效像素的权重求和后作为该聚类簇的权重。

5.根据权利要求1所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述2)中,损失函数的计算公式如下:

6.根据权利要求1所述的一种面向立体匹配网络的损失函数构建与视差估计方法,其特征在于,所述3...

【专利技术属性】
技术研发人员:项志宇徐鹏
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1