基于多尺度多种类代价体积的实时立体匹配方法组成比例

技术编号：40782810 阅读：17 留言：0更新日期：2024-03-28 19:15

本发明专利技术提出一种基于多尺度多种类代价体积的实时立体匹配方法，包括，获取左右RGB图像；将所述左右RGB图像输入端到端视差预测模型；其中所述端到端视差预测模型包括特征提取模块、代价体积构建模块、代价聚合模块、视差预测模块和视差细化模块；输出视差预测结果。通过本发明专利技术提出的方法，可以精确地恢复原图大小的视差图结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于立体匹配以及双目深度估计领域。

技术介绍

1、随着社会的不断进步和人工智能技术的快速发展，自主智能机器人受到了广泛关注。移动机器人作为自主智能机器人的一种，应用领域众多，如仓储物流、自动驾驶、服务机器人等。以往的机器人的工作一般是按照预先设置好的轨迹，在已知环境中的效果较好，但对于未知的环境往往难以处理。机器人如何感知新的环境成为一个非常重要的问题。

2、视觉在人类对于环境场景中信息的获取上有着极为重要的作用，大概占总信息获取量的百分之七十五以上。通过视觉，人类可以知道所处环境的三维相关信息，从而可以判断该环境中所有物体的形状、大小和位置等信息，所以将视觉传感器应用于机器人是一个必不可少的环节，亦即机器视觉。机器视觉的目标是通过相机模拟人的眼睛来认知并探索世界，其最重要亦为最基本的一步是对外部世界信息的获取，视觉传感器主要有单目相机、双目相机和rgb-d相机。单目相机无法单独地从一幅图像中恢复出周围环境的尺度信息，rgb-d相机在室外环境中容易受到光照环境的影响，而双目相机可以做到通过数学方法得到准确的尺度信息...

【技术保护点】

1.一种基于多尺度多种类代价体积的实时立体匹配方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述将所述左右RGB图像输入端到端视差预测模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过所述特征提取模块从所述左右RGB图像中获取三个尺度的特征图，包括：

4.根据权利要求2所述的方法，其特征在于，所述通过所述代价体积构建模块在所述三个尺度上分别融合左右RGB图像的特征图，获得所述三个尺度大小的代价体积，包括：

5.根据权利要求2所述的方法，其特征在于，所述通过所述代价聚合模块对最小尺度的代价体积用3D...

【技术特征摘要】

1.一种基于多尺度多种类代价体积的实时立体匹配方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述将所述左右rgb图像输入端到端视差预测模型，包括：

3.根据权利要求2所述的方法，其特征在于，所述通过所述特征提取模块从所述左右rgb图像中获取三个尺度的特征图，包括：

4.根据权利要求2所述的方法，其特征在于，所述通过所述代价体积构建模块在所述三个尺度上分别融合左右rgb图像的特征图，获得所述三个尺度大小的代价体积，包括：

5.根据权利要求2所述的方法，其特征在于，所述通过所述代价聚合模块对最小尺度的代价体积用3d卷积进行聚合，包括：

6.根据权利要求2所述的方法，其特征在于，所述通过所述视差预测模块从聚合...

【专利技术属性】
技术研发人员：张金会，吕千一，张亚凯，魏嘉桐，蔡吉山，李思杭，孟焕，邵之玥，赵凯，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人