一种基于CNN模型的多相机融合方法技术

技术编号：38528932 阅读：19 留言：0更新日期：2023-08-19 17:03

一种基于CNN模型的多相机融合方法，该方法的过程包括：S1：使用unity3D构建室内3D模型，确定所需要的相机数量、规格、部署位置以及角度，来达到大型室内空间的全覆盖。然后提取各个相机视角下的图像，完成3D和2D数据集的构造；S2：对图片进行预处理后，使用线段提取器提取图像中符合曼哈顿世界的正交线段，然后使用CNN模型提取语义信息对线段分类；S3：建立全局统一世界坐标系，利用得到的正交线段求出水平方向和竖直方向的旋转，并估计平移参数；S4：根据各个相机的空间位姿，将相机两两配对进行空间融合，根据基本矩阵画极线匹配两相机的检测结果，得到目标的空间位置。得到目标的空间位置。得到目标的空间位置。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN模型的多相机融合方法

[0001]本专利技术涉及到计算机视觉、slam等
，具体涉及一种基于CNN的多相机融合技术。

技术介绍

[0002]多相机融合是一种利用多个摄像机或相机系统获取的图像或视频数据进行融合的技术。它在很多领域都有应用，如计算机视觉、虚拟现实、增强现实、机器人视觉等。以下是多相机融合的一些
技术介绍
：
[0003]相机标定：相机标定是多相机融合的前提和基础。通过相机标定可以得到每个相机的内参和位姿等参数，以便于将多个摄像机拍摄的图像或视频数据进行融合。
[0004]图像对齐：在进行多相机融合之前，需要将每个相机拍摄到的图像进行对齐，使得它们在相空间中处于相同的坐标系下。这可以通过计算图像之间的几何变换关系来实现，例如通过特征点匹配、光流等方法。
[0005]深度估计：深度估计是多相机融合中的关键技术之一。通过对每个相机拍摄到的图像进行深度估计，可以得到场景中物体的三维几何信息，从而更好地进行多相机融合。
[0006]光照估计：在多相机融合中，由于每个相机的光照条件可能不同，因此需要对每个相机拍摄到的图像进行光照估计和校正，以便于更好地进行图像融合。
[0007]视觉SLAM：视觉SLAM是指通过相机的视觉信息进行同时定位和地图构建的技术。在多相机融合中，视觉SLAM可以帮助确定多个相机的位置和姿态信息，从而更好地进行多相机融合。
[0008]多视角几何：多视角几何是指利用多个视角的几何信息进行三维重建和视觉分析的技术。在多相机融合中，...

【技术保护点】

【技术特征摘要】
1.一种基于CNN模型的多相机融合方法，其特征在于，所述方法包括以下步骤：S1：使用unity3D构建包含正交线段的大型室内3D场景数据集，并部署多个具有大视差的相机，采集各个相机视角下的图像。S2：对图片进行预处理后，使用线段提取器提取图像中符合曼哈顿世界的正交线段，使用CNN模型提取语义特征并分类；S3：建立全局统一世界坐标系，利用得到的正交线段求出水平方向和竖直方向的旋转，并估计平移参数；S4：根据各个相机的空间位姿，将相机两两配对进行空间融合，根据基本矩阵画极线匹配两相机的检测结果，得到目标的空间位置。2.根据权利要求1所述的一种基于CNN模型的多相机融合方法，其特征在于，所述步骤S1中，根据现实大型室内空间场景，使用unity3D构建室内3D模型，通过观察各个相机视角所示区域范围，确定所需要的相机数量、规格、部署位置以及调整角度，来达到大型室内空间的全覆盖。最后提取各个相机视角下的图像，以完成3D和2D数据集的构造。3.根据权利要求1所述的一种基于CNN模型的多相机融合方法，其特征在于，所述步骤2中，提取正交线段后，对于几何特征，使用图像中的位置信息和方向信息，分别表示为f
pos
和f
dir
，使用CNN模型从图像中提取特征图。对于某条线段，均匀采样N个点，使用双三次插值计算采样点的值，最后使用加权对特征向量求和，得到每条线段的语义特征f
con
。线段最终表现形式是以上三个特征的串联，描述为：f
line
＝[f
con f
pos f
dir
]
ꢀꢀꢀꢀ
(1)。4.根据权利要求1所述的一种基于CNN模型的多相机融合方法，其特征在于，所述步骤3中，构建所述基于CNN模型的多相机标定模型包括：第一阶段计算水平方向的旋转。首先得到图像中的主要垂直消失点，每一个垂直消失点都能由两条垂直线的投影l1和l2的齐次坐标作叉乘计算...

【专利技术属性】
技术研发人员：张剑华，王东辰，徐祥龙，王军文，夏爱灵，吴子同，
申请(专利权)人：天津理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人