【技术实现步骤摘要】
本专利技术涉及计算机视觉、语义分割领域,具体涉及一种基于多视角深度图像的场景物件分类方法与系统。
技术介绍
1、随着计算机视觉在
的广泛应用,其对于当代经济发展和科技进步的重要性日渐凸显。在计算机视觉领域当中,三维视觉使得计算机对三维空间的感知、理解和分析成为可能,而点云是其中一种常用的三维视觉表现形式。
2、相较于其他三维视觉的表现形式,点云的形式只存储物体表面关键点,这使得点云数据的存储需求和传输量都较小,有利于节省存储空间和计算资源,其相应的处理分析算法通常也更高效。这些优点使得点云数据在三维视觉处理中占据了越来越重要的地位。然而在处理点云数据的实际应用中,存在两个关键性问题,分别是点云数据的获取以及点云数据的特征提取与下游任务。
3、在点云数据的获取方面,往往使用三维扫描仪。对户外场景或者自动驾驶场景,一般使用激光雷达来获取;而对于室内场景,最常用的方法是多视角图像生成或深度摄像机生成。多视角图像和深度摄像机的点云生成方法各有其优势。
4、在点云的特征提取和下游任务方面,现在主要采用的是
...【技术保护点】
1.一种基于多视角深度图像的场景物件分类方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述利用所述深度图像Idepth和所述摄像头坐标[x0,y0,z0]生成对应深度图像的点云数据Pview,Pview包含点云在统一坐标系中的坐标[xw,yw,zw]、点云的颜色信息以及深度图像的像素点与点云的映射关系,多个视角的点云数据Pview对齐、融合,生成合成的多视角点云数据Ps,将所述深度图像Idepth的RGB信息提取出来得到多个二维图像Irgb,具体为:
3.如权利要求1所述的一种基于
...【技术特征摘要】
1.一种基于多视角深度图像的场景物件分类方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述利用所述深度图像idepth和所述摄像头坐标[x0,y0,z0]生成对应深度图像的点云数据pview,pview包含点云在统一坐标系中的坐标[xw,yw,zw]、点云的颜色信息以及深度图像的像素点与点云的映射关系,多个视角的点云数据pview对齐、融合,生成合成的多视角点云数据ps,将所述深度图像idepth的rgb信息提取出来得到多个二维图像irgb,具体为:
3.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述对所述合成的多视角点云数据ps进行特征提取得到三维特征f3d,对所述二维图像irgb进行特征提取得到二维特征f2d,将二维特征f2d映射到三维特征f3d上,使得点云中的每个点都有唯一对应的映射二维特征f2d*,将三维特征f3d和映射二维特征f2d*进行对齐和拼接,得到合成的多视角点云数据ps的特征f,具体为:
4.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述将所述合成的多视角点云数据ps和所述特征f输入解码器进行语义分割,得到语义分割结果,即场景中物件的分类结果,具体为:
5.一种基于多视角深度图像的场景物件分类系统,其特征在于,所述系统包括:
6.如权利要求5所述的一种基于多视角深度图像的场景物件分类系统,其特征在于,所述点云数据和二维图像获取单元...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。