当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于多视角深度图像的场景物件分类方法与系统技术方案

技术编号:43786231 阅读:36 留言:0更新日期:2024-12-24 16:20
本发明专利技术公开了一种基于多视角深度图像的场景物件分类方法与系统。包括:部署三个深度摄像头、记录摄像头坐标,并拍摄深度图像;利用深度图像和摄像头坐标生成对应深度图像的点云数据,并将多个视角的点云数据对齐融合,生成合成的多视角点云,利用深度图像获得二维图像;对多视角点云提取三维特征,对二维图像提取二维特征,将二维特征映射到三维特征上,将三维特征和映射二维特征进行对齐和拼接,得到多视角点云的特征;将多视角点云及其特征输入解码器进行语义分割,得到场景中物件的分类结果。本发明专利技术能够结合多视角图像和深度摄像机两种点云生成方法的优势,提高点云数据质量,充分利用二维特征和三维特征的信息,提升语义分割的效果。

【技术实现步骤摘要】

本专利技术涉及计算机视觉、语义分割领域,具体涉及一种基于多视角深度图像的场景物件分类方法与系统


技术介绍

1、随着计算机视觉在
的广泛应用,其对于当代经济发展和科技进步的重要性日渐凸显。在计算机视觉领域当中,三维视觉使得计算机对三维空间的感知、理解和分析成为可能,而点云是其中一种常用的三维视觉表现形式。

2、相较于其他三维视觉的表现形式,点云的形式只存储物体表面关键点,这使得点云数据的存储需求和传输量都较小,有利于节省存储空间和计算资源,其相应的处理分析算法通常也更高效。这些优点使得点云数据在三维视觉处理中占据了越来越重要的地位。然而在处理点云数据的实际应用中,存在两个关键性问题,分别是点云数据的获取以及点云数据的特征提取与下游任务。

3、在点云数据的获取方面,往往使用三维扫描仪。对户外场景或者自动驾驶场景,一般使用激光雷达来获取;而对于室内场景,最常用的方法是多视角图像生成或深度摄像机生成。多视角图像和深度摄像机的点云生成方法各有其优势。

4、在点云的特征提取和下游任务方面,现在主要采用的是以pointnet为本文档来自技高网...

【技术保护点】

1.一种基于多视角深度图像的场景物件分类方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述利用所述深度图像Idepth和所述摄像头坐标[x0,y0,z0]生成对应深度图像的点云数据Pview,Pview包含点云在统一坐标系中的坐标[xw,yw,zw]、点云的颜色信息以及深度图像的像素点与点云的映射关系,多个视角的点云数据Pview对齐、融合,生成合成的多视角点云数据Ps,将所述深度图像Idepth的RGB信息提取出来得到多个二维图像Irgb,具体为:

3.如权利要求1所述的一种基于多视角深度图像的场景...

【技术特征摘要】

1.一种基于多视角深度图像的场景物件分类方法,其特征在于,所述方法包括:

2.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述利用所述深度图像idepth和所述摄像头坐标[x0,y0,z0]生成对应深度图像的点云数据pview,pview包含点云在统一坐标系中的坐标[xw,yw,zw]、点云的颜色信息以及深度图像的像素点与点云的映射关系,多个视角的点云数据pview对齐、融合,生成合成的多视角点云数据ps,将所述深度图像idepth的rgb信息提取出来得到多个二维图像irgb,具体为:

3.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述对所述合成的多视角点云数据ps进行特征提取得到三维特征f3d,对所述二维图像irgb进行特征提取得到二维特征f2d,将二维特征f2d映射到三维特征f3d上,使得点云中的每个点都有唯一对应的映射二维特征f2d*,将三维特征f3d和映射二维特征f2d*进行对齐和拼接,得到合成的多视角点云数据ps的特征f,具体为:

4.如权利要求1所述的一种基于多视角深度图像的场景物件分类方法,其特征在于,所述将所述合成的多视角点云数据ps和所述特征f输入解码器进行语义分割,得到语义分割结果,即场景中物件的分类结果,具体为:

5.一种基于多视角深度图像的场景物件分类系统,其特征在于,所述系统包括:

6.如权利要求5所述的一种基于多视角深度图像的场景物件分类系统,其特征在于,所述点云数据和二维图像获取单元...

【专利技术属性】
技术研发人员:苏卓谢浩林周凡林格
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1