一种基于多视角卷积池化的三维点云数据分类方法技术

技术编号:25709853 阅读:85 留言:0更新日期:2020-09-23 02:56
本发明专利技术提供一种基于多视角卷积池化的三维点云数据分类方法,包括:将原始三维点云模型渲染成n个不同视角的二维图像,得多视角的二维图像图片集;在二维图像图片集中进行学习,得n个视角的深度视觉特征;将深度视觉特征转换为m×n大小的特征图,而后聚合不同视角的深度视觉特征,得聚合后的深度视觉特征向量;使用全连接神经网络将2m×1长度的特征向量转换为C×1的特征向量,再输入当前样本属于不同类别的概率分布情况,得预测向量;使用预测向量和当前样本的真实向量来计算交叉熵损失,而后迭代训练优化三维点云分类模型中的学习参数,重复上述步骤,迭代优化直到交叉熵损失为最小不再降低,即得到最优模型,再将最优模型用于预测测试集中样本的类别。

【技术实现步骤摘要】
一种基于多视角卷积池化的三维点云数据分类方法
本专利技术涉及一种数据分类方法,具体涉及一种基于多视角卷积池化的三维点云数据分类方法。
技术介绍
当前,通过各类机载、车载、手持三维扫描仪等设备均可快捷、高效地获取高精度大范围的点云数据用于三维重建、机器人、逆向工程、虚拟现实技术等应用领域。在这些点云数据应用处理的过程中,点云分类是不可缺失的重要组成部分,也是当前计算机科学相关领域的研究重点和热点。基于深度学习的三维点云数据分类方法主要有四类:基于体素卷积神经网络,基于多视角卷积神经网络,基于特征和深度神经网络,和基于点云的方法。基于体素卷积神经网络的代表方法是美国卡内基梅隆大学的Maturana等人提出的VoxNet。然而,因为数据稀疏问题,体素结构受限于它的分辨率。三维卷积的计算复杂度相对于体素分辨率呈立体增长。此外,由于大多数三维几何表示是基于边界的,因此占用的区域不会随着离散化的大小成比例地增加,从而导致计算浪费。基于多视角卷积神经网络的代表方法是美国马萨诸塞大学阿默斯特分校的Su提出的Multi-view-CNN。本文档来自技高网...

【技术保护点】
1.一种基于多视角卷积池化的三维点云数据分类方法,其特征在于,包括如下步骤:/n步骤1,通过PointImage预处理方法将原始三维点云模型渲染成n个不同视角的二维图像,从而得到多视角的二维图像图片集;/n步骤2,基于迁移学习的骨干模型在所述二维图像图片集中进行学习,得到n个视角的深度视觉特征;/n步骤3,将学习到的所述深度视觉特征转换为m×n大小的特征图,使用ConvPooling的提升版Conv2Pooling池化方法来聚合不同视角的深度视觉特征,得到聚合后的深度视觉特征向量;/n步骤4,使用全连接神经网络将2m×1长度的特征向量转换为C×1的特征向量,再通过Softmax函数输入当前样本...

【技术特征摘要】
1.一种基于多视角卷积池化的三维点云数据分类方法,其特征在于,包括如下步骤:
步骤1,通过PointImage预处理方法将原始三维点云模型渲染成n个不同视角的二维图像,从而得到多视角的二维图像图片集;
步骤2,基于迁移学习的骨干模型在所述二维图像图片集中进行学习,得到n个视角的深度视觉特征;
步骤3,将学习到的所述深度视觉特征转换为m×n大小的特征图,使用ConvPooling的提升版Conv2Pooling池化方法来聚合不同视角的深度视觉特征,得到聚合后的深度视觉特征向量;
步骤4,使用全连接神经网络将2m×1长度的特征向量转换为C×1的特征向量,再通过Softmax函数输入当前样本属于不同类别的概率分布情况,得到预测向量,其中C为待分类的类别数;
步骤5,使用由步骤4中得到的所述预测向量和当前样本的真实向量来计算交叉熵损失,而后通过BP优化方法来优化三维点云分类模型中的学习参数;
步骤6,重复步骤2到步骤5,迭代优化直到所述交叉熵损失为最小不再降低,即训练的模型为最优模型,再将所述最优模型用于预测测试集中样本的类别。


2.根据权利要求1所述的基于多视角卷积池化的三维点云数据分类方法,其特征在于:
其中,所述步骤1包括如下子步骤:
步骤1-1,根据预先设置的分辨率R将所在的所述原始三维点云模型所在空间划分为由个体素网格单元组成的体素网格空间;
步骤1-2,对于处于同个网络单元的C中的n个点,将其近似为同一个点,其坐标为C在体素空间中的坐标(rx,ry,rz);
步骤1-3,根据选取的视角,将体素化的三维模型渲染成多个不同视角的二维图像,从而得到多视角的所述二维图像片集。


3....

【专利技术属性】
技术研发人员:窦曙光王文举
申请(专利权)人:上海理工大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1