【技术实现步骤摘要】
基于动静态卷积融合神经网络的多视图三维点云分类方法
[0001]本专利技术属于三维点云分类
,具体涉及一种基于动静态卷积融合神经网络的多视图三维点云分类方法。
技术介绍
[0002]近年来,随着人工智能和深度学习技术的飞速发展,三维感知和理解领域取得了突破性进展。而点云作为三维感知和理解的重要表现形式,其包含了更加丰富的几何形状和结构信息。三维点云主要是通过激光雷达、RGB
‑
D相机以及其他传感器设备采集得到,其广泛应用城市环境的监测、城市形态的分析、道路自动驾驶、计算机视觉、机器人研发和逆向工程建模等诸多领域。与三维点云相关的研究领域又包括基于点云的分类、目标检测、分割、配准、去噪等等,而这其中三维点云的分类是最基础且重要的环节之一,因此对于点云的分类研究,特别是如何提高点云分类的准确度和效率成为相关学界广泛关注的热点。
[0003]当下对三维点云的分类方法主要包括基于体素、基于直接点云和基于多视图的方法,这三种方法又各自受到了大量学者的关注与研究。以下将对现有技术中的这三种方法及其问题、不足进行简要说明。
[0004]一、基于体素的三维点云分类
[0005]体素即体积像素,其用恒定的标量或者向量表示一个立体的区域,由于体素可以用可简化的、离散的单元如粒子来表示复杂的对象,所以它们在模拟真实世界中复杂对象的行为方面具有十分强大的功能,并且体素本身的结构表示也较为简单。Victoria Plaza等人提出了基于体素的自然环境三维点云数据分类方法,该模型利用多层感知机对内 ...
【技术保护点】
【技术特征摘要】
1.一种基于动静态卷积融合神经网络的多视图三维点云分类方法,其特征在于,包括如下步骤:步骤S1,通过FSDC
‑
Net的多视图选取部分将输入的三维点云投影变换为多视图表征;步骤S2,通过所述FSDC
‑
Net的局部特征处理部分提取所述多视图表征的局部特征;步骤S3,通过所述FSDC
‑
Net的全局特征融合部分将所述局部特征融合为全局特征;步骤S4,所述FSDC
‑
Net基于所述全局特征对所述三维点云进行分类,其中,步骤S1包括如下子步骤:步骤S1
‑
1,对所述三维点云的各个点的位置信息进行归一化;步骤S1
‑
2,选取固定视点,并基于该固定视点对归一化后的所述三维点云进行投影,得到固定视图集;步骤S1
‑
3,选取随机视点,并基于该随机视点对归一化后的所述三维点云进行投影,得到随机视图集;步骤S1
‑
4,按预定比例分别从所述固定视图集和所述随机视图集中选取部分视图,并将其组合成多视图初始阶段的表征,即所述多视图表征,步骤S2包括如下子步骤:步骤S2
‑
1,将每个所述视图进行卷积和最大池化;步骤S2
‑
2,将每个所述视图串行地经过所述FSDC
‑
Net中的多个FSDC层,其中,每个所述FSDC层对输入特征并行地应用静态卷积和轻量化动态卷积分别生成算子并分别提取特征,再通过两个可学习权重自适应地融合两个分支提取的特征,进而通过激活层得到输出特征作为所述局部特征,其中,用于进行所述轻量化动态卷积的动态卷积核通过以下子步骤得到:步骤S2
‑2‑
1,通过BatchPool函数对所述输入特征在Batch维度进行融合,从而达到轻量化的效果,如下式:式中,X
i
,Z1分别表示BatchPool前后的输入和输出特征,X
i
(j,c,h,w)表示输入的某一幅图像,b表示BatchSize的大小,c,h,w分别表示输入特征在通道、高度、宽度方向的集合;步骤S2
‑2‑
2,分别采用不同尺寸的卷积矩阵从不同感受野上对原始输入特征进行卷积操作,从而提取不同感受野上的信息;步骤S2
‑2‑
3,融合不同感受野上提取到的所述信息;步骤S2
‑2‑
4,通过Dropout层使所述FSDC层中的神经元按预定比例随机失活,从而避免过拟合问题;步骤S2
‑2‑
5,对每个所述FSDC层,通过卷积将原始动态权重改变至预定的通道数,并通过激活函数Sigmoid获得概率值作为所述FSDC层的动态权重,从而得到多个所述FSDC层的动态权重集合;步骤S2
‑2‑
6,将原始的多组卷积核与所述动态权重集合进行乘加,生成最终的所述动态卷积核。2.根据权利要求1所述的基于动静态卷积融合神经网络的多视图三维点云分类方法,其特征在于:
其中,步骤S3包括如下子步骤:步骤S3
‑<...
【专利技术属性】
技术研发人员:周浩然,王文举,陈罡,王晓琳,
申请(专利权)人:上海理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。