基于体素模型与颜色信息耦合的三维语义分割方法技术

技术编号：23401481 阅读：72 留言：0更新日期：2020-02-22 13:36

本发明专利技术所述基于体素模型与颜色信息耦合的三维语义分割方法，由三维CNN网络提取三维TSDF体素信息并结合三维重建过程中采集到的RGB图像，通过通道信息融合策略而直接实现端到端的三维语义分割，从而实现为三维重建技术之后的相关AR应用提供有力支持。三维语义分割方法包括有以下实施阶段：1)、二维RGB图像处理阶段；2)、三维TSDF体素模型处理阶段；3)、双通道信息融合及三维信息处理阶段。对于二维及三维信息进行融合；利用三维卷积神经网络进行最终的特征提取，从而得到最终的体素级别语义分割结果。

3D semantic segmentation method based on the coupling of voxel model and color information

全部详细技术资料下载

【技术实现步骤摘要】
基于体素模型与颜色信息耦合的三维语义分割方法
本专利技术涉及一种应用于计算机视觉领域的新型三维语义分割方法，属于虚拟现实

技术介绍
目前利用深度学习实现的语义分割方法，主要分为基于RGB图像的二维分割与针对点云基于三维模型的语义分割。基于二维RGB图像处理的准确率较高，但是由于二维单目相机尺度的不确定性，二维图像先天性地缺少了相关物体的深度信息，而且二维RGB图像易受到光照条件等因素的影响，使得整体分割方法具有较为明显的局限性，难以充分综合利用图像的各方面特征信息。现在较为流行的三维语义分割方法，基于点云处理时的噪声较大、且点云具有无序性以及旋转不确定性等缺点，使得相关的点云语义分割方法虽然能一定程度上利用了空间深度信息，但是语义分割的效果仍然不尽如人意，无法满足多层次的VR、AR应用的需求，无法向VR、AR设备提供足够的场景交互支持。当前较为常见的基于深度相机的三维重建技术，在三维重建后仅生成了场景的mesh模型而缺少相应的场景语义信息，使得用户与场景的交互受限。同时，三维重建技术中所生成的场景模型却存储于TSDF体素模型中，此类针对体素级语义分割方法的缺失，直接造成了现有三维重建模型的语义分割障碍。有鉴于此，特提出本专利申请。
技术实现思路
本专利技术所述基于体素模型与颜色信息耦合的三维语义分割方法，其目的在于解决上述现有技术存在的问题而基于三维CNN网络提取三维TSDF体素信息，结合三维重建过程中采集到的RGB图像，通过通道信息融合策略而直接实现端到...

【技术保护点】
1.一种基于体素模型与颜色信息耦合的三维语义分割方法，其特征在于：包括以下实施阶段，/n1)、二维RGB图像处理阶段/n针对于多个视角下的RGB图像，将多视角下的RGB图像送入backbone网络中，提取高维度图像二维特征信息；/n获得当前帧映射到世界坐标系下的相机姿态信息；/n利用RGB通道选择模块对于不同视角下的RGB二维特征赋予不同的权重；/n2)、三维TSDF体素模型处理阶段/n首先，进行前端三维模型重建；/n其次，采取符号距离函数对整个TSDF体素模型进行计算；/n然后，使用残差模块初步提取三维特征；/n将处理后的TSDF体素模型数据与上述经过RGB通道选择模块提取后的特征，均利用残差模块进行处理，以初步提取其相关的三维特征；/n3)、双通道信息融合及三维信息处理阶段/n对于二维及三维信息进行融合；/n利用三维卷积神经网络进行最终的特征提取，从而得到最终的体素级别语义分割结果。/n

【技术特征摘要】
1.一种基于体素模型与颜色信息耦合的三维语义分割方法，其特征在于：包括以下实施阶段，
1)、二维RGB图像处理阶段
针对于多个视角下的RGB图像，将多视角下的RGB图像送入backbone网络中，提取高维度图像二维特征信息；
获得当前帧映射到世界坐标系下的相机姿态信息；
利用RGB通道选择模块对于不同视角下的RGB二维特征赋予不同的权重；
2)、三维TSDF体素模型处理阶段
首先，进行前端三维模型重建；
其次，采取符号距离函数对整个TSDF体素模型进行计算；
然后，使用残差模块初步提取三维特征；
将处理后的TSDF体素模型数据与上述经过RGB通道选择模块提取后的特征，均利用残差模块进行处理，以初步提取其相关的三维特征；
3)、双通道信息融合及三维信息处理阶段
对于二维及三维信息进行融合；
利用三维卷积神经网络进行最终的特征提取，从而得到最终的体素级别语义分割结果。

2.根据权利要求1所述的基于体素模型与颜色信息耦合的三维语义分割方法，其特征在于：所述的二维RGB图像处理阶段，在获得当前帧映射到世界坐标系下的相机姿态信息中，利用三维重建或者SFM技术通过多视角几何方法进行计算。

3.根据权利要求1或2所述的基于体素模型与颜色信息耦合的三维语义分割方法，其特征在于：所述的二维RGB图像处理阶段，在所述的RGB通道选择模块中，首先，将输入特征进行全局池化；然后，将全局池化后的结果利用1*1大小的卷积层进一步提取特征；之后，利用batchnormalization规范化特征的相...

【专利技术属性】
技术研发人员：齐越，刘麟祺，包永堂，王晨，
申请(专利权)人：北京航空航天大学青岛研究院，北京航空航天大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人