一种基于多模态信息融合的三维模型分类方法技术

技术编号：25042127 阅读：22 留言：0更新日期：2020-07-29 05:32

本发明专利技术公开了一种基于多模态信息融合的三维模型分类方法(MIFN,Multi‑modal Information Fusion based on LSTM)，所述方法包括以下步骤：利用开放(OPENGL，Open Graphics Library)提取三维模型的视图信息和全景图信息，利用点云库(PCL,Point Cloud Library)提取三维模型的点云信息；通过对多模态网络进行独立的单模态网络训练进而学习多模态网络模型，利用多模态网络模型获取三维模型在不同模态下的预测得分；通过构造聚合函数将不同模态下的预测得分聚合在一起生成最终的预测得分，利用Softmax算法对最终的预测得分进行处理生成类标签。本发明专利技术通过融合三维模型三种模态的信息来表征三维模型，相比于仅仅使用单模态信息包含的信息更加全面，提升了三维模型分类的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态信息融合的三维模型分类方法
本专利技术涉及三维模型分类领域，尤其涉及一种基于多模态信息融合的三维模型分类方法。
技术介绍
近年来，随着科学技术的高速发展，3D技术在工业设计、医疗器械、建筑设计、航空航天、汽车制造、影视动画等领域得到了广泛的应用，三维模型的种类和数量也随之增长，从计算机视图领域来看，三维模型分类已经成为发展的必然趋势。三维模型的分类和检索已经在多媒体和计算机视图领域得到了广泛的应用，随着计算机图形学的发展，应用于三维模型表征的各种算法都取得了很好的性能，深度学习的快速发展衍生出许多表征三维模型的深度学习模型，深度学习模型在三维模型分类领域呈现出显著的性能。在三维模型分类领域，多视图、全景图、点云图、体素等都是三维模型的表征方法。多视图是多个二维视图的集合，可以通过将多个虚拟摄像机以固定距离摆放在三维模型周围拍摄得到。Su等人[1]将多视图输入卷积神经网络进而得到三维模型的特征描述符，基于三维模型数据库利用该特征进行分类取得了很好的分类效果，但是该描述符仅包含三维模型的视图信息不能全面地诠释三维模型。点云是将三维模型转换为一系列带有三维坐标的点数据，将得到的原始点云数据输入点云网络进而对点云的空间特征进行最大化处理，即使获取到的点云的数据量较小，利用点云网络[2]提取到的特征也能有效地对三维模型进行分类。Sfikas[3]等人将三维模型全景图输入卷积神经网络进而实现三维模型的分类，全景图由一系列代表三维模型视图信息和结构信息的图像构成。三维模型的网格数据是三维模型网络中顶点、边和面...

【技术保护点】
1.一种基于多模态信息融合的三维模型分类方法，其特征在于，所述方法包括以下步骤：/n1)利用OPENGL提取三维模型的视图信息和全景图信息，利用PCL提取三维模型的点云信息；/n2)通过对多模态网络进行独立的单模态网络训练进而学习多模态网络模型，利用多模态网络模型获取三维模型在不同模态下的预测得分；/n3)通过构造聚合函数将不同模态下的预测得分聚合在一起生成最终的预测得分，利用Softmax算法对最终的预测得分进行处理生成类标签；/n其中，上述步骤1)具体为：/n利用OPENGL实现三维模型的渲染，其中OPENGL提供了一系列渲染三维矢量图形的接口；/n通过对三维模型的多视角拍摄获取表征三维模型视图信息的多视角视图，通过对三维模型的曲面投影获取三维模型的全景图信息；/n利用蝴蝶细分算法对三维模型的表面信息进行细分进而实现三维模型的网格化；/n利用网格的质心表示三维模型中的网格，PCL提供了点云操作的一系列接口，通过调用PCL中的库函数获取表征三维模型的1024个点，1024个点构成了三维模型的点云信息。/n

【技术特征摘要】
1.一种基于多模态信息融合的三维模型分类方法，其特征在于，所述方法包括以下步骤：
1)利用OPENGL提取三维模型的视图信息和全景图信息，利用PCL提取三维模型的点云信息；
2)通过对多模态网络进行独立的单模态网络训练进而学习多模态网络模型，利用多模态网络模型获取三维模型在不同模态下的预测得分；
3)通过构造聚合函数将不同模态下的预测得分聚合在一起生成最终的预测得分，利用Softmax算法对最终的预测得分进行处理生成类标签；
其中，上述步骤1)具体为：
利用OPENGL实现三维模型的渲染，其中OPENGL提供了一系列渲染三维矢量图形的接口；
通过对三维模型的多视角拍摄获取表征三维模型视图信息的多视角视图，通过对三维模型的曲面投影获取三维模型的全景图信息；
利用蝴蝶细分算法对三维模型的表面信息进行细分进而实现三维模型的网格化；
利用网格的质心表示三维模型中的网格，PCL提供了点云操作的一系列接口，通过调用PCL中的库函数获取表征三维模型的1024个点，1024个点构成了三维模型的点云信息。

2.根据权利要求1所述的...

【专利技术属性】
技术研发人员：张静，陈闯，聂为之，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人