基于超限学习机和融合卷积网络的3D物体识别方法技术

技术编号:21090813 阅读:99 留言:0更新日期:2019-05-11 10:24
本发明专利技术涉及一种基于超限学习机和融合卷积网络的3D物体识别方法,模型以3D物体的多视角投影图作为输入,经过多层融合卷积网络提取特征,利用半随机的ELM网络进行分类;卷积网络由提出的融合卷积单元组成,是一种改进的残差单元,多个并行残差通道上的卷积核个数依次增加,相同大小的卷积核参数共享。半数卷积核参数以高斯分布随机产生,其余通过训练寻优得到,使其能拟合更复杂的非线性函数,增加低层网络的特征提取能力。方法中使用了半随机的超限学习机分类层,既降低了模型训练的时间又增加了网络的稀疏性;结合了超限学习机和融合卷积网络,以2D视角图作为输入,其识别3D物体的准确率高于现有的深度学习的方法,网络实现更简单。

3D Object Recognition Method Based on Overbound Learning Machine and Fusion Convolution Network

【技术实现步骤摘要】
基于超限学习机和融合卷积网络的3D物体识别方法
本专利技术涉及一种3D物体识别技术,特别涉及一种基于超限学习机和融合卷积网络的3D物体识别方法。
技术介绍
3D物体识别是人工智能最重要的研究和应用方向之一,也是自然场景理解最具挑战性的任务之一。在图像处理中,二维图像被离散化为多个像素点。一般,3D模型的处理与之类似,被离散化为多个三维体素(volumepixel)点。3D模型分类和3D物体识别的重点是提取三维结构的内部特征。很多研究者利用深度学习网络结构自动提取3D物体的特征并进行分类。现有的“一种RGB-D物体识别方法”专利技术专利中采集3D物体的RGB图像信息和深度信息,提取物体的特征矢量进行识别。这种方法需要用到能采集深度信息的摄像头,并且需要预先训练大量的特征数据库以进行对比。现有的国内外论文中,使用RGB-D信息识别3D物体的准确率并不高。上述专利中的识别方法包括以下步骤:获取由彩色图像生成的灰度图像、由深度图像生成的表面法向量,将彩色图像、灰度图像、深度图像和表面法向量共同作为多数据模式信息;通过卷积-递归神经网络分别提取彩色图像、灰度图像和表面法向量中的高层特征;利用卷本文档来自技高网...

【技术保护点】
1.一种基于超限学习机和融合卷积网络的3D物体识别方法,其特征在于,具体包括如下步骤:1)建立基于超限学习机和融合卷积网络的预测网络模型:1.1)利用大量的3D物体的多视角图作为输入训练预测网络模型,每个视角图对应一个特征提取通道;1.2)训练融合卷积网络提取特征:融合卷积网络包含多个串并联的融合卷积单元,每个融合卷积单元依次包含多个不同残差通道的卷积层、mask层和池化层;1.3)训练多残差通道卷积层提取3D特征,使用mask层消除背景和干扰特征;Mask层图像是输入的原视角图划去了背景和不相关元素后的二值图像,其大小与输入图像相同,mask二值图像被用于和卷积后的图像进行像素矩阵运算;1....

【技术特征摘要】
1.一种基于超限学习机和融合卷积网络的3D物体识别方法,其特征在于,具体包括如下步骤:1)建立基于超限学习机和融合卷积网络的预测网络模型:1.1)利用大量的3D物体的多视角图作为输入训练预测网络模型,每个视角图对应一个特征提取通道;1.2)训练融合卷积网络提取特征:融合卷积网络包含多个串并联的融合卷积单元,每个融合卷积单元依次包含多个不同残差通道的卷积层、mask层和池化层;1.3)训练多残差通道卷积层提取3D特征,使用mask层消除背景和干扰特征;Mask层图像是输入的原视角图划去了背景和不相关元素后的二值图像,其大小与输入图像相同,mask二值图像被用于和卷积后的图像进行像素矩阵运算;1.4)池化层进行均值池化操作,降低维度并增加旋转和平移不变性;1.5)训练多层融合卷积网络,提取高层语义特征;1.6)将每个视角图通道提取的特征进行融合后得到3D物体的总特征,再经过半随机的超限学习机分类层进行有监督的学习,训练后得到网络的所有参数,预测网络模型即训练完成;2)3D物体识别:获得3D物体的多视角图,输入到预测网络模型,提取特征后,在分类层输出,在输出中找到概率最大的类别,即为网络的识别类型。2.根据权...

【专利技术属性】
技术研发人员:黄强王永雄谈咏东
申请(专利权)人:上海理工大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1