The present invention in a 3D shape classification method of depth based on convolutional neural network, its main contents include: data input, initial convolution neural network, cluster search, knowledge transfer, the process is that it uses convolutional neural network, first select the convolutional neural network structure is relatively simple as the root node of the search tree, more the complex model and using beam search method from the root node to explore candidate; when the new generation of candidate convolutional neural networks, by properly transmitted to the offspring from the parent convolutional neural network, the cluster search results, finally obtained the optimal convolutional neural network. The performance is better than the existing method of the invention in the popular three-dimensional shape data set, successfully parameters to reduce the total number of 98%; at the same time as a result of the beam search method to transfer knowledge, other issues of robustness and can be easily applied to training in small data sets on the in-depth study of the.
【技术实现步骤摘要】
一种基于深度卷积神经网络的三维形状分类方法
本专利技术涉及计算机视觉领域,尤其是涉及了一种基于深度卷积神经网络的三维形状分类方法。
技术介绍
随着科技技术迅速发展,已经广泛使用卷积神经网络实现三维形状分类。预测给定三维形状的对象类是计算机视觉中的一个基本问题,因为三维形状是图像理解的重要视觉线索。但是,目前可用的三维形状数据集比其他常用数据集小了一个数量级,还不足以训练模型。即使采用了很多微调方法处理小型该数据集,但需要非常长的时间。而如果采用基于深度卷积神经网络的三维形状分类方法,则可以通过集束搜索,得到最佳卷积神经网络架构和参数,从而更好地预测三维形状。同时,这种方法在自动导航、自动检测、机器人抓取物件及装配任务等中有许多实际的需要。本专利技术提出了一种基于深度卷积神经网络的三维形状分类方法,它利用卷积神经网络,首先选择相对简单的卷积神经网络结构作为搜索树的根节点,并利用集束搜索方法从根节点开始探索候选的更复杂的模型;当生成新的候选卷积神经网络时,通过从母卷积神经网络适当地传送到其后代,使得集束搜索的结果有效,最终得到最佳的卷积神经网络。本专利技术在流行的三维 ...
【技术保护点】
一种基于深度卷积神经网络的三维形状分类方法,其特征在于,主要包括数据输入(一);初始卷积神经网络(二);集束搜索(三);知识迁移(四)。
【技术特征摘要】
1.一种基于深度卷积神经网络的三维形状分类方法,其特征在于,主要包括数据输入(一);初始卷积神经网络(二);集束搜索(三);知识迁移(四)。2.基于权利要求书1所述的一种基于深度卷积神经网络的三维形状分类方法,其特征在于,每个形状被表示为与以形状为中心的均匀三维网格的三维像素对应的一组二进制指示符;选择相对简单的卷积神经网络结构作为搜索树的根节点,并利用集束搜索方法从根节点开始探索候选的更复杂的模型,直到不能进一步减少训练误差;当生成新的候选卷积神经网络时,通过从母卷积神经网络向后传送合适的参数值,使得集束搜索的结果有效,最终得到最佳的卷积神经网络。3.基于权利要求书1所述的图像输入(一),其特征在于,采用三维实体集作为数据集,其包括40个各种类型的实物对象类,如椅子、桌子、厕所、沙发等;每个类有100个独特的CAD模型,代表最常见的三维形状,在整个数据集中总共有151128个三维像素化模型。4.基于权利要求书1所述的初始卷积神经网络(二),其特征在于,选择相对简单的初始卷积神经网络,初始模型仅由两个卷积层和一个完全连接的层组成;第一卷积层具有16个大小为6和步长2的滤波器,第二卷积层具有32个大小为5和步长2的滤波器;最后,完全连接的层具有400个隐藏单元。5.基于权利要求书1所述的集束搜索(三),其特征在于,集束搜索包括后继函数,启发式函数以及前瞻和回溯策略;状态空间被定义为Ω={s},其中状态s表示一个网络配置;卷积神经网络的网络配置指定卷积和完全连接的层的数量,在每个层中使用的隐藏单元或三维卷积滤波器的数量,以及哪些层具有最大池;约束集束搜索,使得完全连接的层的大小保持与初始卷积神经网络中相同。6.基于权利要求书5所述的后继函数,其特征在于,通过从一组可能的动作A中应用动作a(a∈A),从而从s中产生新的状态s′:Γ:s→s′;将A定义为包括两种类型的动作:(1)在所有卷积层的顶部添加新的卷积层,其中新添加的层具有与顶部卷积层相同数量的滤波器,滤波器大小和步长和(2)使顶部卷积层中的滤波器的数量加倍。7.基于权利要求书5所述的启发式函数,其特征在于,定义为训练数据在s和s′之间的分类精度的差异;在给出s′的母状态的情...
【专利技术属性】
技术研发人员:夏春秋,
申请(专利权)人:深圳市唯特视科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。