基于神经主题模型的图像集成分类方法及装置制造方法及图纸

技术编号：18204819 阅读：42 留言：0更新日期：2018-06-13 06:34

本公开提供了一种基于神经主题模型的图像集成分类方法，包括：S1，对图像进行预处理，提取图像的词袋特征v和深度卷积神经网络特征vCNN，其中，图像包括训练集和测试集；S2，在神经主题模型中引入深度卷积神经网络特征vCNN，并结合集成分类方法softmax混合模型，构建图像集成分类的神经主题模型；S3，基于训练集优化图像集成分类的神经主题模型的目标函数，并求解模型参数；S4，利用优化后的图像集成分类的神经主题模型对测试集图像进行分类。本公开还提供了一种基于神经主题模型的图像集成分类装置。本公开基于神经主题模型的图像集成分类方法及装置，解决了基于神经主题模型DocNADE的图像集成分类的问题，改善了图像分类效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于神经主题模型的图像集成分类方法及装置
本公开涉及在计算机视觉领域中图像分类，尤其涉及一种基于神经主题模型的图像集成分类方法及装置。
技术介绍
随着计算机技术的发展，人们浏览的信息日益丰富，每天都有大量图片被上传到网络，由于数量巨大，人工已经无法对此进行分类，因此，研究高效可靠的图片分类算法有很迫切的社会需求。在计算机视觉领域中，首先要做的就是选取图像的特征描述。随着图像词袋(Bagofwords)特征的出现，主题模型广泛应用于图像分类和图像标注中。主题模型可用学习到的主题特征代替原始的图像底层特征，从而缩小高层语义概念与底层图像特征间的距离。Hofman在SIGIR1999会议上提出了经典概率主题模型PLSA，该模型使用所有词上的多项式分布来描述主题，并假设每一篇文档有不同的主题分布。Blei在PLSA基础上引入Dirichlet先验，在JMLR杂志上提出了LDA(LatentDirichletAllocation)模型，使模型更加鲁棒，应用更为广泛。2012年Larochelle和Lauly在NIPS会议上首次提出了一个无监督神经主题模型，文档神经自回归分布估计器(DocumentNeuralAutoregressiveDistributionEstimator，简称DocNADE)模型，获得了较好的主题特征，该模型假设每个词的生成仅与在其之前生成的词有关联，并直接建模文档为所有词的条件概率乘积，每个条件概率使用前馈神经网络生成。基于主题模型的图像分类工作大都基于这几个模型。主要分为两类方法：一类方法是分为两个阶段，先使用主题模型学习主题特征，再对其...
基于神经主题模型的图像集成分类方法及装置

【技术保护点】
一种基于神经主题模型的图像集成分类方法，包括以下步骤：S1，对图像进行预处理，提取图像的词袋特征v和深度卷积神经网络特征vCNN，其中，所述图像包括训练集和测试集；S2，在神经主题模型中引入所述深度卷积神经网络特征vCNN，并结合集成分类方法softmax混合模型，构建图像集成分类的神经主题模型；S3，基于训练集优化所述图像集成分类的神经主题模型的目标函数，并求解模型参数；S4，利用优化后的图像集成分类的神经主题模型对测试集图像进行分类。

【技术特征摘要】
1.一种基于神经主题模型的图像集成分类方法，包括以下步骤：S1，对图像进行预处理，提取图像的词袋特征v和深度卷积神经网络特征vCNN，其中，所述图像包括训练集和测试集；S2，在神经主题模型中引入所述深度卷积神经网络特征vCNN，并结合集成分类方法softmax混合模型，构建图像集成分类的神经主题模型；S3，基于训练集优化所述图像集成分类的神经主题模型的目标函数，并求解模型参数；S4，利用优化后的图像集成分类的神经主题模型对测试集图像进行分类。2.根据权利要求1所述的基于神经主题模型的图像集成分类方法，其中，所述步骤S1包括以下子步骤：S11，输入图像和类标信息；S12，对图像进行特征检测，提取SIFT特征向量特征，即词袋特征v；S13，利用训练后的卷积神经网络，提取深度卷积神经网络特征vCNN。3.根据权利要求2所述的基于神经主题模型的图像集成分类方法，其中，在所述步骤S12中，采用规则网格(RegularGrid)方法对图像进行特征检测，对每个图像区块提取128维SIFT特征向量特征。4.根据权利要求2所述的基于神经主题模型的图像集成分类方法，其中，在所述步骤S12中，提取SIFT特征向量特征后使用K-means聚类形成码书，并将图像用码词词频表示。5.根据权利要求2所述的基于神经主题模型的图像集成分类方法，其中，在所述步骤S13中，在ImageNet数据集上训练卷积神经网络VGG19，利用训练后的卷积神经网络VGG19，提取实验数据集上VGG19网络的倒数第二个全连接层特征，即深度卷积神经网络特征vCNN。6.根据权利要求1所述的基于神经主题模型的图像集成分类方法，其中，在所述步骤S2中，将提取的SIFT词袋特征v＝[v1,v2,…,vD]和Deep-CNN特征vCNN作为网络的输入层，词袋特征v和类标y为网络输出层，结合集成分类方法softmax混合模型，将训练集图像和类标的联合概率建模为：其中，p(yl|v,vCNN)＝softmax(d+Ulh(vCNN,v))；p(vi＝t|vCNN,v&a...

【专利技术属性】
技术研发人员：李晓旭，耿丙乾，常东良，喻梨耘，
申请(专利权)人：兰州理工大学，
类型：发明
国别省市：甘肃,62

全部详细技术资料下载我是这个专利的主人