一种融合主题模型的场景图像分类方法技术

技术编号：17486462 阅读：346 留言：0更新日期：2018-03-17 10:42

本发明专利技术请求保护一种融合主题模型的场景图像分类方法,涉及深度学习及图像分类领域。该方法包括：对数据集进行预处理，扩充已获取数据集的数量，得到符合深度学习模型处理的图像数据格式；构建符合场景图像分类的卷积神经网络模型，使用卷积神经网络对处理后的图像数据集进行预训练；使用训练集，对构建的卷积神经网络进行端到端的迭代训练，调整网络中的参数，使用验证集对训练完成的模型进行验证，对提取到的具有判别力的场景图像特征进行建模，提取特征和图像之间存在的隐藏的主题变量,得到k维向量代表的图像主题分布，k代表主题数量；每幅图像可以看做是由多个主题所组成的一个概率分布图，利用分类器实现场景图像的分类。

A method of scene image classification based on fusion theme model

The invention requests a scene image classification method that protects a fusion theme model, which involves the field of depth learning and image classification. The method comprises the following steps: preprocessing of the data set, has expanded to get the number of data sets, to be consistent with the deep learning format of image data processing model; construct the convolutional neural network model with the scene image classification, using convolutional neural network training on the pre processed image data set; the use of the training set, iterative training for end to the end of the convolution neural network, parameter adjustment in the network, using the validation set to validate the trained model, the extraction of image discriminant features for modeling, feature extraction and image between the hidden subject variables, get the image theme K dimensional vector represents the distribution of the number of K represents the theme; each image can be seen as composed of multiple subjects of a probability distribution, to achieve the image of the scene using the classifier Class.

全部详细技术资料下载

【技术实现步骤摘要】
一种融合主题模型的场景图像分类方法
本专利技术属于深度学习及图像分类识别
，具体是一种融合主题模型的场景图像分类方法。
技术介绍
场景图像分类，即给定一组包含多个目标类别(如山脉、河流、公路等)的场景图像，根据各个目标类别的分布关系对图像的全局语义进行分析和理解。场景图像分类不仅对整幅图像的类别有总体的认识，还对图像中各个物体、以及区域之间的上下文信息进行了分析，使得对图像的内容有了更深层次的认识，推动了机器视觉中诸如目标识别、图像检索等领域的发展，具有广泛的应用范围。随着智能拍照设备及计算机硬件的快速发展，使用深度学习中的深度卷积神经网络替代传统图像特征提取方法，避开了传统的模式识别算法需要进行人工特征提取的繁琐过程，具有更强大的特征提取和特征表达能力。使用深度学习算法训练的卷积神经网络模型自不仅在理论上取得了极大的突破，在实际应用中也取得了丰富的成果。深度学习模型属于多层神经网络模型，卷积神经网络是第一个被成功训练的深度学习模型。深层神经网络模型在训练阶段使用的是没有经过任何人为影响的原始自然图像，能够非常有效的学习具有旋转、扭曲等不变性特征的图像表示，这在很大程度上降低了手工提取特征对分类准确率的影响。卷积神经网络是由多个层次组成的可训练的多层架构，采用端到端的处理方式，把图像预处理和特征提取的过程视作一个黑盒子，通过反卷积操作或者分析分类结果的精度优化网络参数，不断提高训练的卷积神经网络模型的分类精度。
技术实现思路
本专利技术旨在解决针对已有技术中图像的底层视觉信息与人们对图像理解的高层语义信息的不一致性而导致的底层和高层间的语义鸿沟问题。提出...
一种融合主题模型的场景图像分类方法

【技术保护点】
一种融合主题模型的场景图像分类方法，其特征在于，包括以下步骤：1)、对获取的图像数据集进行预处理操作，预处理一是扩充了数据集，二是使得处理后的图像格式符合深度学习框架的格式，将处理过的数据集的70％作为训练集，剩下的30％作为验证集；2)、构建符合场景图像分类的卷积神经网络模型，使用卷积神经网络对处理后的训练集进行预训练，即使用卷积神经网络的卷积层和池化层提取输入图像的位置、上下文特征，利用这些学习到的图像的位置、上下文特征作为图像场景分类的基础和依据；3)、使用训练集，对构建的卷积神经网络进行端到端的迭代训练，在训练过程中调整网络中的参数，使用验证集对训练完成的模型进行验证，网络模型提取的图像特征判断场景图像的类别；4)、通过预训练提取到的具有判别力的场景图像特征进行建模，提取特征和图像之间存在的隐藏的主题变量,得到k维向量代表的图像主题分布；每幅图像代表多个主题所组成的一个概率分布，利用分类器实现场景图像的分类。

【技术特征摘要】
1.一种融合主题模型的场景图像分类方法，其特征在于，包括以下步骤：1)、对获取的图像数据集进行预处理操作，预处理一是扩充了数据集，二是使得处理后的图像格式符合深度学习框架的格式，将处理过的数据集的70％作为训练集，剩下的30％作为验证集；2)、构建符合场景图像分类的卷积神经网络模型，使用卷积神经网络对处理后的训练集进行预训练，即使用卷积神经网络的卷积层和池化层提取输入图像的位置、上下文特征，利用这些学习到的图像的位置、上下文特征作为图像场景分类的基础和依据；3)、使用训练集，对构建的卷积神经网络进行端到端的迭代训练，在训练过程中调整网络中的参数，使用验证集对训练完成的模型进行验证，网络模型提取的图像特征判断场景图像的类别；4)、通过预训练提取到的具有判别力的场景图像特征进行建模，提取特征和图像之间存在的隐藏的主题变量,得到k维向量代表的图像主题分布；每幅图像代表多个主题所组成的一个概率分布，利用分类器实现场景图像的分类。2.根据权利要求1所述的融合主题模型的场景图像分类方法，其特征在于，所述步骤1)对图像数据集进行预处理操作的步骤包括裁剪、翻转，直方图均衡化，调整图像的亮度，得到更大容量的数据集，这样能够使每一个类别的场景图像得到充分的训练，调高网络的泛化能力，另一方面使得处理后的图像格式符合深度学习框架的格式，使得图像能够被网络模型读取和训练。3.根据权利要求1或2所述的融合主题模型的场景图像分类方法，其特征在于，所述符合场景图像分类的卷积神经网络模型，包括数据输入层、卷积计算层、池化层、全连接层、输出层，数据输入层是把预处理的数据输入到网络模型；卷积计算层采用局部连接，每个神经元看做一个过滤器，通过对窗口做滑动操作，窗口里的值与过滤器里的值对应相乘，作为下一层的输入；池化层的位置处于连续的卷积层中间，用来压缩数据和参数的数量，减少过拟合；全...

【专利技术属性】
技术研发人员：丰江帆，付阿敏，孙文正，夏英，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人