基于卷积特征和空间视觉词袋模型的场景识别方法技术

技术编号：15763763 阅读：561 留言：0更新日期：2017-07-06 02:22

本发明专利技术公开了一种基于卷积特征和空间视觉词袋模型的场景识别方法。该方法包括：对原始数据库中的数据进行扩增技术，产生大量的、与原数据相似、标签不变的训练数据；对数据库中的图像进行预处理，得到符合的场景图像；利用构建的卷积神经网络模型及其训练后得到的参数设置，训练得到数据库图像的卷积特征；将得到的图像卷积特征用空间视觉词袋模型进行词典生成特征编码并形成直方图矢量；引入并联的思想融合多种特征,发挥其优势并结合SVM分类器实现场景分类性能的提高。

Scene recognition method based on convolution feature and spatial visual word bag model

The invention discloses a scene recognition method based on convolution feature and space vision bag model. The method includes: the original data in the database of amplification technology, produced a large amount of training data, similar with the original data, the same label; the image database preprocessing, obtain the scene images meet; using parameters obtained by convolution neural network model and its training construction after the training by convolution feature database the image of the image; convolution characteristics obtained by space model generation features of bag of visual word dictionary encoding and form histogram vector; feature fusion into parallel ideas, play the advantage of combined SVM classifier to achieve the classification performance of the improved scene.

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积特征和空间视觉词袋模型的场景识别方法
本专利技术涉及深度学习及场景分类识别，尤其涉及一种基于卷积特征和空间视觉词袋模型的场景识别方法及装置。
技术介绍
在信息存储与传输技术的快速发展的今天，人们日常生活中所能接触数字图像信息的方式更加便捷，所能接触到的图像数据呈现爆炸性的增长。图像数量的与日俱增，使得利用计算机来更好的完成日益增多的视觉信息处理任务，成为一项重要的课题。在早期的研究中，是采用人工采集和分类的方式，来获得场景图像中更多的信息，但是这种方法耗时耗力，太过繁琐。因此如何高效合理地处理图像数据，如何实现自动有效地对场景图像进行分类标注，实现图像场景信息的自动提取，己经成为迫切需要解决的难题。中国互联网络信息中心(CNNIC)第39次调查报告显示，截止至2016年12月，中国网络视频用户规模达5.45亿，而用户对多媒体的搜索需求日益旺盛，则搜索引擎用户规模达6.02亿，且网络新闻用户规模为6.14亿，这给大数据的图像检索提出了更高的要求。面对大量的图像数据，人类对图像理解包含多个语义内容，其中场景场景语义主要侧重于对图像整体的认知和分析，而不仅仅是图像内部包含的具体地物目标，还对图像中各种对象，以及区域之间的上下文信息进行了分析，使得对图像的内容有了更深层次的认识。因此，如何对这些数字图像所包含的信息进行识别和处理，使计算机能够快速地、准确地图像的类别，已经成为计算机视觉领域一个亟待解决的问题，图像场景分类技术就是在这个背景下产生的。场景分类，即基于图像的场景特征来完成场景类别(如高山、森林、卧室、客厅等)的自动识别。场景分类是图像理解领域的...
基于卷积特征和空间视觉词袋模型的场景识别方法

【技术保护点】
一种基于卷积特征和空间视觉词袋模型的场景识别方法，其特征在于，包括：对原始数据库中的数据进行扩增，生成第一场景图像，所述第一场景图像包括多个与原数据相似、标签不变的训练数据；根据所述第一场景图像构建卷积神经网络模型；将所述第一场景图像和待分类图像分别输入到构建好的卷积神经网络模型，分别得到第一场景图像的图像卷积特征和待分类图像的图像卷积特征；根据得到的图像卷积特征用空间视觉词袋模型生成特征编码词典；根据所述特征编码词典分别获取所述第一场景图像的最终直方图信息和待分类图像的最终直方图信息；根据预设的分类器、第一场景图像的最终直方图信息和待分类图像的最终直方图信息对待分类图像分类。

【技术特征摘要】
1.一种基于卷积特征和空间视觉词袋模型的场景识别方法，其特征在于，包括：对原始数据库中的数据进行扩增，生成第一场景图像，所述第一场景图像包括多个与原数据相似、标签不变的训练数据；根据所述第一场景图像构建卷积神经网络模型；将所述第一场景图像和待分类图像分别输入到构建好的卷积神经网络模型，分别得到第一场景图像的图像卷积特征和待分类图像的图像卷积特征；根据得到的图像卷积特征用空间视觉词袋模型生成特征编码词典；根据所述特征编码词典分别获取所述第一场景图像的最终直方图信息和待分类图像的最终直方图信息；根据预设的分类器、第一场景图像的最终直方图信息和待分类图像的最终直方图信息对待分类图像分类。2.根据权利要求1所述的基于卷积特征和空间视觉词袋模型的场景识别方法，其特征在于：根据所述第一场景图像构建卷积神经网络模型之前，还包括：对第一场景图像预处理；所述预处理包括降噪和增强对比度。3.根据权利要求2所述的基于卷积特征和空间视觉词袋模型的场景识别方法，其特征在于：所述对第一场景图像预处理，包括对第一场景图像采用拉普拉斯滤波算法来降低光照影响，降低光照情况下拍摄图像噪声，以及对第一场景图像采用直方图均衡化增加灰度值的动态范围，增强图像整体对比度。4.根据权利要求1所述的基于卷积特征和空间视觉词袋模型的场景识别方法，其特征在于：所述对原始数据库中的数据进行扩增，生成第一场景图像包括：对原始数据库中的数据使用仿射变换、水平翻转和弹性裁切的随机组合来进行扩增，生成多个与原数据相似、标签不变的训练数据作为第一场景图像。5.根据权利要求1所述基于卷积特征和空间视觉词袋模型的场景识别方法，其特征在于：所述根据所述特征编码词典分别获取所述第一场景图像的最终直方图信息和待分类图像的最终直方图信息，包括：将得到的图像卷积特征图像当做提取的局部特征并利用空间视觉词袋模型，计算所述特征点与码书中视觉单词之间的距离集合，采取软分配编码进行特...

【专利技术属性】
技术研发人员：丰江帆，刘媛媛，刘光军，夏英，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人