基于结构相似度的非负稀疏编码的图像分类方法技术

技术编号：12587338 阅读：107 留言：0更新日期：2015-12-24 04:06

本发明专利技术基于结构相似度的非负稀疏编码的图像分类方法，包括以下步骤：对待处理的图像数据集中所有图像分别稠密地提取SIFT特征；随机地选取若干SIFT特征用于求待处理的图像数据集的码书；建立基于结构相似度的非负稀疏编码模型；用随机选取的SIFT特征来求解出该图像数据集的码书；固定码书，对所有的SIFT特征进行编码；对图像数据集中每张图像的编码进行空间金字塔最大池化方法整合，得到每张图像的特征向量；将图像数据集划分为训练集和测试集，用训练集的空间金字塔最大池化的图像特征向量和图像相应的标签，训练一个分类器；对于任意一张图像，将其空间金字塔最大池化后特征向量输入到已经训练好的分类器中，得到了该张图像预测类别。

全部详细技术资料下载

【技术实现步骤摘要】

：本专利技术属于计算机视觉图像分类
，具体涉及一种基于结构相似度的非负稀疏编码的图像分类方法。
技术介绍
：生物视觉系统初级阶段的一个重要功能就是尽可能去除输入刺激的统计冗余。初级视皮层对外界刺激的响应满足稀疏性，即只有少数的神经元被激活，相应的编码为稀疏编码。稀疏编码，通俗地说，就是就是将一个信号表示为一组基的组合，而且要求只需要少数的几个基就可以将信号重构出来。稀疏编码已经广泛应用到计算机视觉、图像信号处理等领域，例如，信号重构、信号去噪、图像特征提取、以及分类等应用。结构相似度指数将结构信息定义为独立于亮度、对比度的，反映信号结构的属性，并将失真建模为亮度、对比度和结构三个不同因素的组合。用均值作为亮度的估计，标准差作为对比度的估计，协方差作为结构相似程度的度量。传统的稀疏编码方法是基于最小均方误差意义下的重构，也就是使得重构误差的平方和尽可能小，同时，尽可能使得相应的编码稀疏化，稀疏表现在编码里就是编码的特征向量的元素尽可能多的为零。目前的基于稀疏编码的图像分类方法，大部分都是基于最小化重构误差平方和的编码模型来做的，误差平方和作为失真的评判标准不符合人眼的视觉特性。最近的研究表明，人眼视觉系统的主要功能是从视觉区域提取图像和视频中的结构化信息，而误差平方和没有充分地考虑人眼的视觉特性，因此传统的稀疏编码重构不能很好地评价重构图像与原图像的结构相似度。
技术实现思路
：本专利技术的目的在于针对现有技术的不足，提供了一种基于结构相似度的非负稀疏编码的图像分类方法。为达到上述目的，本专利技术采用如...

【技术保护点】
基于结构相似度的非负稀疏编码的图像分类方法，其特征在于，包括以下步骤：1)对待处理的图像数据集中所有图像分别稠密地提取SIFT特征；2)对待处理的图像数据集中所有图像提取完SIFT特征后，随机地选取5万至50万的SIFT特征用于求待处理的图像数据集的码书；3)建立基于结构相似度的非负稀疏编码模型；4)根据步骤2)和步骤3)，用随机选取的SIFT特征来求解出该图像数据集的码书；5)该图像数据集的码书求解出来后，固定码书，对所有的SIFT特征进行编码；6)对图像数据集中每张图像的编码进行空间金字塔最大池化方法整合，得到每张图像的特征向量；7)将图像数据集划分为训练集和测试集，用训练集的空间金字塔最大池化的图像特征向量和图像相应的标签，训练一个分类器；8)对于任意一张图像，将其空间金字塔最大池化后特征向量输入到已经训练好的分类器中，得到了该张图像预测类别。

【技术特征摘要】

【专利技术属性】
技术研发人员：石伟伟，王进军，龚怡宏，张世周，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人