当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于观测矩阵变换维度的图像分类方法技术

技术编号:20918434 阅读:37 留言:0更新日期:2019-04-20 10:05
本发明专利技术公开了一种基于观测矩阵变换维度的图像分类方法,包括:使用感知压缩对图像进行稀疏编码,得到低维度图像组成的数据集,将包含标签标注的数据集划分为训练集和测试集;构建包括输入层、隐含层与输出层的图像分类网络,所述隐含层为感知机单元;所述图像分类网络至少为两个,分别包含不同节点数感知机单元;将训练集作为输入,在标签的监督下进行训练,得到训练完成后对应的神经网络图像分类模型;使用测试集验证神经网络图像分类模型对图像分类的准确率,选择准确率最高的作为最终的神经网络图像分类模型;将待测图像输入,输出图像分类结果的预测概率。本发明专利技术提供的图像分类方法可以在不降低图像分类精度的条件下大大提升模型效率。

An Image Classification Method Based on Transform Dimension of Observation Matrix

The invention discloses an image classification method based on the dimension of observation matrix transformation, which includes: sparse encoding of the image using perceptual compression to obtain a data set composed of low-dimensional images, dividing the data set containing label labeling into training set and test set, constructing an image classification network including input layer, hidden layer and output layer, and the hidden layer being a perceptron unit; The proposed image classification network consists of at least two perceptron units with different number of nodes; the training set is used as input and trained under the supervision of labels to obtain the corresponding neural network image classification model after training; the test set is used to verify the accuracy of the neural network image classification model for image classification, and the highest accuracy is selected as the final neural network graph. Image classification model; input the image to be measured and output the predictive probability of image classification results. The image classification method provided by the invention can greatly improve the efficiency of the model without reducing the accuracy of image classification.

【技术实现步骤摘要】
一种基于观测矩阵变换维度的图像分类方法
本专利技术属于图像分类的
,特别涉及一种基于观测矩阵变换维度的图像分类方法。
技术介绍
图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。图像空间的分类方法—利用图像的灰度,颜色,纹理,形状,位置等底层特征对图像进行分类;例如:[1]利用灰度直方图特征对图像进行分类;[2]利用纹理特征对图像进行分类;[3]采用纹理,边缘和颜色直方图混合特征对图像进行分类;[1],[2],[3]均采用SVM作为分类器。[4]用矩阵表示图像,矩阵元素是相应象素的灰度值,然后用SVD和PCA方法抽取图像特征,BP网络作为分类器。图像空间的分类方法的共同缺点是数据量大,计算复杂性高,但分类精度一般比较理想。特征空间的分类方法—首先将原图像经过某种变换如K-L变换,小波变换等变换到特征空间,然后在特征空间提取图像的高层特征以实现图像的分类。这类分类方法尤以纹理图像分类和遥感图像分类最多。特征空间的分类方法可降低数据维数,降低计算复杂性,但问题相关性较强,与特征提取的方法和效果有很大关系。传统的数字信号采样严格依照那奎斯特采样定律,即:为了不失真地恢复模拟信号,采样频率应该不小于模拟信号频谱中最高频率的2倍。普通的信号压缩首先对信号进行离散余弦变换或小波变换等处理,然后舍弃大量接近于0的系数,对少数绝对值较大的系数进行压缩编码。本质上来讲,采样和压缩对应数据的全部采集和部分丢弃。通过全采样后,数字信号的数据量比较大,一方面不利于存储和传输,另一方面该数字信号本身存在很多冗余。而目前在图像分类领域,随着输入数据与模型复杂度的增加,计算量日趋增加,模型调参训练与使用的效率不高。
技术实现思路
本专利技术的目的在于提供一种基于观测矩阵变换维度的图像分类方法,应用于图像分类任务,可以在不降低图像分类精度的条件下大大提升模型效率。一种基于观测矩阵变换维度的图像分类方法,包括以下步骤:(1)使用感知压缩对图像进行稀疏编码,感知压缩后的图像组成数据集,将包含标签标注的数据集划分为训练集和测试集;(2)构建包括输入层、隐含层与输出层的图像分类网络,所述隐含层为感知机单元;所述图像分类网络至少为两个,分别包含不同节点数感知机单元;(3)以步骤(1)中的训练集作为输入,在标签的监督下,对步骤(2)构建的图像分类网络进行训练,得到训练完成后对应的神经网络图像分类模型;(4)使用测试集验证神经网络图像分类模型对图像分类的准确率,选择准确率最高的神经网络图像分类模型作为最终的神经网络图像分类模型;(5)以待测图像作为输入,步骤(4)得到的最终的神经网络图像分类模型输出图像分类结果的预测概率。在步骤(1)中,感知压缩为将高维信号投影成低维信号的过程,即,图像实现从高维到低维的映射。在步骤(1)中,所述使用感知压缩对图像进行稀疏编码的方法包括图像的稀疏表示、图像压缩采样和图像重构,所述的图像稀疏表示为:将原信号x在一组稀疏基Ψ上进行表示:x=Ψs其中,x为原信号,其大小为N×1,Ψ为一组稀疏基,s为稀疏系数。s是由投影稀疏组成的N×1的列向量,实际上x和s是同一个信号在不同域内的不同表示。所述图像压缩采样的过程为设定或选取一个观测矩阵,对图像进行感知测量,所述观测矩阵选自高斯分布的随机观测矩阵,图像压缩采样后的信号表示为:y=Θs其中Θ=ΦΨ,Φ为观测矩阵或称测量基,大小为M×N;y的大小为M×1。图像压缩采样的具体过程如下所示:y=Φx其中,Φ为观测矩阵或称测量基,其大小为M×N,对应采样的过程,将高维信号投影成低维信号;y为观测值,其大小为M×1,为亚采样后的结果;若x是可压缩的,将x=Ψs代入y=Φx,可得:y=ΦΨs;令ΦΨ=Θ,可得:y=Θs。观测矩阵为高斯分布的随机观测矩阵,满足有限等距性质,选择合适的测量矩阵会直接影响重构信号的质量。感知测量矩阵需满足有限等距性质(RestrictedIsometryProperty,RIP),而服从伯努利分布或高斯分布的矩阵则为普适观测矩阵,本专利技术选择服从高斯分布的随机观测矩阵。所述图像重构包括通过限制矩阵Θ满足有限等距性质,求解方程的最优解,得到重构后的原信号。在步骤(2)中,构建六个图像分类网络:输入层以经过步骤(1)感知压缩的mmnist手写数字图像作为输入;感知机单元的节点数为50-300,步长为50;输出层的节点个数为10,分别输出图像属于每个类别的预测概率,选取预测概率的最高值对应的类别作为预测结果;组成六个包含不同节点数的图像分类网络;在步骤(3)中,训练完成后的图像分类网络所对应的神经网络图像分类模型为六个,其网络结构中感知机单元的节点数分别为50、100、150、200、250和300。由于采用mnist手写数字图像作为实验数据,其图像内容为0至9共十类手写数字,因此输出层节点个数为10。在图像分类网络的训练过程中,所述标签进行独热编码后转化为10×1的向量,通过前向后向传播算法对隐含层参数进行迭代调整。使用测试集验证六个神经网络图像分类模型对图像分类的准确率,选择准确率最高的神经网络图像分类模型作为最终的神经网络图像分类模型。所述最终的神经网络图像分类模型中,感知机单元的节点数为200。训练集和测试集的划分方法为将图片根据所述类别乱序排列后再进行划分,划分后的训练集和测试集中的数据分布(类别分布)相同。测试集用于检验神经网络图像分类模型的性能,如分类结果的准确率,为选择最终的神经网络图像分类模型提供依据。感知压缩也可称为压缩采样,其信号处理方式从采样开始有别于传统方法,感知压缩算法主张在一开始就对图像进行随机亚采样。假设图像具有稀疏性,则感知压缩算法能够在很大程度上对原有信息进行还原。也就是说,感知压缩提取了图像的关键特征。因此,本专利技术利用此优势将其用于图像分类预处理过程,减少模型输入的数据量与模型训练的计算量。与现有技术相比,本专利技术的有益效果体现在:本专利技术使用远低于奈奎斯特频率的采样频率,在采样的过程中就完成压缩,省略对无用信息的采样;可以在不降低图像分类精度的条件下大大提升模型效率,降低神经网络训练量和减少训练耗时。附图说明图1为本专利技术提供的图像分类方法的流程图;图2为实施例中输入的图像;图3为六个神经网络图像分类模型的准确率分析结果。具体实施方式下面将结合附图和实施例对本专利技术作进一步的说明。如图1所示,本实施例提供一种基于观测矩阵变换维度的图像分类方法,包括以下步骤:(1)使用感知压缩对图像进行稀疏编码,得到低维度的图像组成的数据集,将包含标签标注的数据集划分为训练集和测试集,划分比例为8:2。使用感知压缩对图像进行稀疏编码的方法包括图像的稀疏表示、图像压缩采样和图像重构。(1-1)图像稀疏表示为:将原信号x在一组稀疏基Ψ上进行表示:x=Ψs其中,x为原信号,其大小为N×1,Ψ为一组稀疏基,s为稀疏系数。s是由投影稀疏组成的N×1的列向量,实际上x和s是同一个信号在不同域内的不同表示。(1-2)图像压缩采样的过程为设定或选取一个观测矩阵,对图像进行感知测量,观测矩阵为高斯分布的随机观测矩阵,本文档来自技高网
...

【技术保护点】
1.一种基于观测矩阵变换维度的图像分类方法,包括以下步骤:(1)使用感知压缩对图像进行稀疏编码,感知压缩后的图像组成数据集,将包含标签标注的数据集划分为训练集和测试集;(2)构建包括输入层、隐含层与输出层的图像分类网络,所述隐含层为感知机单元;所述图像分类网络至少为两个,分别包含不同节点数感知机单元;(3)将步骤(1)中的训练集作为输入,在标签的监督下,对步骤(2)构建的图像分类网络进行训练,得到训练完成后对应的神经网络图像分类模型;(4)使用测试集验证神经网络图像分类模型对图像分类的准确率,选择准确率最高的神经网络图像分类模型作为最终的神经网络图像分类模型;(5)将待测图像输入步骤(4)得到的最终的神经网络图像分类模型,输出图像分类结果的预测概率。

【技术特征摘要】
1.一种基于观测矩阵变换维度的图像分类方法,包括以下步骤:(1)使用感知压缩对图像进行稀疏编码,感知压缩后的图像组成数据集,将包含标签标注的数据集划分为训练集和测试集;(2)构建包括输入层、隐含层与输出层的图像分类网络,所述隐含层为感知机单元;所述图像分类网络至少为两个,分别包含不同节点数感知机单元;(3)将步骤(1)中的训练集作为输入,在标签的监督下,对步骤(2)构建的图像分类网络进行训练,得到训练完成后对应的神经网络图像分类模型;(4)使用测试集验证神经网络图像分类模型对图像分类的准确率,选择准确率最高的神经网络图像分类模型作为最终的神经网络图像分类模型;(5)将待测图像输入步骤(4)得到的最终的神经网络图像分类模型,输出图像分类结果的预测概率。2.根据权利要求1所述的基于观测矩阵变换维度的图像分类方法,其特征在于,在步骤(1)中,所述使用感知压缩对图像进行稀疏编码的方法包括图像的稀疏表示、图像压缩采样和图像重构,所述的图像稀疏表示为:将原信号x在一组稀疏基Ψ上进行表示:x=Ψs其中,x为原信号,其大小为N×1,Ψ为一组稀疏基,s为稀疏系数。3.根据权利要求2所述的基于观测矩阵变换维度的图像分类方法,其特征在于,所述图像压缩采样的过程为设定或选取一个观测矩阵,对图像进行感知测量,所述观测矩阵选自高斯分布的随机观测矩阵,图像压缩采样后的信号表示为:y=Θs其中Θ=ΦΨ,Φ为观测矩阵或称测量基,大小为M×N...

【专利技术属性】
技术研发人员:叶心汝王勇
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1