The invention relates to an image classification method based on Gabor wavelet CNN. The Gabor wavelet is used to decompose the image into multi-scale and multi-directional M subbands. The M decomposed subbands are regarded as the observation data generated by the random variables of M dimension, and the covariance matrix is calculated according to the observed data of the M dimensional random vectors. Because the computation covariance matrix between the similarity degree design matrix is expensive, the invention uses the CNN to transform the covariance matrix established on the Gabor into the characteristic vector of the Euclidean space, and then classifies the image with the SVM according to the eigenvector. The proposed method avoids the direct calculation of the similarity between covariance matrices, which has the characteristics of small computing overhead, and more importantly, it improves the accuracy and stability of the classification algorithm by using the learning function of CNN.
【技术实现步骤摘要】
一种Gabor小波CNN图像分类方法
本专利技术涉及图像分类领域,尤其是涉及一种Gabor小波CNN的图像分类方法。
技术介绍
图像分类是计算机视觉中的重要研究内容。分类的关键任务是如何提取图像特征以及利用特征来识别图像。Gabor小波的幅度系数是有效的图像特征并被广泛应用。然而Gabor小波特征系数庞大,还需要进一步对这些Gabor小波系进行提取。Gabor小波由若干不同方向和频率的Gabor滤波器组成,用其分解一副图像I(x,y)可以表示为:gl,d(z)=I(x,y)*ψl,d(x,y),其中ψl,d(x,y)是在l尺度和d方向上的Gabor滤波器。gl,d(z)是分解后得到的Gabor子带,共有l×d个子带。gl,d(z)是复数,它的幅度Ml,d(z)表示为:其中Rel,d(z)和Iml,d(z)分别是Gabor小波的实部和虚部系数。深度CNN(卷积神经网络)是一种重要图像特征提取与识别技术,也是层次化字典学习模型的提高版,它试图利用深度的CNN来模拟灵长类动物的视觉简单的边线特征到整体物体特征,实现便捷的端到端(end-end)的图像分类和识别。但由于灵长类动物视觉的复杂性和非线性特点,CNN为数不多的非线性操作(如Relu、doupout),研究人员们企图增加更多的卷积层和全连接层来模拟视觉的非线性特性,目前CNN已经达到了100层,但还是难以达到预期效果。鉴于此,近年来研究人员们探索将深度学习技术结合传统方法来提升机器视觉方法的性能。
技术实现思路
Gabor小波属于传统的图像特征提取工具,但是它仍然是很好的图像刻画能力。Gabor小波将图像分解 ...
【技术保护点】
1.一种Gabor小波CNN图像分类方法,其特征在于该方法有如下步骤:步骤1,计算协方差模型库,具体由下列步骤组成:步骤1.1,用Gabor小波将图像Iq(x,y)分解为5尺度8方向的分解子带,并计算其幅度系数(x,y表示图像像素位置)。对彩色图像,假定是RGB图像,则用Gabor小波分别在3个颜色通道上执行分解。这些Gabor子带表示为G1(x,y),G2(x,y),…,GM(x,y),其中M是分解子带个数。对于灰度图像M=40,,对于RGB彩色图像M=120。步骤1.2,计算Gabor小波协方差矩阵。将Gabor子带在图像位置(x,y)处组合为维数为M的特征向量zi=[G1(x,y),G2(x,y),…,GM(x,y)]T。对于图像的所有n个像素位置,则有{zi}i=1,…,n。然后根据zi计算协方差矩阵:
【技术特征摘要】
1.一种Gabor小波CNN图像分类方法,其特征在于该方法有如下步骤:步骤1,计算协方差模型库,具体由下列步骤组成:步骤1.1,用Gabor小波将图像Iq(x,y)分解为5尺度8方向的分解子带,并计算其幅度系数(x,y表示图像像素位置)。对彩色图像,假定是RGB图像,则用Gabor小波分别在3个颜色通道上执行分解。这些Gabor子带表示为G1(x,y),G2(x,y),…,GM(x,y),其中M是分解子带个数。对于灰度图像M=40,,对于RGB彩色图像M=120。步骤1.2,计算Gabor小波协方差矩阵。将Gabor子带在图像位置(x,y)处组合为维数为M的特征向量zi=[G1(x,y),G2(x,y),…,GM(x,y)]T。对于图像的所有n个像素位置,则有{zi}i=1,…,n。然后根据zi计算协方差矩阵:其中步骤1.3,对数据库里面的所有图像进行步骤1.1到1.2操作得到所有图像的协方差矩阵,并保存到协方差模型库。协方差模型库里面是存储每一个图像对应的协方差矩阵及其类别标签。步骤2,训练CNN。利用步骤1中获得的协方差模型库训练CNN(卷积神经网络)。逐一将每个图像的协方差矩阵当作CNN的输入矩阵,将该图像的标签当作CNN的类别标签来训练CNN。本发明的CNN主体结构有2个卷积层、2个最大化池层(max-pooling)、2个全连接层,具体设置如下:卷积层1为25个3×3的卷积核;卷积层2为12个3×3的卷积核,最大池化层1与最大池化层2设置为2×2局部滑动窗口,步长为2;全连接层1节点个数为1200;全连接层2节点为K(K等于数据库中类别数);softmax层以图像类别为目标,采用交叉熵损失函数训练网络。此步骤得...
【专利技术属性】
技术研发人员:李朝荣,覃凤清,李明勇,
申请(专利权)人:宜宾学院,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。