当前位置: 首页 > 专利查询>宜宾学院专利>正文

一种Gabor小波CNN图像分类方法技术

技术编号:18498037 阅读:249 留言:0更新日期:2018-07-21 20:38
本发明专利技术涉及一种Gabor小波CNN的图像分类方法。本发明专利技术用Gabor小波将图像分解为多尺度和多方向的M个子带。把这M个分解子带看成M维的随机变量产生的观察数据,根据这M维随机向量的观察数据,计算其协方差矩阵。由于计算协方差矩阵之间的相似度设计矩阵计算开销很大,本发明专利技术用CNN将Gabor上建立的协方差矩阵转换为欧式空间的特征向量,然后根据特征向量用SVM进行分类图像。提出的方法避免了直接计算协方差矩阵之间的相似度,具有运算开销小的特点,更重要的是利用CNN的学习功能提高了分类算法的准确率和稳定性。

A Gabor wavelet CNN image classification method

The invention relates to an image classification method based on Gabor wavelet CNN. The Gabor wavelet is used to decompose the image into multi-scale and multi-directional M subbands. The M decomposed subbands are regarded as the observation data generated by the random variables of M dimension, and the covariance matrix is calculated according to the observed data of the M dimensional random vectors. Because the computation covariance matrix between the similarity degree design matrix is expensive, the invention uses the CNN to transform the covariance matrix established on the Gabor into the characteristic vector of the Euclidean space, and then classifies the image with the SVM according to the eigenvector. The proposed method avoids the direct calculation of the similarity between covariance matrices, which has the characteristics of small computing overhead, and more importantly, it improves the accuracy and stability of the classification algorithm by using the learning function of CNN.

【技术实现步骤摘要】
一种Gabor小波CNN图像分类方法
本专利技术涉及图像分类领域,尤其是涉及一种Gabor小波CNN的图像分类方法。
技术介绍
图像分类是计算机视觉中的重要研究内容。分类的关键任务是如何提取图像特征以及利用特征来识别图像。Gabor小波的幅度系数是有效的图像特征并被广泛应用。然而Gabor小波特征系数庞大,还需要进一步对这些Gabor小波系进行提取。Gabor小波由若干不同方向和频率的Gabor滤波器组成,用其分解一副图像I(x,y)可以表示为:gl,d(z)=I(x,y)*ψl,d(x,y),其中ψl,d(x,y)是在l尺度和d方向上的Gabor滤波器。gl,d(z)是分解后得到的Gabor子带,共有l×d个子带。gl,d(z)是复数,它的幅度Ml,d(z)表示为:其中Rel,d(z)和Iml,d(z)分别是Gabor小波的实部和虚部系数。深度CNN(卷积神经网络)是一种重要图像特征提取与识别技术,也是层次化字典学习模型的提高版,它试图利用深度的CNN来模拟灵长类动物的视觉简单的边线特征到整体物体特征,实现便捷的端到端(end-end)的图像分类和识别。但由于灵长类动物视觉的复杂性和非线性特点,CNN为数不多的非线性操作(如Relu、doupout),研究人员们企图增加更多的卷积层和全连接层来模拟视觉的非线性特性,目前CNN已经达到了100层,但还是难以达到预期效果。鉴于此,近年来研究人员们探索将深度学习技术结合传统方法来提升机器视觉方法的性能。
技术实现思路
Gabor小波属于传统的图像特征提取工具,但是它仍然是很好的图像刻画能力。Gabor小波将图像分解为若干子带,这些子带可以用协方差矩阵进行拟合来,并以这个协方差矩阵来表示图像。在进行图像分类时需要比较两个协方差模型之间的相似度。通常用黎曼距离(RiemannianDistance,RD)来度量两个协方差之间的距离(相似度)。假定两个协方差矩阵分别表示为R1和R2,则它们之间的黎曼距离RD表示为:其中λ(R1,R2)是R1和R2的泛化特征值,ln是自然对数操作。由于涉及矩阵操作,计算两个协方差矩阵的相似度开很销大,更重要的是引入学习机制困难,性能难以得到质的提升。本专利技术用CNN(卷积神经网络)转换法将协方差矩阵转换为特征向量,并用转换后的特征向量来进行图像分类。大致分类方案描述为:将图像进行L尺度和D方向的Gabor小波分解,将分解后的L×D=M个分解子带看成M维的随机变量产生的观察数据;根据这M维随机向量的观察数据,计算其协方差矩阵。将训练数据库中图像的协方差矩阵当作CNN的输入数据,将图像的类别当作CNN的输出,组合成N个训练样本对(N是训练数据库中图像个数)来进行训练CNN;训练好的CNN便可以用来转换Gabor小波域的协方差矩阵;最后分类时根据转换后的特征向量来训练SVM(支持向量机),在用SVM进行分类图像。附图说明图1为本专利技术将协方差矩阵转换为特征向量的关键步骤。图2为本专利技术设计的CNN(卷积神经网络)结构图。图3为本专利技术分类图像的流程图。具体实施方式本专利技术先将图像转化为特征向量并保存在图像特征向量数据库(见图1),然后利用支持向量机(SVM)进行分类。下面说明具体实施步骤:步骤1,计算协方差模型库,具体由下列步骤组成(见图1):步骤1.1,用Gabor小波将图像Iq(x,y)分解为5尺度8方向的分解子带,并计算其幅度系数(x,y表示图像像素位置)。对彩色图像,假定是RGB图像,则用Gabor小波分别在3个颜色通道上执行分解。这些Gabor子带表示为G1(x,y),G2(x,y),…,GM(x,y),其中M是分解子带数。对于灰度图像M=40,,对于RGB彩色图像M=120。步骤1.2,计算Gabor小波协方差矩阵。将Gabor子带在图像位置(x,y)处组合为维数为M的特征向量zi=[G1(x,y),G2(x,y),…,GM(x,y)]T。对于图像的所有n个像素位置,则有{zi}i=1,…,n。然后根据zi计算协方差矩阵:其中步骤1.3,对数据库里面的所有图像进行步骤1.1到1.2操作得到所有图像的协方差矩阵,并保存到协方差模型库。协方差模型库里面是存储每一个图像对应的协方差矩阵及其类别标签。步骤2,训练CNN。利用步骤1中获得的协方差模型库训练CNN(卷积神经网络)。逐一将每个图像的协方差矩阵当作CNN的输入矩阵,将该图像的标签当作CNN的类别标签来训练CNN。本专利技术的CNN主体结构(如图2所示)有2个卷积层、2个最大化池层(max-pooling)、2个全连接层,具体设置如下:卷积层1为25个3×3的卷积核;卷积层2为12个3×3的卷积核,最大池化层1与最大池化层2设置为2×2局部滑动窗口,步长为2;全连接层1节点个数为1200;全连接层2节点为K(K等于数据库中类别数);softmax层以图像类别为目标,采用交叉熵损失函数训练网络。此步骤得到用于转换协方差矩阵的CNN模型。步骤3,计算图像特征向量。用训练好的CNN模型将协方差模型库中所有协方差矩阵化为特征向量,并连同其标签一起存储于图像特征向量数据库。步骤4,训练SVM。根据图像特征向量数据库中的图像特征向量和该图像的标签训练SVM,得到SVM模型。步骤5,实现图像分类。设被查询图像为Iq其类别未知,则由如下步骤可以识别其类别(见图3):步骤5.1,用Gabor小波分解图像Iq(见步骤1.1),得到40个分解分解子带,若是RGB彩色图像则得到120个分解子带。步骤5.2,根据步骤5.1得到的分解子带,计算其协方差矩阵(见步骤1.2)步骤5.3,用CNN模型计算图像Iq的特征向量。将协方差矩阵输入CNN模型得到Iq的特征向量。步骤5.4,识别图像Iq的类别。将图像Iq的特征向量输入SVM模型便得到分类结果。本文档来自技高网...

【技术保护点】
1.一种Gabor小波CNN图像分类方法,其特征在于该方法有如下步骤:步骤1,计算协方差模型库,具体由下列步骤组成:步骤1.1,用Gabor小波将图像Iq(x,y)分解为5尺度8方向的分解子带,并计算其幅度系数(x,y表示图像像素位置)。对彩色图像,假定是RGB图像,则用Gabor小波分别在3个颜色通道上执行分解。这些Gabor子带表示为G1(x,y),G2(x,y),…,GM(x,y),其中M是分解子带个数。对于灰度图像M=40,,对于RGB彩色图像M=120。步骤1.2,计算Gabor小波协方差矩阵。将Gabor子带在图像位置(x,y)处组合为维数为M的特征向量zi=[G1(x,y),G2(x,y),…,GM(x,y)]T。对于图像的所有n个像素位置,则有{zi}i=1,…,n。然后根据zi计算协方差矩阵:

【技术特征摘要】
1.一种Gabor小波CNN图像分类方法,其特征在于该方法有如下步骤:步骤1,计算协方差模型库,具体由下列步骤组成:步骤1.1,用Gabor小波将图像Iq(x,y)分解为5尺度8方向的分解子带,并计算其幅度系数(x,y表示图像像素位置)。对彩色图像,假定是RGB图像,则用Gabor小波分别在3个颜色通道上执行分解。这些Gabor子带表示为G1(x,y),G2(x,y),…,GM(x,y),其中M是分解子带个数。对于灰度图像M=40,,对于RGB彩色图像M=120。步骤1.2,计算Gabor小波协方差矩阵。将Gabor子带在图像位置(x,y)处组合为维数为M的特征向量zi=[G1(x,y),G2(x,y),…,GM(x,y)]T。对于图像的所有n个像素位置,则有{zi}i=1,…,n。然后根据zi计算协方差矩阵:其中步骤1.3,对数据库里面的所有图像进行步骤1.1到1.2操作得到所有图像的协方差矩阵,并保存到协方差模型库。协方差模型库里面是存储每一个图像对应的协方差矩阵及其类别标签。步骤2,训练CNN。利用步骤1中获得的协方差模型库训练CNN(卷积神经网络)。逐一将每个图像的协方差矩阵当作CNN的输入矩阵,将该图像的标签当作CNN的类别标签来训练CNN。本发明的CNN主体结构有2个卷积层、2个最大化池层(max-pooling)、2个全连接层,具体设置如下:卷积层1为25个3×3的卷积核;卷积层2为12个3×3的卷积核,最大池化层1与最大池化层2设置为2×2局部滑动窗口,步长为2;全连接层1节点个数为1200;全连接层2节点为K(K等于数据库中类别数);softmax层以图像类别为目标,采用交叉熵损失函数训练网络。此步骤得...

【专利技术属性】
技术研发人员:李朝荣覃凤清李明勇
申请(专利权)人:宜宾学院
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1