一种基于空间金字塔的卷积神经网络的图像分类方法技术

技术编号:15895948 阅读:19 留言:0更新日期:2017-07-28 20:07
本发明专利技术公开了一种基于空间金字塔的卷积神经网络的图像分类算法,借鉴了空间金字塔先提取全局特征,然后每个金字塔水平画以网格的方式获取局部特征组成空间金字塔的整体特征。构造了一个新的卷积神经网络模型,此模型前半部分为传统的卷积网络,有3个卷积层2个池化层;之后将这3个卷积层以画网格的方式进行均匀池化获得各自特征图。每层特征图按列连成一个特征向量,然后将这3个特征向量顺序连接成为一个总的特征向量。这个总的特征向量即涵盖了经典卷积层的特征,同时也添加了前面卷积层的特征,避免了重要特征的遗失,同时网格大小调整了各卷积层特征图的权重,有助于提高网络的识别效率。

An image classification algorithm based on spatial Pyramid convolution neural network

The invention discloses an image classification algorithm for convolutional neural network based on the space in Pyramid, Pyramid from the first space to extract global features and the overall characteristics of each level to Pyramid painting grid access to local feature space composed of Pyramid. A new structure of convolutional neural network model, the model for the first half of the convolution of traditional network, 3 layer 2 layer convolution pool; after the 3 volume in the way of drawing grid layer uniform pool gain their feature map. Each feature graph is connected into a feature vector by columns, and then the 3 eigenvectors are sequentially connected to form a total feature vector. This general feature vector that covers the characteristics of classical laminated roll, but also add a layer of volume feature front, to avoid the loss of important features at the same time, the grid size adjusted weight of each volume layer feature map, helpful to improve the efficiency of recognition.

【技术实现步骤摘要】
一种基于空间金字塔的卷积神经网络的图像分类算法
本专利技术属于图像处理与模式识别
,具体涉及一种基于空间金字塔的深度卷积神经网络的图像识别算法
技术介绍
空间金字塔是首先提取原图像的全局特征,然后在每个金字塔水平把图像划分为细网格序列,从每个金子塔水平的每个网格中提取特征,并把其连接成一个大的特征向量。卷积神经网络近年来在图像处理方面取的了不俗的成就,得到了广泛的运用。随后,更多的科研工作者对经典网络进行了修改。为了获得更佳的图像识别结果,本专利借鉴了空间金子塔的思维,提出了一种新的深度卷积神经网络,获得了相较于传统方法更好的识别效果。
技术实现思路
本专利技术的目的是提出一种基于空间金字塔方式的深度卷积神经网络的图像分类方式,提高图像模式识别的能力。本专利技术所采用的技术方案是:一种基于空间金字塔的卷积神经网络的图像分类算法,其特征在于,包括以下步骤:步骤1:前向传播,具体实现包括以下子步骤:步骤1.1:建立带M个卷积层、M-1个池化层的前半部分卷积神经网络;步骤1.2:将M个卷积层分别进行池化,得到M类特征,然后分别将其连接成一个大的特征向量,最后再连接成一个总的特征向量作为图像的最终特征;步骤1.3:对最终特征向量进行一次全连接和softmax分类,获得卷积神经网络;步骤1.4:将整个卷积神经网络的所有权值通过经验公式进行初始化,然后将训练图片x输入初始化后的卷积神经网络,按照前向传播公式进行传播;步骤2:反向调节。本专利技术的有益效果是:提出了一种新的卷积神经网络算法结构,并提高了识别效率。附图说明图1:本专利技术实施例的方法原理图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1,本专利技术提供的一种基于空间金字塔的卷积神经网络的图像分类算法,包括以下步骤:步骤1:前向传播,具体实现包括以下子步骤:步骤1.1:建立带3个卷积层、2个池化层的前半部分卷积神经网络;步骤1.2:将3个卷积层分别进行池化,得到3类特征,然后分别将其连接成一个大的特征向量,最后再连接成一个总的特征向量作为图像的最终特征;输入图片后通过卷积核和隐层偏置获得第一个卷积层的特征图,第一层的卷积特征图x1由如下公式得到;其中:表示第1个卷积层的第j张特征图,表示输入图片经过预处理后x0的第i张图片,n0表示x0图片的张数;表示第1层的第j个二维卷积核,表示第1个隐层第j个特征图的偏置;δ表示sigmiod函数,mp表示得到的为特征图;j=1.2......n1;n1为第一层的卷积核个数,也是第1个卷积特征图的张数;将获得的卷积层特征图经过2*2的均匀池化进行下采样,得到行列均为原来一半的特征图v1;v1=mean-pooling{x1};其中,mean-pooling表示均匀池化则每一个卷积层的特征图都能通过以下公式得到;每一个池化层的特征图都能通过以下公式得到;vl=mean-pooling{xl};共计得到3个卷积层的特征图,即x1,x2,x3,然后借鉴空间金子塔的方式,将3个卷积层的特征图进行画网格的方式进行特征提取,本实施例采取的是将第1个卷积层画分为4*4的网格,然后每个网格通过均匀池化提取一个特征,最终第1个卷积层经过特征提取后成为一个4*4的特征图p1;将第1个卷积层画分为4*4的网格,然后每个网格通过均匀池化提取一个特征,最终第1个卷积层经过特征提取后成为一个4*4的特征图p1;p1=mean-pooling(v1);同理根据以下公式得到3类特征图p1,p2,p3;pl=mean-pooling(vl);其中,池化窗口大小和步长随着输入图片大小的改变而改变;p1,p2,p3的大小分别为预设的4*4,2*2,1*1;然后将按列聚合成大小为16的列向量,p1聚合成16*6=96的列向量,同理可将p2聚合为大小为2*2*16=64的列向量,将p3聚合为大小为1*1*120=120的列向量,最后聚合成一个总大小为280的列向量p作为输入图片的特征。步骤1.3:对最终特征向量进行一次全连接和softmax分类,获得卷积神经网络;步骤1.4:将整个卷积神经网络的所有权值通过经验公式进行初始化,然后将训练图片x输入初始化后的卷积神经网络,按照前向传播公式进行传播;将整个卷积神经网络的所有权值通过经验公式进行初始化,是根据经验公式初始化随机生成输入单元与隐层单元之间的权值wkj和隐层单元的偏置bj,设置b初始值均为0;其中,w表示权值,l表示卷积网络第l层,j表示卷积神经网络第l卷积层第j个神经元,k表示全连接层第k层,layerinput表示这一层输入神经元个数,layeroutput表示这一层的输出神经元个数;kl是第l个卷积层卷积核的大小,此公式可以令初始化的权值在-1到1之间。每一张输入的图片表示为x,输入卷积神经网络的图像表示为x0;当输入的图片为灰度图片时,x0=x;当输入图片为彩色图片时,通过以下公式灰度化,x0=rgb2gray(x)。输入训练图像x及其标签,利用如下前向传导公式计算每层输出值;hw,b(x)=f(wTx+b)其中,h(w,b)(x)表示神经元输出值,wT表示权值的转置,b表示偏置,f表示激活函数。步骤2:反向调节;具体实现包括以下子步骤:步骤2.1:通过如下公式根据标签值和利用前向传导公式计算得到的最后一层输出值计算出最后一层偏差;其中,Jl为l层的损失函数,为输出层神经元输出值,hw,b(x(i))为第i张图片的输出值,y(i)表示第i张输入图片的标签。步骤2.2:根据最后一层偏差计算各层偏差,从而求得梯度方向,根据如下公式更新权值:本实施例在反向调节过程中调节卷积层x1,x2时,有两个方向传来的梯度,本算法通过将两个方向的梯度相加来进行调节。本实施例输入一定数量的图片到训练好的卷积神经网络中,经过前向传播得到分类结果,与自带标签进行比较,相同则正确。由此得到网络算法的正确率。应当理解的是,本说明书未详细阐述的部分均属于现有技术。应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本专利技术专利保护范围的限制,本领域的普通技术人员在本专利技术的启示下,在不脱离本专利技术权利要求所保护的范围情况下,还可以做出替换或变形,均落入本专利技术的保护范围之内,本专利技术的请求保护范围应以所附权利要求为准。本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201710198700.html" title="一种基于空间金字塔的卷积神经网络的图像分类方法原文来自X技术">基于空间金字塔的卷积神经网络的图像分类方法</a>

【技术保护点】
一种基于空间金字塔的卷积神经网络的图像分类算法,其特征在于,包括以下步骤:步骤1:前向传播,具体实现包括以下子步骤:步骤1.1:建立带M个卷积层、M‑1个池化层的前半部分卷积神经网络;步骤1.2:将M个卷积层分别进行池化,得到M类特征,然后分别将其连接成一个大的特征向量,最后再连接成一个总的特征向量作为图像的最终特征;步骤1.3:对最终特征向量进行一次全连接和softmax分类,获得卷积神经网络;步骤1.4:将整个卷积神经网络的所有权值通过经验公式进行初始化,然后将训练图片x输入初始化后的卷积神经网络,按照前向传播公式进行传播;步骤2:反向调节。

【技术特征摘要】
1.一种基于空间金字塔的卷积神经网络的图像分类算法,其特征在于,包括以下步骤:步骤1:前向传播,具体实现包括以下子步骤:步骤1.1:建立带M个卷积层、M-1个池化层的前半部分卷积神经网络;步骤1.2:将M个卷积层分别进行池化,得到M类特征,然后分别将其连接成一个大的特征向量,最后再连接成一个总的特征向量作为图像的最终特征;步骤1.3:对最终特征向量进行一次全连接和softmax分类,获得卷积神经网络;步骤1.4:将整个卷积神经网络的所有权值通过经验公式进行初始化,然后将训练图片x输入初始化后的卷积神经网络,按照前向传播公式进行传播;步骤2:反向调节。2.根据权利要求1所述的基于空间金字塔的卷积神经网络的图像分类算法,其特征在于:步骤1.2中,若步骤1.1中建立的是带有3个卷积层、2个池化层的前半部分卷积神经网络,则将3个卷积层分别进行池化,得到3类特征;步骤1.2的具体实现过程如下:输入图片后通过卷积核和隐层偏置获得第一个卷积层的特征图,第一层的卷积特征图x1由如下公式得到;其中:表示第1个卷积层的第j张特征图,表示输入图片经过预处理后x0的第i张图片,n0表示x0图片的张数;表示第1层的第j个二维卷积核,表示第1个隐层第j个特征图的偏置;δ表示sigmiod函数,mp表示得到的为特征图;n1为第一层的卷积核个数,也是第1个卷积特征图的张数;将获得的卷积层特征图经过2*2的均匀池化进行下采样,得到行列均为原来一半的特征图v1;v1=mean-pooling{x1};其中,mean-pooling表示均匀池化则每一个卷积层的特征图都能通过以下公式得到;每一个池化层的特征图都能通过以下公式得到;vl=mean-pooling{xl};共计得到3个卷积层的特征图,即x1,x2,x3,然后将3个卷积层的特征图进行画网格的方式进行特征提取;将第1个卷积层画分为4*4的网格,然后每个网格通过均匀池化提取一个特征,最终第1个卷积层经过特征提取后成为一个4*4的特征图p1;p1=mean-pooling(v1);同理根据以下公式得到3类特征图p1,p2,p3;pl=mean-pooling(vl);其中,池化窗口大小和步长随着输入图片大小的改变而改变;p1,p2,p3的大小分别为预设的4*4,2*2,1*1;然后将按列聚合成大小为16的列向量,p1聚合成16*6=96的列向量,同理可将p2聚合为大小为2*2*16=64的列向量,将p3聚合为大小为1*1*120=120的列向量,最后按序聚合成一个总大小为280的列向量...

【专利技术属性】
技术研发人员:王改华吕朦李涛袁国亮
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1