一种基于空间金字塔的卷积神经网络的图像分类方法技术

技术编号：15895948 阅读：19 留言：0更新日期：2017-07-28 20:07

本发明专利技术公开了一种基于空间金字塔的卷积神经网络的图像分类算法，借鉴了空间金字塔先提取全局特征，然后每个金字塔水平画以网格的方式获取局部特征组成空间金字塔的整体特征。构造了一个新的卷积神经网络模型，此模型前半部分为传统的卷积网络，有3个卷积层2个池化层；之后将这3个卷积层以画网格的方式进行均匀池化获得各自特征图。每层特征图按列连成一个特征向量，然后将这3个特征向量顺序连接成为一个总的特征向量。这个总的特征向量即涵盖了经典卷积层的特征，同时也添加了前面卷积层的特征，避免了重要特征的遗失，同时网格大小调整了各卷积层特征图的权重，有助于提高网络的识别效率。

An image classification algorithm based on spatial Pyramid convolution neural network

The invention discloses an image classification algorithm for convolutional neural network based on the space in Pyramid, Pyramid from the first space to extract global features and the overall characteristics of each level to Pyramid painting grid access to local feature space composed of Pyramid. A new structure of convolutional neural network model, the model for the first half of the convolution of traditional network, 3 layer 2 layer convolution pool; after the 3 volume in the way of drawing grid layer uniform pool gain their feature map. Each feature graph is connected into a feature vector by columns, and then the 3 eigenvectors are sequentially connected to form a total feature vector. This general feature vector that covers the characteristics of classical laminated roll, but also add a layer of volume feature front, to avoid the loss of important features at the same time, the grid size adjusted weight of each volume layer feature map, helpful to improve the efficiency of recognition.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于空间金字塔的卷积神经网络的图像分类算法
本专利技术属于图像处理与模式识别
，具体涉及一种基于空间金字塔的深度卷积神经网络的图像识别算法
技术介绍
空间金字塔是首先提取原图像的全局特征，然后在每个金字塔水平把图像划分为细网格序列，从每个金子塔水平的每个网格中提取特征，并把其连接成一个大的特征向量。卷积神经网络近年来在图像处理方面取的了不俗的成就，得到了广泛的运用。随后，更多的科研工作者对经典网络进行了修改。为了获得更佳的图像识别结果，本专利借鉴了空间金子塔的思维，提出了一种新的深度卷积神经网络，获得了相较于传统方法更好的识别效果。
技术实现思路
本专利技术的目的是提出一种基于空间金字塔方式的深度卷积神经网络的图像分类方式，提高图像模式识别的能力。本专利技术所采用的技术方案是：一种基于空间金字塔的卷积神经网络的图像分类算法，其特征在于，包括以下步骤：步骤1：前向传播，具体实现包括以下子步骤：步骤1.1：建立带M个卷积层、M-1个池化层的前半部分卷积神经网络；步骤1.2：将M个卷积层分别进行池化，得到M类特征，然后分别将其连接成一个大的特征向量，最后再连接成一个总的特征向量作为图像的最终特征；步骤1.3：对最终特征向量进行一次全连接和softmax分类，获得卷积神经网络；步骤1.4：将整个卷积神经网络的所有权值通过经验公式进行初始化，然后将训练图片x输入初始化后的卷积神经网络，按照前向传播公式进行传播；步骤2：反向调节。本专利技术的有益效果是：提出了一种新的卷积神经网络算法结构，并提高了识别效率。附图说明图1：本专利技术实施例的方法原理图。具体实施方式...
一种<a href="http://www.xjishu.com/zhuanli/55/201710198700.html" title="一种基于空间金字塔的卷积神经网络的图像分类方法原文来自X技术">基于空间金字塔的卷积神经网络的图像分类方法</a>

【技术保护点】
一种基于空间金字塔的卷积神经网络的图像分类算法，其特征在于，包括以下步骤：步骤1：前向传播，具体实现包括以下子步骤：步骤1.1：建立带M个卷积层、M‑1个池化层的前半部分卷积神经网络；步骤1.2：将M个卷积层分别进行池化，得到M类特征，然后分别将其连接成一个大的特征向量，最后再连接成一个总的特征向量作为图像的最终特征；步骤1.3：对最终特征向量进行一次全连接和softmax分类，获得卷积神经网络；步骤1.4：将整个卷积神经网络的所有权值通过经验公式进行初始化，然后将训练图片x输入初始化后的卷积神经网络，按照前向传播公式进行传播；步骤2：反向调节。

【技术特征摘要】
1.一种基于空间金字塔的卷积神经网络的图像分类算法，其特征在于，包括以下步骤：步骤1：前向传播，具体实现包括以下子步骤：步骤1.1：建立带M个卷积层、M-1个池化层的前半部分卷积神经网络；步骤1.2：将M个卷积层分别进行池化，得到M类特征，然后分别将其连接成一个大的特征向量，最后再连接成一个总的特征向量作为图像的最终特征；步骤1.3：对最终特征向量进行一次全连接和softmax分类，获得卷积神经网络；步骤1.4：将整个卷积神经网络的所有权值通过经验公式进行初始化，然后将训练图片x输入初始化后的卷积神经网络，按照前向传播公式进行传播；步骤2：反向调节。2.根据权利要求1所述的基于空间金字塔的卷积神经网络的图像分类算法，其特征在于：步骤1.2中，若步骤1.1中建立的是带有3个卷积层、2个池化层的前半部分卷积神经网络，则将3个卷积层分别进行池化，得到3类特征；步骤1.2的具体实现过程如下：输入图片后通过卷积核和隐层偏置获得第一个卷积层的特征图，第一层的卷积特征图x1由如下公式得到；其中：表示第1个卷积层的第j张特征图，表示输入图片经过预处理后x0的第i张图片，n0表示x0图片的张数；表示第1层的第j个二维卷积核，表示第1个隐层第j个特征图的偏置；δ表示sigmiod函数，mp表示得到的为特征图；n1为第一层的卷积核个数，也是第1个卷积特征图的张数；将获得的卷积层特征图经过2*2的均匀池化进行下采样，得到行列均为原来一半的特征图v1；v1＝mean-pooling{x1}；其中，mean-pooling表示均匀池化则每一个卷积层的特征图都能通过以下公式得到；每一个池化层的特征图都能通过以下公式得到；vl＝mean-pooling{xl}；共计得到3个卷积层的特征图，即x1,x2,x3，然后将3个卷积层的特征图进行画网格的方式进行特征提取；将第1个卷积层画分为4*4的网格，然后每个网格通过均匀池化提取一个特征，最终第1个卷积层经过特征提取后成为一个4*4的特征图p1；p1＝mean-pooling(v1)；同理根据以下公式得到3类特征图p1,p2,p3；pl＝mean-pooling(vl)；其中，池化窗口大小和步长随着输入图片大小的改变而改变；p1,p2,p3的大小分别为预设的4*4，2*2，1*1；然后将按列聚合成大小为16的列向量,p1聚合成16*6＝96的列向量，同理可将p2聚合为大小为2*2*16＝64的列向量，将p3聚合为大小为1*1*120＝120的列向量，最后按序聚合成一个总大小为280的列向量...

【专利技术属性】
技术研发人员：王改华，吕朦，李涛，袁国亮，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人