The image recognition method of the invention comprises the sparse random pool based on convolutional neural network, convolutional neural network sparse random pool to the image feature extraction and classification association classifier by using this method, the pooling strategy of sparse random pool is: first degree pool area sparse discriminant to dynamically select the best features of the region, and the optimum distribution of pool area of each active value using probability weighted Gauss, finally through the probability weighted random value of output as a pool of values; the beneficial effect of the image recognition method based on the invention of sparse random pool of convolutional neural network is character information can not only optimize the feature extraction stage, but also make the model avoid local minimum in training to a certain extent, enhance the recognition model of the pan Chemical and recognition accuracy.
【技术实现步骤摘要】
基于稀疏性随机池化的卷积神经网络的图像识别方法
本专利技术涉及计算机视觉
,尤其涉及一种基于稀疏性随机池化的卷积神经网络的图像识别方法。
技术介绍
图像识别是计算机视觉
的核心分支,它集成了数字图像处理、模式识别和机器学习等学科知识,是图像检索、人脸识别、人机交互和智能视频监控等应用技术的基础。图像特征表达是图像识别研究的关键点,也是难点所在。所述图像特征表达是指:结合用户使用的场景,能够将图片中的主体信息从复杂的背景条件下准确地识别和提取出来,并使用当前人工智能领域较为先进的深度学习技术对获取到的图片信息进行训练分析,最终可以进行大数据分析和处理,形成以图像元素为核心的智能数据库,在国家安全、交通、互联网、医学影像等诸多领域具有广泛的应用前景。卷积神经网络(ConvolutionalNeuralNetwork)是由LeCun等提出的一种用于字体图像识别的前馈神经网络模型,它的神经元可以相应部分覆盖图像上一定范围内的周围单元,对大型图像的处理有着极佳的表现,已经广泛用于图像识别领域。卷积神经网络实质上是一种有监督的深度学习算法,通过局部感受野与权值共享,通过卷积核运算直接对二维图形进行特征提取并训练分类。卷积神经网络的基本架构是由一系列交迭相连的卷积层、池化层和非线性层以及全连接的输出层组成,采用反向传播算法对卷积神经网络中的权值参数逐层反向调整,通过不断的迭代训练次数使系统的误差不断降低,提高卷积神经网络的精度,最终得到卷积神经网络权值参数的最优解。其中池化层对上一层的特征通过人为设定的池化窗口大小以及步长进行池化计算,目的是减小特征的维度, ...
【技术保护点】
一种基于稀疏性随机池化卷积神经网络的图像识别方法,其特征在于包括如下步骤:1)构建图像样本集,包括训练集与测试集以及每张图片对应的标签集,其中设定好图像每一类别在分类器中的编码方式;2)搭建卷积神经网络框架,包括特征提取框架与训练分类框架,特征提取阶段由多个卷积层与池化层交迭进行,训练分类阶段由全连接层与分类器层构成,用于将前端提取的图像特征经由全连阶层并以向量形式输入分类器;3)训练过程中设置超参数,构造代价函数,利用BP算法每次根据最小批次的误差反向更新网络的权重;所述超参数包括学习率参数、Dropout层、带momentum的SGD、ReLu激活函数等;所述构造代价函数,即计算所得值与目标标签值的误差函数;然后利用BP算法每次根据最小批次的误差反向更新网络的权重;4)图像输入识别模型的卷积层进行特征提取,输出特征图并连接下一个神经元作为新的输入数据进行操作,每个神经元只对图像的局部区域进行感知,两个相邻滑动窗口之间的距离称为步长,每个特征图谱上所有节点具有权重共享特性;5)在卷积神经网络结构中的池化层采用稀疏随机池化操作,池化策略是根据池化区域的稀疏程度来动态得到该区域的最佳特征 ...
【技术特征摘要】
1.一种基于稀疏性随机池化卷积神经网络的图像识别方法,其特征在于包括如下步骤:1)构建图像样本集,包括训练集与测试集以及每张图片对应的标签集,其中设定好图像每一类别在分类器中的编码方式;2)搭建卷积神经网络框架,包括特征提取框架与训练分类框架,特征提取阶段由多个卷积层与池化层交迭进行,训练分类阶段由全连接层与分类器层构成,用于将前端提取的图像特征经由全连阶层并以向量形式输入分类器;3)训练过程中设置超参数,构造代价函数,利用BP算法每次根据最小批次的误差反向更新网络的权重;所述超参数包括学习率参数、Dropout层、带momentum的SGD、ReLu激活函数等;所述构造代价函数,即计算所得值与目标标签值的误差函数;然后利用BP算法每次根据最小批次的误差反向更新网络的权重;4)图像输入识别模型的卷积层进行特征提取,输出特征图并连接下一个神经元作为新的输入数据进行操作,每个神经元只对图像的局部区域进行感知,两个相邻滑动窗口之间的距离称为步长,每个特征图谱上所有节点具有权重共享特性;5)在卷积神经网络结构中的池化层采用稀疏随机池化操作,池化策略是根据池化区域的稀疏程度来动态得到该区域的最佳特征值,并通过该最佳特征值利用高斯分布以最佳特征值为中央分配区域其...
【专利技术属性】
技术研发人员:宋振华,刘焱,杨建勇,蒋乐伦,宋嵘,张超,蒋庆,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。