一种卷积神经网络的优化方法和装置制造方法及图纸

技术编号：15502600 阅读：134 留言：0更新日期：2017-06-03 23:25

本发明专利技术提供了一种卷积神经网络的优化方法包括：在所述卷积神经网络所增加的层上设置捷径连接，通过学习获取所述捷径连接对应的残差映射；根据所述残差映射确定所述捷径连接对应的期望映射；将所述期望映射代替所述捷径连接对应的层，进行卷积神经网络模型预测。本发明专利技术所述卷积神经网络优化方法，可以有效减少所增加的层的参数，使网络间的数据流通更为顺畅，有利于提高模型的预测精度和预测速度。

Optimization method and device for convolutional neural network

The present invention provides an optimization method including convolutional neural network: the increase in the convolutional neural network layer arranged on the shortcut connection, the connection to obtain residual mapping corresponding by study; according to the mapping of the residual mapping determines the desired shortcut connected with the corresponding mapping; instead of the corresponding shortcut connections will the expected, convolution neural network model. The convolution neural network optimization method of the invention can effectively reduce the parameters of the additional layer, make the data flow between the networks smoother, and improve the prediction accuracy and the prediction speed of the model.

全部详细技术资料下载

【技术实现步骤摘要】
一种卷积神经网络的优化方法和装置
本专利技术属于人工神经网络领域，尤其涉及一种卷积神经网络的优化方法和装置。
技术介绍
卷积神经网络(英文全称为ConvolutionalNeuralNetwork，英文简称为CNN)是人工神经网络的一种，目前已成为语音分析和图像识别领域的研究热点。卷积神经网络的权值共享网络结构，类似于生物神经网络，有效的降低了网络模型的复杂度，减少了权值的数量。随着CNN网络的发展，特别是VGG(英文全称为visualgeometrygroup，中文全称为：视觉几何组)卷积神经网络的提出，使得网络层数的增加成为卷积神经网络的一个重要研究方向。但是，随着网络层数的增加，会出现明显的梯度的消失，或者梯度的爆炸，会导致训练不能有效的收敛，卷积神经网络的参数数量迅速增加，影响系统的预测精度和预测速度。
技术实现思路
本专利技术的目的在于提供一种卷积神经网络的优化方法，以解决现有技术由于网络层数增加，导致卷积神经网络的参数数量迅速增加，影响系统的预测精度和预测速度的问题。第一方面，本专利技术实施例提供了一种卷积神经网络的优化方法，所述方法包括：在所述卷积神经网络所增加的层上设置捷径连接，通过学习获取所述捷径连接对应的残差映射；根据所述残差映射确定所述捷径连接对应的期望映射；将所述期望映射代替所述捷径连接对应的层，进行卷积神经网络模型预测。结合第一方面，在第一方面的第一种可能实现方式中，所述根据所述残差映射确定所述捷径连接对应的期望映射步骤包括：判断所述期望映射H(X)为非线性映射，且映射变量X与期望映射H(X)具有相同维数时，所述期望映射H(X)＝F(...
一种卷积神经网络的优化方法和装置

【技术保护点】
一种卷积神经网络的优化方法，其特征在于，所述方法包括：在所述卷积神经网络所增加的层上设置捷径连接，通过学习获取所述捷径连接对应的残差映射；根据所述残差映射确定所述捷径连接对应的期望映射；将所述期望映射代替所述捷径连接对应的层，进行卷积神经网络模型预测。

【技术特征摘要】
1.一种卷积神经网络的优化方法，其特征在于，所述方法包括：在所述卷积神经网络所增加的层上设置捷径连接，通过学习获取所述捷径连接对应的残差映射；根据所述残差映射确定所述捷径连接对应的期望映射；将所述期望映射代替所述捷径连接对应的层，进行卷积神经网络模型预测。2.根据权利要求1所述方法，其特征在于，所述根据所述残差映射确定所述捷径连接对应的期望映射步骤包括：判断所述期望映射H(X)为非线性映射，且映射变量X与期望映射H(X)具有相同维数时，所述期望映射H(X)＝F(X)+X，其中F(X)为残差映射；判断所述期望映射H(X)为非线性映射，则映射变量X与期望映射H(X)维数不相同时，所述期望映射H(X)＝F(X)+f(X),其中，f(X)＝w×X，其中F(X)为残差映射，w为神经网络的权重。3.根据权利要求1所述方法，其特征在于，所述方法还包括：对所述卷积神经网络归一化初始化和中间层的归一化训练。4.根据权利要求1所述方法，其特征在于，所述方法还包括：采用N×N卷积核对所述卷积神经网络的层进行卷积运算，其中2<N<7。5.根据权利要求1的述方法，其特征在于，所述方法还包括下述步骤中的一种或者多种：在所述卷积神经网络的最后的卷积层之后，加入最大池化层，所述最大池化层的采样滑动窗口为C*C，步长为1，其中C与图像经全部卷积层处理后的图像块的边长相同；先在样本数据库上训练卷积神经网络模型，然后在标注准确的数据库上更新中间卷积层与全连层的参数，对所述卷积神经网络进行微调；在保持原图像长宽比的基础上，降低输入图像的尺寸；减少卷积层的通道数。6.一种卷积神经网络的优化装置，其特征在于，所述装置包括：捷径连接设置单元，用于在所...

【专利技术属性】
技术研发人员：陈书楷，杨奇，
申请(专利权)人：厦门中控生物识别信息技术有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人