一种基于多路特征加权的残差卷积神经网络图像分类方法技术

技术编号：19343842 阅读：17 留言：0更新日期：2018-11-07 14:31

一种基于多路特征加权的残差卷积神经网络图像分类方法，包括以下步骤：1)模型的输入图像为经过预处理的原始图像，经过预处理的图像裁剪为一个固定尺寸；2)对图像进行较大尺寸的卷积操作和池化操作；3)将步骤2)中输出的特征送入第一个多路特征加权残差模块；4)将步骤3)中多路特征加权残差模块的输出继续送入下一个多路特征加权残差模块，在经过多个多路特征加权残差模块后，输出的特征图像尺寸会逐渐缩小直至变为较小尺寸，最后经过一个平均池化层缩小为特征点；所得特征点直接送入分类层进行分类或经过全连接层后再进行分类。本发明专利技术应用于复杂的图像分类任务，丰富了特征表达，避免了因神经网络深度增加导致的梯度消失问题。

A method of image classification based on multi feature weighted residual convolution neural network

A method of image classification based on multi-channel feature weighted residual convolution neural network includes the following steps: 1) the input image of the model is the pre-processed original image, and the pre-processed image is cut to a fixed size; 2) the image is convoluted and pooled in a larger size; 3) the output in step 2 The feature is fed into the first multi-channel feature weighted residual module; 4) The output of the multi-channel feature weighted residual module in step 3 is fed into the next multi-channel feature weighted residual module. After several multi-channel feature weighted residual modules, the size of the output feature image will be reduced gradually until it becomes smaller, and finally it will pass through one. The average pooling layer is reduced to feature points, and the feature points are directly fed into the classification layer for classification or classified after passing through the full connection layer. The invention is applied to complex image classification tasks, enriches feature expression, and avoids the problem of gradient disappearance caused by the increase of the depth of the neural network.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多路特征加权的残差卷积神经网络图像分类方法
本专利技术涉及计算机视觉领域，是深度学习技术的一种，主要用于训练深度图像分类模型，尤其是一种图像分类方法。
技术介绍
近几年，随着计算机计算能力的指数级增长和新型神经网络架构的出现，深度学习技术开始在计算机视觉、语音识别、自然语言处理等领域大放光彩。在计算机视觉领域，卷积神经网络的出现大大提高了计算机在图像分割，图像识别任务中的性能，其识别准确率远远高于传统的机器学习算法。目前，基于卷积神经网络的图像识别技术已经获得了广泛的使用。常规的卷积神经网络包括卷积层、池化层、全连接层和分类层，其基本结构为上述单元的串联组合。卷积层用于学习图像中的低层和高层特征，而池化层可以对这些特征进行提取并不断减少特征图的尺寸。全连接层与分类层位于整个神经网络的末尾，用于对最终提取的高层特征进行分类。在具体的图像分类任务中，图像中被识别物体的特征类型较多而且特征结构较复杂。为了应对这一情况，需要对常规的卷积神经网络在宽度和深度两个方面进行提升。首先，单一的卷积层往往无法学习到所有的有效特征，所以现有的网络结构通过增加网络宽度，即增加网络中某一层的输出特征数来解决这一问题。但是通道数的增加可能导致网络学习到重复或无用的特征，导致模型发生冗余，不仅不利于分类还增加了无用的计算量。另外，为了使神经网络可以学习到更加复杂的特征，网络的深度也被设计的较深。但是随着网络深度的增加，网络训练过程中更容易发生梯度消失和梯度爆炸问题，从而导致学习过程无法收敛。针对此问题，微软亚洲研究院的研究团队提出了基于残差结构的卷积神经网络，其基本思想是在低...

【技术保护点】
1.一种基于多路特征加权的残差卷积神经网络图像分类方法，其特征在于，所述方法包括以下步骤：1)首先，模型的输入图像为经过预处理的原始图像，经过预处理的图像裁剪为一个固定尺寸；2)对图像进行较大尺寸的卷积操作和池化操作；3)将步骤2)中输出的特征送入第一个多路特征加权残差模块，所述多路特征加权残差模块由多个卷积组和一个加权组合模块构成：每个卷积组内都包含一个或多个卷积层，每一个卷积组之间的卷积层配置应该各不相同，以保证卷积核尺寸的多样性；同时，网络中的特征图像在经过某些多路特征加权残差模块时，特征图像的尺寸会相应减小，所以为了保证每个卷积组的输出特征图尺寸保持一致，有些卷积组内也包含池化层；所有卷积组的输出会被送入加权组合模块进行整合，具体的加权组合方法是对每一个卷积组的输出特征乘以一个随机初始化的不同参数k，并将上述经过加权后的卷积组输出在特征通道进行拼接；拼接后的组合特征将与多路特征加权残差模块的输入相加作为整个多路特征加权残差模块的输出；4)将步骤3)中多路特征加权残差模块的输出继续送入下一个多路特征加权残差模块，在经过多个多路特征加权残差模块后，输出的特征图像尺寸会逐渐缩小直至变...

【技术特征摘要】
1.一种基于多路特征加权的残差卷积神经网络图像分类方法，其特征在于，所述方法包括以下步骤：1)首先，模型的输入图像为经过预处理的原始图像，经过预处理的图像裁剪为一个固定尺寸；2)对图像进行较大尺寸的卷积操作和池化操作；3)将步骤2)中输出的特征送入第一个多路特征加权残差模块，所述多路特征加权残差模块由多个卷积组和一个加权组合模块构成：每个卷积组内都包含一个或多个卷积层，每一个卷积组之间的卷积层配置应该各不相同，以保证卷积核尺寸的多样性；同时，网络中的特征图像在经过某些多路特征加权残差模块时，特征图像的尺寸会相应减小，所以为了保证每个卷积组的输出特征图尺寸保持一致，有些卷积组内也包含池化层；所有卷积组的输出会被送入加权组合模块进行整合，具体的加权组合方法是对每一个卷积组的输出特征乘以一个随机初始化的不同参数k，并将上述经过加权后的卷积组输出在特征通道进行拼接；拼接后的组合特征将与多路特征加权残差模块的输入相加作为整个多路特征加权残差模块的输出；4)将步骤3)中多路特征加权残差模块的输出继续送入下一个多路特征加权残差模块，在经过多个多路特征加权残差模...

【专利技术属性】
技术研发人员：刘义鹏，李湛青，陈朋，蒋莉，王海霞，梁荣华，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人