一种基于卷积神经网络的图像识别方法、装置及设备制造方法及图纸

技术编号:20364415 阅读:49 留言:0更新日期:2019-02-16 17:13
本发明专利技术公开了一种基于卷积神经网络的图像识别方法、装置、设备以及计算机可读存储介质,包括:获取待识别的图像,将图像输入卷积神经网络的卷积层进行特征提取,得到各个卷积层的神经元;对最后一层卷积层的神经元进行全连接操作,得到第一层全连接层;依据第一层全连接层神经元预选特征值大小,对第一层全连接层的神经元进行排序;判断第一全连接层神经元的排序方式,若排序方式为升序排序,则根据预设丢弃比率,由上至下丢弃所述第一全连接层中部分神经元后,将第一层全连接层神经元内剩余神经元连接至softmax层进行分类和识别。本发明专利技术所提供的方法、装置、设备以及计算机可读存储介质,有效防止过拟合的同时保证了减小训练次数后图像识别的精确度。

【技术实现步骤摘要】
一种基于卷积神经网络的图像识别方法、装置及设备
本专利技术涉及图像处理
,特别是涉及一种基于卷积神经网络的图像识别方法、装置、设备以及计算机可读存储介质。
技术介绍
深度学习是近十年来人工智能领域取得的重要突破。它在语音识别、自然语言处理、计算机视觉、图像与视频分析、多媒体等诸多领域的应用取得了巨大成功。现有的深度学习模型属于神经网络。深度模型具有强大的学习能力和高效的特征表达能力,更重要的优点是从像素级原始数据到抽象的语义概念逐层提取信息,这使得它在提取图像的全局特征和上下文信息方面具有突出的优势,解决传统的计算机视觉问题提高了图像识别与分类的准确率。在图像识别中,卷积神经网络模型应该将整幅图像作为输入,直接预测整幅分割图。图像分割可以被看作一个高维数据转换的问题来解决。这样不但利用到了上下文信息,模型在高维数据转换过程中也隐式地加入了形状先验,使识别效果大幅上升。但是当训练数据集规模较小或计算资源有限的情况下,由于神经网络有大量参数,将会发生过拟合问题,虽然其识别结果在训练集上准确率很高,但在测试集上效果却很差。现有的改善过拟合,提高图像识别在测试集上的准确率的方法一种是减小网络规模降低模型的复杂度,就是在cost函数中加入正则化项,正则化项可以理解为复杂度,cost越小越好,但cost加上正则项之后,为了使cost小,就不能让正则项变大,也就是不能让模型更复杂,这样就降低了模型复杂度,也就降低了过拟合。正则化又分为L2正则化和L1正则化两种。第二种方法就是在神经网络中添加Dropout层。在该层中,神经网络在每次训练时按一定的概率随机抛弃掉一些神经元,将其置0。相当于在不同的神经网络上进行训练,这样就减少了神经元之间的依赖性,即每个神经元不能依赖于某几个其他的神经元(指层与层之间相连接的神经元),使神经网络更加能学习到与其他神经元之间的更加健壮robust的特征。如图1所示,全连接层神经网络是每相邻两层神经元之间,下一层的每一个神经元都与上一层所有神经元相互连接,形成前向传递和反向回馈的计算方式。现有技术中,通过Dropout方法使全连接层的神经元随机减少,减少的神经在实践中是用伯努利随机分布实现。在概率为0.5的情况下,经过Dropout处理后全连接层的网络结构为图2所示。如图2所示,被选中的神经在模型训练的时候其所有的连接都剔除,只有剩下的神经元进行连接。在原始的全连接层网络计算公式为:通过激活函数后输出为:其中,W为权重;y(l)为原始卷积输入层;y(l+1)为经过激活后的全连接输出层;z为全连接输出层;b为偏置;l结构层数;i神经元个数;j为随机变量个数;为第l+1层第i个权重;为第l+1层j个服从伯努利分布的随机变量。如图3所示,在使用Dropout层后,修改激活函数,通过一个伯努利随机变量分布使输出变为:Bernoulli(p)为:其中,k为可能的输出,以设定的概率p,随机生成一个0、1的向量决定每个神经元是否被保留。比如我们某一层网络神经元的个数为1000个;其激活值为x1,x2……x1000,我们设定Dropout比率p选择0.4,那么这一层神经元经过Dropout层后,x1……x1000神经元其中会有大约400个的值被置为0。经过上述操作屏蔽掉某些神经元,使其激活值为0以后,我们还需要对向量x1……x1000进行重置(rescale),也就是乘以1/(1-p)。如果在训练的时,经过置0后,没有对x1……x1000进行rescale,那么你在测试的时候,就需要对权重进行rescale:r为服从伯努利分布的一个随机变量,为经过丢弃后的输出层。在使用Dropout层来防止过拟合时,每次训练抛弃的神经元都是随机的,但是每个神经元上都承载着图像的某一部分特征,这些特征中有些也许在最后的图像识别中会起到很重要的作用,因此如果被丢弃将会使最终的识别精确度下降。相反,有些承载不重要特征的神经元被保留下来,对最后的识别结果并无作用。且使用Dropout层的神经网络的训练一般都是基于大数据集,并且需要经过大量的训练,不断修正网络权重从而得到的良好效果。当训练次数减小时,对于图像的识别精确度就会下降。综上所述可以看出,如何在有效防止过拟合的同时保证减小训练次数后图像识别的精确度是目前有待解决的问题。
技术实现思路
本专利技术的目的是提供一种基于卷积神经网络的图像识别方法、装置、设备以及计算机可读存储介质,以解决现有技术中采用Dropout层防止过拟合问题时图像识别精确度较低的问题。为解决上述技术问题,本专利技术提供一种基于卷积神经网络的图像识别方法,包括:获取待识别的图像,将所述图像输入卷积神经网络的各个卷积层进行特征提取后,得到所述各个卷积层的神经元;对最后一层卷积层的神经元进行全连接操作,从而得到所述卷积神经网络的第一层全连接层;依据所述第一层全连接层神经元预选特征值大小,对所述第一层全连接层的神经元进行排序;判断所述第一全连接层神经元的排序方式,若所述排序方式为升序排序,则根据预设丢弃比率,由上至下丢弃所述第一全连接层中部分神经元后,将所述第一层全连接层神经元内剩余的神经元连接至所述卷积神经网络的softmax层进行分类和识别。优选地,所述依据所述第一层全连接层神经元预选特征值大小,对所述第一层全连接层的神经元进行排序包括:依据所述第一层全连接层神经元灰度值的大小,对所述第一层全连接层的神经元进行排序。优选地,所述判断所述第一全连接层神经元的排序方式后还包括:若所述排序方式为降序排列,则根据预设丢弃比率,由下至上丢弃所述第一全连接层中部分神经元后,将所述第一层全连接层神经元内剩余的神经元连接至所述卷积神经网络的softmax层进行分类。优选地,所述获取待识别的图像,将所述图像输入卷积神经网络的各个卷积层进行特征提取后,得到所述各个卷积层的神经元包括:将待识别的图像输入至卷积神经网络的卷积层,通过多个不同的卷积核的特征提取,并为所述图像添加偏置,从而得到所述图像的局部特征;利用非线性的激活函数对所述卷积核的特征提取结果进行激活识别,得到所述卷积层的神经元。优选地,所述利用非线性的激活函数对所述卷积核的特征提取结果进行激活识别,得到所述卷积层的神经元利用Sigmoid函数对所述卷积核的特征提取结果进行激活识别,得到所述卷积层的神经元。优选地,所述将所述第一层全连接层神经元内剩余的神经元连接至所述卷积神经网络的softmax层进行分类和识别包括:将所述第一层全连接层神经元内剩余的神经元连接至所述卷积神经网络的softmax层进行分类,以便于在所述softmax层的最终分类输出所述图像的识别结果的准确度。本专利技术还提供了一种基于卷积神经网络的图像识别装置,包括:特征提取模块,用于获取待识别的图像,将所述图像输入卷积神经网络的各个卷积层进行特征提取后,得到所述各个卷积层的神经元;全连接模块,用于对最后一层卷积层的神经元进行全连接操作,从而得到所述卷积神经网络的第一层全连接层;排序模块,用于依据所述第一层全连接层神经元预选特征值大小,对所述第一层全连接层的神经元进行排序;丢弃模块,用于判断所述第一全连接层神经元的排序方式,若所述排序方式为升序排序,则根据预设丢弃比率,由上至下丢弃所述第一全连接层中部分神本文档来自技高网
...

【技术保护点】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括:获取待识别的图像,将所述图像输入卷积神经网络的各个卷积层进行特征提取后,得到所述各个卷积层的神经元;对最后一层卷积层的神经元进行全连接操作,从而得到所述卷积神经网络的第一层全连接层;依据所述第一层全连接层神经元预选特征值大小,对所述第一层全连接层的神经元进行排序;判断所述第一全连接层神经元的排序方式,若所述排序方式为升序排序,则根据预设丢弃比率,由上至下丢弃所述第一全连接层中部分神经元后,将所述第一层全连接层神经元内剩余的神经元连接至所述卷积神经网络的softmax层进行分类和识别。

【技术特征摘要】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括:获取待识别的图像,将所述图像输入卷积神经网络的各个卷积层进行特征提取后,得到所述各个卷积层的神经元;对最后一层卷积层的神经元进行全连接操作,从而得到所述卷积神经网络的第一层全连接层;依据所述第一层全连接层神经元预选特征值大小,对所述第一层全连接层的神经元进行排序;判断所述第一全连接层神经元的排序方式,若所述排序方式为升序排序,则根据预设丢弃比率,由上至下丢弃所述第一全连接层中部分神经元后,将所述第一层全连接层神经元内剩余的神经元连接至所述卷积神经网络的softmax层进行分类和识别。2.如权利要求1所述的图像识别方法,其特征在于,所述依据所述第一层全连接层神经元预选特征值大小,对所述第一层全连接层的神经元进行排序包括:依据所述第一层全连接层神经元灰度值的大小,对所述第一层全连接层的神经元进行排序。3.如权利要求2所述的图像识别方法,其特征在于,所述判断所述第一全连接层神经元的排序方式后还包括:若所述排序方式为降序排列,则根据预设丢弃比率,由下至上丢弃所述第一全连接层中部分神经元后,将所述第一层全连接层神经元内剩余的神经元连接至所述卷积神经网络的softmax层进行分类。4.如权利要求1所述的图像识别方法,其特征在于,所述获取待识别的图像,将所述图像输入卷积神经网络的各个卷积层进行特征提取后,得到所述各个卷积层的神经元包括:将待识别的图像输入至卷积神经网络的卷积层,通过多个不同的卷积核的特征提取,并为所述图像添加偏置,从而得到所述图像的局部特征;利用非线性的激活函数对所述卷积核的特征提取结果进行激活识别,得到所述卷积层的神经元。5.如权利要求4所述的图像识别方法,其特征在于,所述利用非线性的激活函数对所述卷积核的特征提取结果进行激活识别,得到所述卷积层的...

【专利技术属性】
技术研发人员:李雪扬王永华艾雄志万频戴鹏翔
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1