卷积神经网络的训练方法、图像识别方法及装置制造方法及图纸

技术编号:14903735 阅读:98 留言:0更新日期:2017-03-29 18:59
本公开是关于一种卷积神经网络的训练方法、图像识别方法及装置,该基于卷积神经网络的图像识别方法包括:获取训练完成的卷积神经网络,所述训练完成的卷积神经网络通过对训练样本和初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层而得到;对待识别图像进行预处理,得到测试样本;根据所述训练完成的卷积神经网络,对所述测试样本进行图像识别,得到识别结果。该技术方案可以节省训练时间和内存,使得训练更多层数的CNN成为现实;并且在图像识别时,用训练完成的该更多层的CNN来进行图像识别,保证图像识别的正确率。

【技术实现步骤摘要】

本公开涉及信息处理
,尤其涉及卷积神经网络的训练方法、图像识别方法及装置。
技术介绍
卷积神经网络(ConvolutionalNeuralNetworks,CNN)是近年发展起来,并引起广泛重视的一种高效的图像识别方法。在CNN中,图像的一小部分(局部感受区域)作为层级结构的最低层的输入,信息再依次传输到不同的层,每层通过一个数字滤波器去获得观测数据的最显著的特征。这个方法能够获取对平移、缩放和旋转不变的观测数据的显著特征。
技术实现思路
本公开实施例提供卷积神经网络的训练方法、图像识别方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种基于卷积神经网络的图像识别方法,包括:获取训练完成的卷积神经网络,所述训练完成的卷积神经网络通过对训练样本和初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层而得到;对待识别图像进行预处理,得到测试样本;根据所述训练完成的卷积神经网络,对所述测试样本进行图像识别,得到识别结果。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以在获取训练完成的卷积神经网络时每次迭代计算只保留小于等于计算机最大训练深度的计算层进行运算,保证计算机有足够的内存资源进行每次的迭代计算,且节省了训练时间,使得训练更多层数的CNN成为现实;并且在图像识别时,用训练完成的该更多层的CNN来进行图像识别,保证图像识别的正确率。在一个实施例中,所述在训练过程中的每一次迭代计算舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层;所述根据所述训练完成的卷积神经网络,对所述测试样本进行图像识别,得到识别结果,包括:根据所述训练完成的卷积神经网络和所述预设概率,对所述测试样本进行图像识别,得到识别结果。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以在每一次迭代计算时按照预设概率随机舍弃部分计算层,使得CNN的每一计算层都有机会得到训练,在训练数据不足的条件下,相当于对CNN模型添加正则化约束,可以进一步提高识别精度;并在进行图像识别时,根据训练完成的卷积神经网络和预设概率,对所述测试样本进行图像识别,进一步提高识别结果的正确性。在一个实施例中,所述初始化卷积神经网络包括L个基本模块,所述训练时的每一次迭代计算按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时,按照所述预设概率生成与所述L个基本模块一一对应的L个随机值,其中,所述随机值为1的概率为1-预设概率,所述随机值为0的概率为所述预设概率;舍弃所述随机值为0对应的基本模块所对应的计算层,并用单位映射代替被舍弃的计算层。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以根据按预设概率生成的随机值来确定要舍弃的计算层,快捷方便。在一个实施例中,所述根据所述训练完成的卷积神经网络和所述预设概率,对所述测试样本进行图像识别,得到识别结果,包括:将所述测试样本输入所述训练完成的卷积神经网络,将所述训练完成的卷积神经网络中每个计算层的输出值乘以所述预设概率,得到识别结果。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以将所述训练完成的卷积神经网络中每个计算层的输出值乘以所述预设概率,得到识别结果,可以最大限度地提高训练完成的CNN对图像的识别精度。在一个实施例中,所述方法还包括:按照以下公式获得预设概率P:P=(1-H2/H1);其中,所述H1为所述初始化卷积神经网络的深度,所述H2为计算机的最大训练深度为H2。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以最大限度地利用计算机的内存资源,训练最多层的计算层,更大程度地训练得到准确的CNN模型,可以最大限度地提高训练完成的CNN对图像的识别精度。根据本公开实施例的第二方面,提供一种卷积神经网络的训练方法,包括:获取训练样本和初始化卷积神经网络;根据所述训练样本和所述初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层,得到训练完成的卷积神经网络。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以在训练更多层数的CNN时每次迭代计算只保留小于等于计算机最大训练深度的计算层进行运算,保证计算机有足够的内存资源进行每次的迭代计算,且节省了训练时间,使得训练更多层数的CNN成为现实;并且在图像识别时,用训练完成的该更多层的CNN来进行图像识别,保证图像识别的正确率。在一个实施例中,所述在训练过程中的每一次迭代计算舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以在每一次迭代计算时按照预设概率随机舍弃部分计算层,使得CNN的每一计算层都有机会得到训练,在训练数据不足的条件下,相当于对CNN模型添加正则化约束,可以进一步提高识别精度。在一个实施例中,所述初始化卷积神经网络包括L个基本模块,所述训练时的每一次迭代计算按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时,按照所述预设概率生成与所述L个基本模块一一对应的L个随机值,其中,所述随机值为1的概率为1-预设概率,所述随机值为0的概率为所述预设概率;舍弃所述随机值为0对应的基本模块所对应的计算层,并用单位映射代替被舍弃的计算层。本公开的实施例提供的技术方案可以包括以下有益效果:本实施例可以根据按预设概率生成的随机值来确定要舍弃的计算层,快捷方便。根据本公开实施例的第三方面,提供一种基于卷积神经网络的图像识别装置,包括:第一获取模块,用于获取训练完成的卷积神经网络,所述训练完成的卷积神经网络通过对训练样本和初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层而得到;处理模块,用于对待识别图像进行预处理,得到测试样本;识别模块,用于根据所述训练完成的卷积神经网络,对所述测试样本进行图像识别,得到识别结果。在一个实施例中,所述第一获取模块,包括:第一代替子模块,用于在训练过程中的每一次迭代计算时按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层;所述识别模块,包括:识别子模块,用于根据所述训练完成的卷积神经网络和所述预设概率,对所述测试样本进行图像识别,得到识别结果。在一个实施例中,所述初始化卷积神经网络包括L个基本模块;所述第一代替子模块,用于在训练过程中的每一次迭代计算时,按照所述预设概率生成与所述L个基本模块一一对应的L个随机值,舍弃所述随机值为0对应的基本模块所对应的计算层,并用单位映射代替被舍弃的计算层;其中,所述随机值为1的概率为1-预设概率,所述随机值为0的概率为所述预设概率。在一个实施例中,所述识别子模块,用于将所述测试样本输入所述训练完成的卷积神经网络,将所述训练完成的卷积神经网络中每个计算层的输出值本文档来自技高网...

【技术保护点】
一种基于卷积神经网络的图像识别方法,其特征在于,包括:获取训练完成的卷积神经网络,所述训练完成的卷积神经网络通过对训练样本和初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层而得到;对待识别图像进行预处理,得到测试样本;根据所述训练完成的卷积神经网络,对所述测试样本进行图像识别,得到识别结果。

【技术特征摘要】
1.一种基于卷积神经网络的图像识别方法,其特征在于,包括:获取训练完成的卷积神经网络,所述训练完成的卷积神经网络通过对训练样本和初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层而得到;对待识别图像进行预处理,得到测试样本;根据所述训练完成的卷积神经网络,对所述测试样本进行图像识别,得到识别结果。2.根据权利要求1所述的方法,其特征在于,所述在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层;所述根据所述训练完成的卷积神经网络,对所述测试样本进行图像识别,得到识别结果,包括:根据所述训练完成的卷积神经网络和所述预设概率,对所述测试样本进行图像识别,得到识别结果。3.根据权利要求2所述的方法,其特征在于,所述初始化卷积神经网络包括L个基本模块,所述在训练过程中的每一次迭代计算时按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时,按照所述预设概率生成与所述L个基本模块一一对应的L个随机值,其中,所述随机值为1的概率为1-预设概率,所述随机值为0的概率为所述预设概率;舍弃所述随机值为0对应的基本模块所对应的计算层,并用单位映射代替被舍弃的计算层。4.根据权利要求2所述的方法,其特征在于,所述根据所述训练完成的卷积神经网络和所述预设概率,对所述测试样本进行图像识别,得到识别结果,包括:将所述测试样本输入所述训练完成的卷积神经网络,将所述训练完成的卷积神经网络中每个计算层的输出值乘以所述预设概率,得到识别结果。5.根据权利要求2至4任一项所述的方法,其特征在于,所述方法还包括:按照以下公式获得预设概率P:P=(1-H2/H1);其中,所述H1为所述初始化卷积神经网络的深度,所述H2为计算机的最大训练深度为H2。6.一种卷积神经网络的训练方法,其特征在于,包括:获取训练样本和初始化卷积神经网络;根据所述训练样本和所述初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层,得到训练完成的卷积神经网络。7.根据权利要求6所述的方法,其特征在于,所述在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层。8.根据权利要求7所述的方法,其特征在于,所述初始化卷积神经网络包括L个基本模块,所述训练时的每一次迭代计算按照预设概率随机舍弃部分计算层,并用单位映射代替被舍弃的计算层,包括:在训练过程中的每一次迭代计算时,按照所述预设概率生成与所述L个基本模块一一对应的L个随机值,其中,所述随机值为1的概率为1-预设概率,所述随机值为0的概率为所述预设概率;舍弃所述随机值为0对应的基本模块所对应的计算层,并用单位映射代替被舍弃的计算层。9.一种基于卷积神经网络的图像识别装置,其特征在于,包括:第一获取模块,用于获取训练完成的卷积神经网络,所述训练完成的卷积神经网络通过对训练样本和初始化卷积神经网络进行卷积神经网络训练,在训练过程中的每一次迭代计算时舍弃部分计算层,并用单位映射代替被舍弃...

【专利技术属性】
技术研发人员:万韶华陈志军杨松
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1