加速基于卷积神经网络的中文手写体识别的方法技术

技术编号:19824069 阅读:49 留言:0更新日期:2018-12-19 15:31
一种基于卷积神经网络的中文手写体识别的加速方法,包括如下步骤:手写字符图片数据预处理,方便卷积神经网络的分类实现;搭建卷积神经网络结构,在浅层加入第一分类器,中间层加入第二分类器,顶层加入第三分类器;初始化网络参数,固定浅层网络和第一分类器的参数,利用第二分类器的损失函数指导网络训练,更新中间层网络和第二分类器的参数;固定浅层网络、中间层网络、第一分类器和第二分类器的参数,利用第三分类器的损失函数指导网络训练,更新顶层网络和第三分类器的参数;对三个分类器的损失函数进行加权,利用加权后的损失函数微调整个网络和三个分类器的参数;在测试集上对网络的三个分类器进行测试,评估分类器的性能,并且计算三个分类器所需的计算量。

【技术实现步骤摘要】
加速基于卷积神经网络的中文手写体识别的方法
本专利技术涉及深度学习技术,特别是卷积神经网络在手写体识别中的应用,具体涉及的是一种基于卷积神经网络的中文手写体识别的加速方法。
技术介绍
由于在拍照文档、邮政信封、支票、手稿文书等光学字符识别系统以及手写文字输入设备中的广泛应用前景,中文手写体识别一直是模式识别领域的一个重要研究方向,得到了学术界和工业界的广泛研究和关注。传统的中文手写体识别系统主要采用一些人工设计的特征,如Gabor特征和Gradient特征,利用二次判决函数等分类器对字符进行分类。近年来,随着深度学习的兴起,卷积神经网络对中文手写体识别带来极其有效的解决办法,基于卷积神经网络的方法取得的结果均大幅度领先传统的方法。然而,由于卷积神经网络计算的特殊性,网络需要巨大的乘加运算,例如经典的VGG16网络需要约153亿次乘加运算,即便是现有的一些轻量级网络,仍然需要数百万次乘加运算,如此巨大的运算量限制了卷积神经网络的应用。本专利技术在现有基于卷积神经网络的中文手写体识别上,采取增加中间层输出的方案,将简单样本和困难样本区别对待,用浅层的网络对大部分简单样本进行识别,而困难样本文档来自技高网...

【技术保护点】
1.一种基于卷积神经网络的中文手写体识别的加速方法,包括如下步骤:步骤1:手写字符图片数据预处理,方便卷积神经网络的分类实现;步骤2:搭建卷积神经网络结构,在浅层加入第一分类器,中间层加入第二分类器,顶层加入第三分类器;步骤3:初始化网络参数,利用第一分类器的损失函数指导网络训练,更新浅层网络和第一分类器的参数;固定浅层网络和第一分类器的参数,利用第二分类器的损失函数指导网络训练,更新中间层网络和第二分类器的参数;固定浅层网络、中间层网络、第一分类器和第二分类器的参数,利用第三分类器的损失函数指导网络训练,更新顶层网络和第三分类器的参数;步骤4:对三个分类器的损失函数进行加权,利用加权后的损失...

【技术特征摘要】
1.一种基于卷积神经网络的中文手写体识别的加速方法,包括如下步骤:步骤1:手写字符图片数据预处理,方便卷积神经网络的分类实现;步骤2:搭建卷积神经网络结构,在浅层加入第一分类器,中间层加入第二分类器,顶层加入第三分类器;步骤3:初始化网络参数,利用第一分类器的损失函数指导网络训练,更新浅层网络和第一分类器的参数;固定浅层网络和第一分类器的参数,利用第二分类器的损失函数指导网络训练,更新中间层网络和第二分类器的参数;固定浅层网络、中间层网络、第一分类器和第二分类器的参数,利用第三分类器的损失函数指导网络训练,更新顶层网络和第三分类器的参数;步骤4:对三个分类器的损失函数进行加权,利用加权后的损失函数微调整个网络和三个分类器的参数;步骤5:在测试集上对网络的三个分类器进行测试,评估分类器的性能,并且计算三个分类器所需的计算量。2.根据权利要求1所述的基于卷积神经网络的中文手写体识别的加速方法,其中所述步骤1中,对手写字符图片进行预处理,将图片采用双线性插值方式缩放至64×64大小,图片转化为灰度图,并且对图片的前景颜色和背景颜色进行调整,使得前景具有较大的灰度值,接近255,背景具有较小的灰度值,接近0。3.根据权利要求1所述的基于卷积神经网络的中文手写体识别的加速方法,其中所述步骤2包括:步骤21:采用的基础卷积神经网络结构共有七个卷积层,三个池化层;步骤22:采用的所有卷积层卷积核大小均为3×3,滑动步长为1,卷积层输出通道数分别为64、128、128、256、256、512和512,分别指代为conv1、conv2、conv3、conv4、conv5、conv6和conv7;步骤23:所有卷积层均采用prelu函数为激活函数,公式如下:其中,x为节点的输入值,prelu(x)为节点的输入经过激活函数之后的输出值,a是一个可学习的参数;步骤24:所有卷积和激活之间都加入批量归一化,公式如下:其中x是卷积后得到的结果,μ和σ分别是数据的均值和方差,γ和β是两个可学习参数,分别控制数据的缩放和平移;批量归一化能有效加速网络收敛,也能起到正则化的效果,提高网络的泛化能力;步骤25:所有池化层均采用最大池化,窗口大小均为2×2,滑动步长为2,池化层设在conv1、conv3和conv5后,分别指代为pool1、pool2和pool3;步骤26,浅层网络包括conv1、pool1、conv2和conv3模块,中间层包括pool2、conv4和conv5模块,顶层网络包括pool3、conv6和conv7模块;步骤2...

【专利技术属性】
技术研发人员:李志远滕南君金敏鲁华祥
申请(专利权)人:中国科学院半导体研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1