基于深度可分离卷积神经网络的脱机手写汉字识别方法技术

技术编号：19546844 阅读：35 留言：0更新日期：2018-11-24 21:08

本发明专利技术公开了基于深度可分离卷积神经网络的脱机手写汉字识别方法，首先对图像进行图像裁剪和图像负像的预处理，然后设计一个基于深度可分离卷积的卷积神经网络，使用随机梯度下降法和反向传播算法进行有监督的训练，当模型收敛时，保存模型参数。最后使用保存的模型对测试图像进行识别以验证模型的有效性，本发明专利技术能够降低模型的计算量以及存储量，使得基于神经网络的脱机手写汉字识别模型能够离线的运行在移动端设备上，在图像预处理和卷积神经网络设计方面加以改进，主要减少卷积神经网络的计算复杂度和模型容量，使其能够适用于计算资源和存储资源受限的计算设备。

Offline Handwritten Chinese Character Recognition Based on Deep Separable Convolutional Neural Network

The present invention discloses an offline handwritten Chinese character recognition method based on depth separable convolution neural network. Firstly, image clipping and negative image preprocessing are performed on the image. Then, a convolution neural network based on depth separable convolution is designed, and supervised training is carried out using random gradient descent method and back propagation algorithm. When the model converges, the model parameters are preserved. Finally, the saved model is used to recognize the test image to verify the validity of the model. The invention can reduce the computational load and storage capacity of the model, so that the off-line handwritten Chinese character recognition model based on neural network can run on the mobile device offline, and add image preprocessing and convolutional neural network design. In order to improve it, the computational complexity and model capacity of convolutional neural network are mainly reduced, so that it can be applied to computing devices with limited computational and storage resources.

全部详细技术资料下载

【技术实现步骤摘要】
基于深度可分离卷积神经网络的脱机手写汉字识别方法
本专利技术涉及模式识别和图像分类领域，具体涉及基于深度可分离卷积神经网络的脱机手写汉字识别方法。
技术介绍
脱机手写汉字识别只有二维的图像信息，相比于联机手写汉字识别却少笔画顺序信息，所以在分类识别时，一直是一个较为困难的识别问题。传统的方法分为三部分，一是对数据进行预处理；二是人工设计特征提取；三是将特征进行分类识别。近几年，由于卷积神经网络在计算机视觉方面的成功应用，使得脱机手写汉字识别的识别准确率大幅提升。卷积神经网络只需要将原始数据做简单的预处理，便可以自动地提取特征并分类识别，完全自主地学习一个端到端的识别模型。专利CN201611009032和CN20170304188均是采用卷积神经网络来对手写汉字进行识别。专利CN201611009032采用原始图像加图像方向特征的方式对卷积神经网络进行训练，专利CN20170304188采用不同尺寸的图像分别设计了一个两列卷积神经网络，两种方法均基于卷积神经网络，都能取得比传统方法较好的结果。现今，识别准确率较高的卷积神经网络的网络模型容量较大，而且计算复杂度方面都较高。对于像移动端设备这种资源受限的计算设备，将较大容量的模型部署到移动端，需要耗费较大的成本。而且受限于计算资源，也无法适用于时间敏感和实时性较高的应用。专利CN201611009032采用原始图像加图像方向特征的卷积神经网络，其对图像要先计算方向特征，然后再训练卷积神经网络；专利CN20170304188没有较为复杂的图像预处理，而是针对两个不同尺寸的原始图像进行训练，其训练的卷积神经网络模...

【技术保护点】
1.基于深度可分离卷积神经网络的脱机手写汉字识别方法，其特征在于：具体步骤如下：步骤一，脱机手写汉字图像的预处理：深度可分离卷积神经网络的输入数据为单通道的灰度图像，大小为32×32，由于，原始图像大小不确定，所以首先对输入的原始图像进行缩放处理，缩放后的图像大小为32×32；所识别的手写汉字的原始背景颜色是白色，灰度值为255，为了减少计算量，将白色背景反转为黑色背景，灰度值为0；同时，汉字的亮度值也进行了反转，反转后的图像中更多的亮度值为0，图像矩阵更加稀疏，减少了计算量，原始图像的亮度值为Y(x,y),反转图像的亮度值为X(x,y)，其中x,y是二维坐标位置，图像负像满足以下公式：1.Y(x,y)＝255‑X(x,y) (1)步骤二，设计一个基于深度可分离卷积的卷积神经网络模型：针对设计的深度可分离卷积网络中所使用的深度可分离卷积进行详细说明，一个卷积层的输入特征图为X,大小为M×H×W，其中M是输入特征图通道数，H和W是输入特征图的高和宽；输出特征图为Y，大小为N×H′×W′，其中，N是输出特征图通道数，H′和W′是输出特征图的高和宽；卷积核为F，大小为C×K×K×N,其...

【技术特征摘要】
1.基于深度可分离卷积神经网络的脱机手写汉字识别方法，其特征在于：具体步骤如下：步骤一，脱机手写汉字图像的预处理：深度可分离卷积神经网络的输入数据为单通道的灰度图像，大小为32×32，由于，原始图像大小不确定，所以首先对输入的原始图像进行缩放处理，缩放后的图像大小为32×32；所识别的手写汉字的原始背景颜色是白色，灰度值为255，为了减少计算量，将白色背景反转为黑色背景，灰度值为0；同时，汉字的亮度值也进行了反转，反转后的图像中更多的亮度值为0，图像矩阵更加稀疏，减少了计算量，原始图像的亮度值为Y(x,y),反转图像的亮度值为X(x,y)，其中x,y是二维坐标位置，图像负像满足以下公式：1.Y(x,y)＝255-X(x,y)(1)步骤二，设计一个基于深度可分离卷积的卷积神经网络模型：针对设计的深度可分离卷积网络中所使用的深度可分离卷积进行详细说明，一个卷积层的输入特征图为X,大小为M×H×W，其中M是输入特征图通道数，H和W是输入特征图的高和宽；输出特征图为Y，大小为N×H′×W′，其中，N是输出特征图通道数，H′和W′是输出特征图的高和宽；卷积核为F，大小为C×K×K×N,其中，K是卷积核的大小，假设卷积步长和补边为1，由卷积的定义可知，有以下公式：其参数量和计算复杂度分别为：C×K×K×N(3)C×K×K×N×H′×W′(4)深度可分离卷积中，每个卷积核对应只一个输入特征图，所以根据深度可分离卷积的定义，有以下公式：为了保证有相同的输出特征图，在深度可分离卷积后面加入一个输出特征图为N的1×1标准卷积，其参数量和计算复杂度分别为：C×K×K+C×1×1×N(6)C×K×K×H′×W′+C×H′×W′×N(7)使用深度可分离卷积，相比较于标准卷积，其计算复杂度和参数量都减少相同倍数。由公式(3)和公式(6)可得，由公式(4)和(7)可得，所以，当深度可分离卷积核K的大小为3时，相比于标准卷积，其参数量和计算复杂度要减少8到9倍；使用深度可分离卷积，设计一个9层的深度可分离卷积神经网络，网络结构如下：[Input]→[64C3]→2×[96dwC3,96C1]→[MP3]→2×[128dwC3,128C1]→2×[192dwC3,192C1]→2×[384dwC3,384...

【专利技术属性】
技术研发人员：应自炉，陈鹏飞，朱健菲，陈俊娟，甘俊英，翟懿奎，
申请(专利权)人：五邑大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人