基于深层卷积神经网络的离线手写汉字体识别方法技术

技术编号：19343712 阅读：19 留言：0更新日期：2018-11-07 14:28

一种基于深层卷积神经网络的离线手写汉字体识别方法，包括以下步骤：1)对汉字图像采集以及读取；2)对图像进行处理，过程如下：2.1)首先要进行汉字分割，把图片中所有汉字分割成1张图片一个汉字；2.2)接着对图片进行压缩或者放大，因为分割出来的图片可能无法满足识别的输入，因此需要将图片进行归一化，统一大小为64*64像素；3)读入处理过之后的图片组，利用已经训练好的深层卷积神经网络识别，并输出结果本发明专利技术提供了一种提升识别效果的基于深层卷积神经网络的离线手写汉字体识别方法。

Recognition method of off-line handwritten Chinese character based on deep convolutional neural network

An offline handwritten Chinese character recognition method based on deep convolution neural network includes the following steps: 1) acquisition and reading of Chinese character images; 2) image processing, the process is as follows: 2.1) First, Chinese characters are segmented into one picture and one Chinese character; 2.2) Then, the picture is compressed. Or zoom in, because the segmented picture may not satisfy the input of recognition, it is necessary to normalize the picture to 64*64 pixels in uniform size; 3) read into the processed picture group, use the trained deep convolution neural network to recognize, and output the result, the present invention provides an improved recognition effect. An off-line handwritten Chinese character recognition method based on deep convolution neural network.

全部详细技术资料下载

【技术实现步骤摘要】
基于深层卷积神经网络的离线手写汉字体识别方法
本专利技术属于图像分类
，具体是一种基于深层卷积神经网络的离线手写汉字体识别方法
技术介绍
离线手写汉字识别是模式识别领域中的一个子方向。离线是指所处理的手写文字是通过扫描仪或摄像头等图像捕捉设备采集到的手写文字二维图。在手写体研究领域中，Casey和Nag在1966年用模板匹配发成功识别出了1000个印刷体汉字。20世纪70年代末，离线手写体汉字识别研究已经引起了广泛的社会关注。不同于英文识别，汉字识别非常困难，其困难点有如下几点：汉字类别多(常用汉字就有6000多个)，汉字结构体复杂(包括横竖撇点折)，汉字字形变化多，相似汉字多等。对于汉字的识别，主要有两大类：特征提取和分类器设计。特征提取在20世纪学者研究的比较多，其主要有根据特征点提取、笔画结构等等方法分类识别。汉字识别中，除了对特征的提取，就是利用分类器进行汉字识别。有学者曾研究过SVM模型去分类，但其效果一般，在识别种类较多的情况下效果不佳。
技术实现思路
为了克服已有离线手写汉字体识别方法的识别效果不佳的不足,本专利技术提供了一种提升识别效果的基于深层卷积神经网络的离线手写汉字体识别方法。本专利技术解决其技术问题所采用的技术方案是：一种基于深层卷积神经网络的离线手写汉字体识别方法，包括以下步骤：1)对汉字图像采集以及读取；2)对图像进行处理，过程如下：2.1)首先要进行汉字分割，把图片中所有汉字分割成1张图片一个汉字；2.2)接着对图片进行压缩或者放大，因为分割出来的图片可能无法满足识别的输入，因此需要将图片进行归一化，统一大小为64*64像素...

【技术保护点】
1.一种基于深层卷积神经网络的离线手写汉字体识别方法，其特征在于，包括以下步骤：1)对汉字图像采集以及读取；2)对图像进行处理，过程如下：2.1)首先要进行汉字分割，把图片中所有汉字分割成1张图片一个汉字；2.2)接着对图片进行压缩或者放大，因为分割出来的图片可能无法满足识别的输入，因此需要将图片进行归一化，统一大小为64*64像素；3)读入处理过之后的图片组，利用已经训练好的深层卷积神经网络识别，并输出结果；所述深层卷积神经网络包含3个卷积层、3个池化层、1个全连接层以及1个softmax层，输入一个64*64像素且含有单一汉字的图片，经过卷积层1产生64个64*64的矩阵，经过池化层1后产生64个32*32的矩阵，经过卷积层2、池化层2、卷积层3、池化层3后产生256个8*8的矩阵，再经过全连接层产生1个1*1024的矩阵，最后经过softmax层输出属于各种类别汉字的概率。

【技术特征摘要】
1.一种基于深层卷积神经网络的离线手写汉字体识别方法，其特征在于，包括以下步骤：1)对汉字图像采集以及读取；2)对图像进行处理，过程如下：2.1)首先要进行汉字分割，把图片中所有汉字分割成1张图片一个汉字；2.2)接着对图片进行压缩或者放大，因为分割出来的图片可能无法满足识别的输入，因此需要将图片进行归一化，统一大小为64*64像素；3)读入处理过之后的图片组，利用已经训练好的深层卷积神经网络识别，并输出结果；所述深层卷积神经网络包含3个卷积层、3个池化层、1个全连接层以及1个softmax层，输入一个64*64像素且含有单一汉字的图片，经过卷积层1产生64个64*64的矩阵，经过池化层1后产生64个32*32的矩阵，经过卷积层2、池化层2、卷积层3、池化层3后产生256个8*8的矩阵，再经过全连接层产生1个1*1024的矩阵，最后经过softmax层输出属于各种类别汉字的概率。2.如权利要求1所述的基于深层卷积神经网络的离线手写汉字体识别方法，其特征在于，所述步骤3)中，所述深层卷积神经网络中，在最后的输出种类做调整，因为在后面的训练数据库中...

【专利技术属性】
技术研发人员：陆成刚，黄成斌，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人