一种脱机手写、印刷汉字识别方法及系统技术方案

技术编号：17562290 阅读：49 留言：0更新日期：2018-03-28 12:40

本发明专利技术公开了一种脱机手写、印刷汉字识别方法及系统，包括：制作训练集：载入训练集，载入模型进行训练，根据模型训练阶段训练出的权重，对训练集进行识别，找到训练集中的错误部分，并剔除，调整参数，得到最终训练集；识别脱机手写汉字：根据所述最终训练集，载入模型和参数，读取汉字图像进行二值化和灰度化处理，然后将二值化的图像和灰度化的图像像素取与，得到新的汉字图像。本发明专利技术的优点是：实现方法简单，适用范围广泛，模型采用神经卷积网络结构：共包含44个卷积层、10个池化层，9个融合层，9个批规范化层，2个dropout层、1个全连接层、1个输入层和1个输出层，脱机汉字识别精确。

A method and system for off-line handwritten and printed Chinese character recognition

The invention discloses a handwritten and printed Chinese characters recognition method and system, including: making the training set into the training set, loading model for training, training, training stage according to the weight of the model, the training set for recognition, find the wrong part, the training set and adjust the parameters to get the final elimination, the training set; recognition of handwritten Chinese characters: according to the final training set, load models and parameters, read Chinese characters image binarization and grayscale processing, and then the two value image pixel image and grayscale of the image and get the new Chinese characters. The invention has the advantages that the realizing method is simple and applicable to a wide range of convolution model based on neural network structure: a total of 44 volumes, 10 layer pool layer, 9 fusion layer, the 9 batch of standardized 2 layer, dropout layer, 1 layer, fully connected to 1 input layer and 1 the output layer, offline recognition precision Chinese characters.

全部详细技术资料下载

【技术实现步骤摘要】
一种脱机手写、印刷汉字识别方法及系统
本专利技术涉及一种脱机手写、印刷汉字识别方法及系统。
技术介绍
目前，地质调查的野外工作是数据的重要来源，这部分人工记录的原始地质资料在地质大数据中占有相当大的比例，其蕴含着大量有价值的信息，但出于技术原因，这部分数据中的信息无法利用，成为了“暗数据”。汉字识别技术主要分为印刷体识别和手写体识别两大类。手写汉字的随意性大，比印刷体难识别。手写汉字识别根据数据采集的方式又可分为联机识别和脱机识别。在联机识别中，计算机能获得输入字符的笔画顺序，因此比脱机识别获得的信息更多，更容易识别。再加上拍照或扫描的过程中，不同的光照、分辨率、纸张等都会带来干扰。因此，脱机手写汉字识别远比联机识别要难。尽管一些现有技术声称脱机手写汉字识别率已经达到了99％，这些结果让人们误认为手写体汉字识别问题已经得到了很好的解决。如CN106408038A的专利文献公开了一种基于卷积神经网络的手写汉字旋转汉字识别方法，其包括在图形处理器上搭建基于包含多种卷积神经网络模型的Caffe深度学习框架的平台；准备训练数据集和带有标签的测试数据集，并利用上述数据集在图形处理器上训练上述卷积神经网络模型进行一级手写汉字的识别；将HCL2000数据库的手写汉字原始图像和随机旋转各个方向后的图像输入卷积神经网络模型，对网络进行训练。最后输入未知旋转汉字进行测试，得到对汉字图像的识别结果，但其显著缺点是采用链状网络，导致识别率大大降低。实际上，每当遇到真实的无限制的手写样本时，很多算法的识别率便会出现明显的降低。导致这些差距的潜在因素在于汉字的独特性和手写体汉字风格的...
一种脱机手写、印刷汉字识别方法及系统

【技术保护点】
一种脱机手写、印刷汉字识别方法，其特征在于，包括：制作训练集：载入训练集，载入模型进行训练，根据模型训练阶段训练出的权重，对训练集进行识别，找到训练集中的错误部分，并剔除，调整参数，得到最终训练集；识别脱机手写汉字：根据所述最终训练集，载入模型和参数，读取汉字图像进行二值化和灰度化处理，然后将二值化的图像和灰度化的图像像素取与，得到新的汉字图像。

【技术特征摘要】
1.一种脱机手写、印刷汉字识别方法，其特征在于，包括：制作训练集：载入训练集，载入模型进行训练，根据模型训练阶段训练出的权重，对训练集进行识别，找到训练集中的错误部分，并剔除，调整参数，得到最终训练集；识别脱机手写汉字：根据所述最终训练集，载入模型和参数，读取汉字图像进行二值化和灰度化处理，然后将二值化的图像和灰度化的图像像素取与，得到新的汉字图像。2.如权利要求1所述的脱机手写、印刷汉字识别方法，其特征在于，所述训练集包括：HCL2000、HWDB1.1、自行采集的138份印刷体合计738份一级汉字，3755个汉字，559个地质高频汉字，英文字母、数字和标点符号171个，每个地质高频汉字和符号300个样本。3.如权利要求2所述的脱机手写、印刷汉字识别方法，其特征在于，所述进行二值化与灰度化处理的步骤还包括：先对要识别的彩色汉字图像的所有像素点[r，g，b]聚类，得到两个类别；再根据图像4个角的类别区分背景类别和汉字内容类别，因为4个角往往是背景；之后根据聚类结果将图像二值化，同时将原始图像灰度化，将r、g、b三个通道采用算法：r×0.299+g×0.587+b×0.114得到灰度值。4.如权利要求1所述的脱机手写、印刷汉字识别方法，其特征在于，还包括将所述新的汉字图像的宽和高之间较大的那个缩放到64，另一个等比例缩放，然后两边填充为背景的步骤。5.如权利要求4所述的脱机手写、印刷汉字识别方法，其特征在于，还包括：将汉字图像数组调整为神经网络的输入维数的步骤。6.如权利要求1至5中任一项所述的脱机手写、印刷汉字识别方法，其特征在于，所述模型采用神经卷积网络结构：共包含44个卷积层、10个池化层，9个融合层，9个批规范层，2个dropout层、1个全连接层、1个输入层和1个输出层，从一层引出多层并最终汇聚成一层的9个inception模块；网络走向为从上往下，每一层的输入为上一层的输出，初始输入层大小为64×64×1，输入的图像大小是64×64，图像为灰度图，只有1个通道；首先使用64个7×7的卷积核对输入图像做卷积；然后做大小为5×5，步幅为3的池化，此时输出数组大小为22×22×64；下面是9个inception单元，第一个inception单元先接一个批规范层，将上一层的结果批规范化，然后批规范层的输出作为输入，分别引出3个分支，第一个分支是32个1×1的卷积、第二个分支为48个1×1的卷积然后接96个3×3的卷积、最后一个分支是3×3的池化然后接16个1×1的卷积，最后将3个分支的输出用concatenate层组合得到的输出数组大小为22×22×(32+96+16)＝22×22×144，每个inception单元都是将几个大小不同的卷积结果和一个池化组合，每种卷积之前先接一个1×1的卷积，有一个单独的1×1卷积，池化则是在后面接一...

【专利技术属性】
技术研发人员：赛琳伟，魏东琦，
申请(专利权)人：中国地质调查局西安地质调查中心，赛琳伟，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人