一种基于深度学习的手写中文识别方法技术

技术编号：21200907 阅读：46 留言：0更新日期：2019-05-25 01:32

本发明专利技术涉及一种基于深度学习的手写中文识别方法，使用深层架构基于提取出的手写文字的特征向量和训练好的参数对手写文字进行粗分类，使用MQDF分类器基于训练好的参数和每个手写字符对应的100个候选类别对手写文字进行细分类。在深层架构粗分类过程中，使用无监督学习将深层架构的隐藏层一层层的构建起来，然后使用监督学习进一步提升深层架构的特征提取能力。

A Handwritten Chinese Recognition Method Based on Deep Learning

The present invention relates to a method of handwritten Chinese recognition based on in-depth learning. The deep structure is used to roughly classify handwritten Chinese based on extracted feature vectors and trained parameters, and the MQDF classifier is used to subdivide handwritten Chinese based on trained parameters and 100 candidate categories corresponding to each handwritten character. In the process of rough classification of deep architecture, unsupervised learning is used to construct the hidden layer of deep architecture layer by layer, and then supervised learning is used to further enhance the feature extraction ability of deep architecture.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的手写中文识别方法
本专利技术涉及一种基于深度学习的手写中文识别方法，其中包括深度置信网络和手写中文识别等技术。
技术介绍
用机器进行手写文字识别，具有现实意义，并且多年来被作为一个比较流行的课题进行研究。近年来，随着触摸屏移动终端设备的普及，人们越来越需要一种能够快速有效的将书写在触摸屏、手写板等设备的汉字转换成汉字编码的方法。基于笔画移动轨迹的联机手写识别，已经得到了越来越多人的关注。许多方法已经被提出来解决这个问题，但是现有的无约束手写字符识别结果仍然不能满足现实应用的需要。联机手写中文识别是一种联机的中文识别手段，在各种自动识别输入的方法中，它是能够代替或部分代替人工编码输入的惟一可行的方法。联机手写中文识别的研究开始于上世纪70年代，从上世纪80年代开始，得到了越来越多的关注。从20世纪90年代开始，对于联机手写中文识别的研究，主要集中在减少为了正确识别中文而强加给用户的约束。例如，字与字之间不能有衔接，必须写正楷字等等。对于联机手写中文识别，最重要的问题还是在于，对于不同的用户，所写的字的笔顺和笔画数不同。从90年代开始，联机手写中文识别的对象由楷书转变为行书。行书在我们日常生活中经常出现，它的笔顺和笔画数因用户的不同而变动性很大。现在的手写识别系统对楷书的识别率已经很高，但是对行书的识别仍是一个亟待解决的问题。对行书的识别是现在大多数联机手写中文识别系统的目标，因为大多数人都是以行书方式书写。现在，对于正规的中文书写，识别的正确率可以达到98％。但是，对于行书，正确率很难达到90％。虽然市场上已经存在很多手写输入软件，但是效果...

【技术保护点】
1.一种基于深度学习的手写中文识别方法，包括如下步骤：P2DMN归一化：使用P2DNM（pseudo 2D moment normalization）方法将在线手写字符归一化；NCFE特征提取：使用NCFE（normalization‑cooperated feature extraction）方法将归一化后的手写字符的特征提取出来；ADBN粗分类：ADBN（adaptive deep belief networks）使用深层架构基于提取出的手写字符的特征向量和训练好的参数对手写文字进行粗分类，对于每一个手写字符都输出对应的100个候选类别；MQDF细分类：使用MQDF（modified quadratic discriminant function）分类器基于训练好的参数和每个手写字符对应的100个候选类别对手写文字进行细分类；使用Fisher‑LDA方法来首先降低特征向量的维数。

【技术特征摘要】
1.一种基于深度学习的手写中文识别方法，包括如下步骤：P2DMN归一化：使用P2DNM（pseudo2Dmomentnormalization）方法将在线手写字符归一化；NCFE特征提取：使用NCFE（normalization-cooperatedfeatureextraction）方法将归一化后的手写字符的特征提取出来；ADBN粗分类：ADBN（adaptivedeepbeliefnetworks）使用深层架构基于提取出的手写字符的特征向量和训练好的参数对手写文字进行粗分类，对于每一个手写字符都输出对应的100个候选类别；MQDF细分类：使用MQDF（modifiedquadraticdiscriminan...

【专利技术属性】
技术研发人员：周树森，邹海林，柳婵娟，臧睦君，刘通，
申请(专利权)人：鲁东大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人