手写汉字的识别方法、装置、设备和存储介质制造方法及图纸

技术编号：20945023 阅读：27 留言：0更新日期：2019-04-24 02:36

本发明专利技术实施例公开了一种手写汉字的识别方法、装置、设备和存储介质，其中该方法包括：获取待识别的手写汉字图片；利用预先构建的手写汉字识别模型，得到手写汉字图片的汉字，手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。本发明专利技术实施例通过数据增强模型对初始数据集进行数据增强得到数据增强之后的训练集，采用该数据增强之后的训练集训练好的手写汉字识别模型的准确率得到极大的提高，进而提高了手写汉字识别的准确率。

Recognition Method, Device, Equipment and Storage Media of Handwritten Chinese Characters

The embodiment of the present invention discloses a recognition method, device, device and storage medium for handwritten Chinese characters. The method includes acquiring handwritten Chinese character pictures to be recognized, obtaining Chinese characters of handwritten Chinese character pictures by using pre-constructed handwritten Chinese character recognition model, and training set of handwritten Chinese character recognition model is a training set after data enhancement model. The embodiment of the present invention obtains the training set after data enhancement through data enhancement model to the initial data set. The accuracy of the handwritten Chinese character recognition model trained by the training set after data enhancement is greatly improved, thereby improving the accuracy of handwritten Chinese character recognition.

全部详细技术资料下载

【技术实现步骤摘要】
手写汉字的识别方法、装置、设备和存储介质
本专利技术实施例涉及模式识别和人工智能
，尤其涉及一种手写汉字的识别方法、装置、设备和存储介质。
技术介绍
自从上个世纪80年代以来，手写汉字识别(HandwrittenChineseCharacterRecognition，HCCR)由于在拍照文档、支票、表单表格、证件、邮政信封、票据和手稿文书等光学字符识别(OpticalCharacterRecognition，OCR)图像识别系统以及手写汉字输入设备中的广泛应用前景，一直是模式识别的一个重要研究领域，得到了学术界的广泛研究和关注。手写汉字识别由于数据采集方式不同可以划分为脱机手写汉字识别和联机手写汉字识别两大类。联机手写汉字识别所处理的手写汉字是书写者通过物理设备(如数字笔、数字手写板或者触摸屏)在线书写获取的文字信号，书写的轨迹通过定时采样即时输入到计算机中。而脱机手写汉字识别所处理的手写汉字是通过扫描仪或摄像头等图像捕捉设备采集到的手写汉字二维图片.由于识别的对象不同，使得这两类手写识别技术所采用的方法和策略也不尽相同.前者的识别对象是一系列的按时间先后排列的采样点信息，而后者则是丢失了书写笔顺信息的二维像素信息，由于没有笔顺信息，加之由于拍照扫描设备在不同光照、分辨率、书写纸张等条件下，数字化会带来一定的噪声干扰，一般来说，脱机手写汉字识别比联机手写汉字识别更加困难。最近几年来随着深度学习的兴起及不断发展，相关的方法也被逐步应用到手写体文字识别领域，并取得了不少突破性发展。传统的手写汉字识别一般包括预处理、特征提取、特征降维、分类器设计等环节，但...

【技术保护点】
1.一种手写汉字的识别方法，其特征在于，包括：获取待识别的手写汉字图片；利用预先构建的手写汉字识别模型，得到所述手写汉字图片的汉字，所述手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。

【技术特征摘要】
1.一种手写汉字的识别方法，其特征在于，包括：获取待识别的手写汉字图片；利用预先构建的手写汉字识别模型，得到所述手写汉字图片的汉字，所述手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。2.根据权利要求1所述的方法，其特征在于，所述数据增强模型包括数据生成网络和数据判别网络，所述数据生成网络用于生成模拟数据集，所述数据判别网络用于识别所述模拟数据集中数据的真实率。3.根据权利要求2所述的方法，其特征在于，还包括：将随机噪声输入所述数据生成网络中，得到模拟数据集；将所述模拟数据集输入所述数据判别网络中，得到所述模拟数据集中各数据的真实率；将所述模拟数据集中真实率与初始数据集真实率相同的数据加入所述初始数据集中，得到数据增强之后的训练集。4.根据权利要求3所述的方法，其特征在于，所述初始数据集真实率为0.5。5.根据权利要求3所述的方法，其特征在于，构建手写汉字识别模型，包括：对所述数据增强之后的训练集进行归一化处理；将归一化处理之后的训练集输入卷积神经网络中进行训练得到手写汉字识别模型，所述卷积神经网络包括两个卷积层、线性修正单元、正则化单元、池化层和全连接层。6.一种手写汉字的识别装置，其特征在于，包括：...

【专利技术属性】
技术研发人员：张志远，王庆乐，
申请(专利权)人：北京锐安科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人