手写汉字的识别方法、装置、设备和存储介质制造方法及图纸

技术编号:20945023 阅读:27 留言:0更新日期:2019-04-24 02:36
本发明专利技术实施例公开了一种手写汉字的识别方法、装置、设备和存储介质,其中该方法包括:获取待识别的手写汉字图片;利用预先构建的手写汉字识别模型,得到手写汉字图片的汉字,手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。本发明专利技术实施例通过数据增强模型对初始数据集进行数据增强得到数据增强之后的训练集,采用该数据增强之后的训练集训练好的手写汉字识别模型的准确率得到极大的提高,进而提高了手写汉字识别的准确率。

Recognition Method, Device, Equipment and Storage Media of Handwritten Chinese Characters

The embodiment of the present invention discloses a recognition method, device, device and storage medium for handwritten Chinese characters. The method includes acquiring handwritten Chinese character pictures to be recognized, obtaining Chinese characters of handwritten Chinese character pictures by using pre-constructed handwritten Chinese character recognition model, and training set of handwritten Chinese character recognition model is a training set after data enhancement model. The embodiment of the present invention obtains the training set after data enhancement through data enhancement model to the initial data set. The accuracy of the handwritten Chinese character recognition model trained by the training set after data enhancement is greatly improved, thereby improving the accuracy of handwritten Chinese character recognition.

【技术实现步骤摘要】
手写汉字的识别方法、装置、设备和存储介质
本专利技术实施例涉及模式识别和人工智能
,尤其涉及一种手写汉字的识别方法、装置、设备和存储介质。
技术介绍
自从上个世纪80年代以来,手写汉字识别(HandwrittenChineseCharacterRecognition,HCCR)由于在拍照文档、支票、表单表格、证件、邮政信封、票据和手稿文书等光学字符识别(OpticalCharacterRecognition,OCR)图像识别系统以及手写汉字输入设备中的广泛应用前景,一直是模式识别的一个重要研究领域,得到了学术界的广泛研究和关注。手写汉字识别由于数据采集方式不同可以划分为脱机手写汉字识别和联机手写汉字识别两大类。联机手写汉字识别所处理的手写汉字是书写者通过物理设备(如数字笔、数字手写板或者触摸屏)在线书写获取的文字信号,书写的轨迹通过定时采样即时输入到计算机中。而脱机手写汉字识别所处理的手写汉字是通过扫描仪或摄像头等图像捕捉设备采集到的手写汉字二维图片.由于识别的对象不同,使得这两类手写识别技术所采用的方法和策略也不尽相同.前者的识别对象是一系列的按时间先后排列的采样点信息,而后者则是丢失了书写笔顺信息的二维像素信息,由于没有笔顺信息,加之由于拍照扫描设备在不同光照、分辨率、书写纸张等条件下,数字化会带来一定的噪声干扰,一般来说,脱机手写汉字识别比联机手写汉字识别更加困难。最近几年来随着深度学习的兴起及不断发展,相关的方法也被逐步应用到手写体文字识别领域,并取得了不少突破性发展。传统的手写汉字识别一般包括预处理、特征提取、特征降维、分类器设计等环节,但手写汉字识别的准确率还不能满足人们的需求,有待进一步的提升。
技术实现思路
本专利技术实施例提供了一种手写汉字的识别方法、装置、设备和存储介质,可以提高手写汉字识别的准确率。第一方面,本专利技术实施例提供了一种手写汉字的识别方法,包括:获取待识别的手写汉字图片;利用预先构建的手写汉字识别模型,得到所述手写汉字图片的汉字,所述手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。第二方面,本专利技术实施例还提供了一种手写汉字的识别装置,该识别装置包括:图片获取模块,用于获取待识别的手写汉字图片;识别模块,用于利用预先构建的手写汉字识别模型,得到所述手写汉字图片的汉字,所述手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。第三方面,本专利技术实施例还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的手写汉字的识别方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的手写汉字的识别方法。本专利技术实施例通过采用数据增强之后的训练集训练预先构建的手写汉字识别模型,获取待识别的手写汉字图片,并利用预先构建的手写汉字识别模型,得到手写汉字图片的汉字。本专利技术实施例通过数据增强模型对初始数据集进行数据增强得到数据增强之后的训练集,采用该数据增强之后的训练集训练好的手写汉字识别模型的准确率得到极大的提高,进而提高了手写汉字识别的准确率。附图说明图1为本专利技术实施例一中的手写汉字的识别方法的流程图;图2为本专利技术实施例一中的手写汉字的识别方法的示意图;图3为本专利技术实施例一中的数据增强之后的训练集的生成示意图;图4为本专利技术实施例二中的手写汉字的识别方法的流程图;图5为本专利技术实施例三中的手写汉字的识别装置的结构示意图;图6为本专利技术实施例四中的设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一中的手写汉字的识别方法的流程图,本实施例可适用于实现手写汉字的识别的情况,该方法可以由手写汉字的识别装置执行,该装置可以采用软件和/或硬件的方式实现,例如,该装置可配置于设备中。本实施例中的手写汉字识别是基于深度学习模型进行识别的,参见图2。图2为本专利技术实施例一中的手写汉字的识别方法的示意图,图中的手写汉字识别模型是基于深度学习模型构建的,图中数据增强之后的训练集输入手写汉字识别模型中进行训练,得到训练好的手写汉字识别模型;图中将一个手写汉字图片“安”输入训练好的手写汉字识别模型中,得到该手写汉字图片的识别结果为“安”。如图1所示,该方法具体可以包括:S110、获取待识别的手写汉字图片。其中,手写汉字图片可以为通过扫描仪或摄像头等图像捕捉设备采集到的手写汉字的二维图片。本实施例中对手写汉字图片的来源不作限定,例如手写汉字图片可以为当前用户实时进行书写并采用图像捕捉设备采集得到的,也可以为从互联网上获取到的。S120、利用预先构建的手写汉字识别模型,得到手写汉字图片的汉字,手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。其中,数据增强模型为基于生成式对抗网络(GenerativeAdversarialNetworks,GAN)的深度学习模型,生成式对抗网络是复杂分布无监督学习的方法,基本思想是从训练库里获取很多训练样本,从而学习这些训练案例生成的概率分布。生成式对抗网络可以应用在图片生成中,例如假设给定1000万张图片之后,生成式对抗网络可以自动学习到其内部分布,能够解释给定的训练图片,并同时生成新的图片。本实施例中,数据增强模型包括数据生成网络和数据判别网络,数据生成网络用于生成模拟数据集,数据判别网络用于识别模拟数据集中数据的真实率。在训练数据增强模型的过程中,数据生成网络的目标是尽量生成真实的图片去欺骗数据判别网络,而数据判别网络的目标就是尽量把数据生成网络生成的图片和真实的图片区分开来。这样,数据生成网络和数据判别网络构成了一个动态的“博弈过程”,最后博弈的结果是,在最理想的状态下数据生成网络可以生成足以“以假乱真”的模拟图片,数据判别网络难以判定数据生成网络生成的模拟图片究竟是不是真实的。其中,数据生成网络包括全连接层、激活函数单元、丢弃正则化(DropoutRegularization)单元、批标准化(BatchNormalization)单元、损失函数和优化器。激活函数包括带泄露线性整流函数(LeakyReLU)和Tanh激活函数等。数据判别网络的构成与数据生成网络的构成类似,区别为在最后添加了一个输出层,输出层为1个结点,输出的是结果为1即当前输入的图片为真实的图片的概率。进一步的,获取数据增强之后的训练集的过程,包括:将随机噪声输入数据生成网络中,得到模拟数据集;将模拟数据集输入数据判别网络中,得到模拟数据集中各数据的真实率;将模拟数据集中真实率与初始数据集真实率相同的数据加入初始数据集中,得到数据增强之后的训练集。其中,初始数据集为由模式识别国家重点实验室共享的数据集HWDB1.1,这个数据集包括200个种类的汉字,每个类别包括300个汉字,共60000个样本。初始数据集中的数据为真实的图片,真实的图片输入数据判别网络之后得到的真实率为0.5,即初始数本文档来自技高网
...

【技术保护点】
1.一种手写汉字的识别方法,其特征在于,包括:获取待识别的手写汉字图片;利用预先构建的手写汉字识别模型,得到所述手写汉字图片的汉字,所述手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。

【技术特征摘要】
1.一种手写汉字的识别方法,其特征在于,包括:获取待识别的手写汉字图片;利用预先构建的手写汉字识别模型,得到所述手写汉字图片的汉字,所述手写汉字识别模型的训练集为通过数据增强模型进行数据增强之后的训练集。2.根据权利要求1所述的方法,其特征在于,所述数据增强模型包括数据生成网络和数据判别网络,所述数据生成网络用于生成模拟数据集,所述数据判别网络用于识别所述模拟数据集中数据的真实率。3.根据权利要求2所述的方法,其特征在于,还包括:将随机噪声输入所述数据生成网络中,得到模拟数据集;将所述模拟数据集输入所述数据判别网络中,得到所述模拟数据集中各数据的真实率;将所述模拟数据集中真实率与初始数据集真实率相同的数据加入所述初始数据集中,得到数据增强之后的训练集。4.根据权利要求3所述的方法,其特征在于,所述初始数据集真实率为0.5。5.根据权利要求3所述的方法,其特征在于,构建手写汉字识别模型,包括:对所述数据增强之后的训练集进行归一化处理;将归一化处理之后的训练集输入卷积神经网络中进行训练得到手写汉字识别模型,所述卷积神经网络包括两个卷积层、线性修正单元、正则化单元、池化层和全连接层。6.一种手写汉字的识别装置,其特征在于,包括:...

【专利技术属性】
技术研发人员:张志远王庆乐
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1