文字识别方法及装置制造方法及图纸

技术编号:17249383 阅读:17 留言:0更新日期:2018-02-11 07:46
本公开是关于一种文字识别方法及装置。该方法包括:将待识别文字图像输入文字图像生成网络,得到第一修复文字图像;其中,所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到;根据所述第一修复文字图像进行文字识别。本公开的文字识别方法及装置,能够对待识别文字图像进行修复,得到修复文字图像,并对修复文字图像中的文字信息进行识别,由此能够大大提高文字识别的准确率。

【技术实现步骤摘要】
文字识别方法及装置
本公开涉及图像识别
,尤其涉及一种文字识别方法及装置。
技术介绍
相关技术中,文字识别是指利用计算机对图像中文字进行识别、验证和记录等处理的技术。人们在生产和生活中,要处理大量的文字、报表和文本,文字识别技术能够大大减轻人们的工作。目前,对于扭曲文字图像中的文字识别准确率较低,提高扭曲文字图像中的文字识别准确率具有重要意义。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种文字识别方法及装置。根据本公开实施例的第一方面,提供一种文字识别方法,包括:将待识别文字图像输入文字图像生成网络,得到第一修复文字图像;其中,所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到;根据所述第一修复文字图像进行文字识别。在一种可能的实现方式中,所述方法还包括:对所述未扭曲文字图像进行扭曲处理,得到所述扭曲文字图像;根据所述未扭曲文字图像和所述扭曲文字图像,训练判别网络和生成网络,所述判别网络用于判别所述修复文字图像和所述未扭曲文字图像的一致性;重复训练所述生成网络和所述判别网络,在训练次数达到预设阈值或所述判别网络的判别结果表明所述修复文字图像和所述未扭曲文字图像的一致性满足预设条件时,将当前的生成网络确定为所述文字图像生成网络。在一种可能的实现方式中,根据所述未扭曲文字图像和所述扭曲文字图像,训练判别网络和生成网络,包括:将所述扭曲文字图像输入所述生成网络,得到第二修复文字图像;将所述未扭曲文字图像和所述第二修复文字图像输入所述判别网络,得到用于表示所述第二修复文字图像与所述未扭曲文字图像是否一致的判别结果;根据所述判别结果,调整所述判别网络或所述生成网络中参数的取值。在一种可能的实现方式中,所述生成网络包括通过残差方式连接的多个编码模块和多个解码模块,所述编码模块包括卷积层、线性整流函数层和最大池化层,所述解码模块包括卷积层、线性整流函数层和最大池化层。在一种可能的实现方式中,所述判别网络包括依次连接的多个编码模块、多个全连接层和阈值函数层,所述编码模块包括卷积层、线性整流函数层和最大池化层。根据本公开实施例的第二方面,提供一种文字识别装置,包括:修复模块,用于将待识别文字图像输入文字图像生成网络,得到第一修复文字图像;其中,所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到;识别模块,用于根据所述第一修复文字图像进行文字识别。在一种可能的实现方式中,所述装置还包括:处理模块,用于对所述未扭曲文字图像进行扭曲处理,得到所述扭曲文字图像;训练模块,用于根据所述未扭曲文字图像和所述扭曲文字图像,训练判别网络和生成网络,所述判别网络用于判别所述修复文字图像和所述未扭曲文字图像的一致性;确定模块,用于重复训练所述生成网络和所述判别网络,在训练次数达到预设阈值或所述判别网络的判别结果表明所述修复文字图像和所述未扭曲文字图像的一致性满足预设条件时,将当前的生成网络确定为所述文字图像生成网络。在一种可能的实现方式中,所述训练模块用于:将所述扭曲文字图像输入所述生成网络,得到第二修复文字图像;将所述未扭曲文字图像和所述第二修复文字图像输入所述判别网络,得到用于表示所述第二修复文字图像与所述未扭曲文字图像是否一致的判别结果;根据所述判别结果,调整所述判别网络或所述生成网络中参数的取值。在一种可能的实现方式中,所述生成网络包括通过残差方式连接的多个编码模块和多个解码模块,所述编码模块包括卷积层、线性整流函数层和最大池化层,所述解码模块包括卷积层、线性整流函数层和最大池化层。在一种可能的实现方式中,所述判别网络包括依次连接的多个编码模块、多个全连接层和阈值函数层,所述编码模块包括卷积层、线性整流函数层和最大池化层。根据本公开实施例的第三方面,提供一种文字识别装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述的方法。根据本公开实施例的第四方面,提供一种非易失性计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述的方法。本公开的实施例提供的技术方案可以包括以下有益效果:本公开的文字识别方法及装置,通过将待识别文字图像输入文字图像生成网络,得到第一修复文字图像,根据第一修复文字图像进行文字识别,其中,文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到,由此能够对待识别文字图像进行修复,得到修复文字图像,并对修复文字图像中的文字信息进行识别,由此能够大大提高文字识别的准确率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种文字识别方法的流程图。图2是根据一示例性实施例示出的一种文字识别方法的流程图。图3是根据一示例性实施例示出的生成网络的示意框图。图4是根据一示例性实施例示出的判别网络的示意框图。图5是根据一示例性实施例示出的一种文字识别装置的框图。图6是根据一示例性实施例示出的一种文字识别装置的一示意性的框图。图7是根据一示例性实施例示出的一种用于文字识别的装置800的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种文字识别方法的流程图。该方法用于文字识别设备,本公开对此不做限制。如图1所示,该方法包括步骤S11和步骤S12。在步骤S11中,将待识别文字图像输入文字图像生成网络,得到第一修复文字图像;其中,文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到。其中,文字图像生成网络的输入可以为待识别文字图像,输出可以为第一修复文字图像。第一修复文字图像为待识别文字图像对应的修复文字图像。第一修复文字图像与待识别文字图像具有相同的尺寸和分辨率。待识别文字图像可以为文字被扭曲的文字图像或文字未被扭曲或几乎未被扭曲的文字图像,本公开对此不做限制。在步骤S12中,根据第一修复文字图像进行文字识别。其中,第一修复文字图像中的文字可以包括中文字符、英文字符、数字字符和符号字符中的一项或多项,第一修复文字图像中的文字可以为手写体文字和印刷体文字中的一项或多项,本公开对此不做限制。需要说明的是,本领域技术人员能够理解,相关技术中有多种方式能够实现根据第一修复文字图像进行文字识别,例如模板匹配法、结构分析法或特征提取法等,本公开对此不做限制。本公开的文字识别方法,能够对待识别文字图像进行修复,得到修复文字图像,并对修复文字图像中的文字信息进行识别,由此能够大大提高文字识别的准确率。图2是根据一示例性实施例示出的一种文字识别方法的流程图。如图2所示,该方法包括步骤S21至步骤S25。在步骤S21中,对未扭曲文字图像进行扭曲处理,得到扭曲文字图像。其中,未扭曲文字图像可以指文字未被扭曲或几乎未被扭曲的文字图像,扭曲文字图像可以指文字被扭曲的文字图像。本文档来自技高网...
文字识别方法及装置

【技术保护点】
一种文字识别方法,其特征在于,包括:将待识别文字图像输入文字图像生成网络,得到第一修复文字图像;其中,所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到;根据所述第一修复文字图像进行文字识别。

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:将待识别文字图像输入文字图像生成网络,得到第一修复文字图像;其中,所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到;根据所述第一修复文字图像进行文字识别。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述未扭曲文字图像进行扭曲处理,得到所述扭曲文字图像;根据所述未扭曲文字图像和所述扭曲文字图像,训练判别网络和生成网络,所述判别网络用于判别所述修复文字图像和所述未扭曲文字图像的一致性;重复训练所述生成网络和所述判别网络,在训练次数达到预设阈值或所述判别网络的判别结果表明所述修复文字图像和所述未扭曲文字图像的一致性满足预设条件时,将当前的生成网络确定为所述文字图像生成网络。3.根据权利要求2所述的方法,其特征在于,根据所述未扭曲文字图像和所述扭曲文字图像,训练判别网络和生成网络,包括:将所述扭曲文字图像输入所述生成网络,得到第二修复文字图像;将所述未扭曲文字图像和所述第二修复文字图像输入所述判别网络,得到用于表示所述第二修复文字图像与所述未扭曲文字图像是否一致的判别结果;根据所述判别结果,调整所述判别网络或所述生成网络中参数的取值。4.根据权利要求1所述的方法,其特征在于,所述生成网络包括通过残差方式连接的多个编码模块和多个解码模块,所述编码模块包括卷积层、线性整流函数层和最大池化层,所述解码模块包括卷积层、线性整流函数层和最大池化层。5.根据权利要求2所述的方法,其特征在于,所述判别网络包括依次连接的多个编码模块、多个全连接层和阈值函数层,所述编码模块包括卷积层、线性整流函数层和最大池化层。6.一种文字识别装置,其特征在于,包括:修复模块,用于将待识别文字图像输入文字图像生成网络,得到第一修复文字图像;其中,所述文字图像生成网络通过未扭曲文字图...

【专利技术属性】
技术研发人员:张水发
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1