文字识别方法及装置制造方法及图纸

技术编号：17249383 阅读：17 留言：0更新日期：2018-02-11 07:46

本公开是关于一种文字识别方法及装置。该方法包括：将待识别文字图像输入文字图像生成网络，得到第一修复文字图像；其中，所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到；根据所述第一修复文字图像进行文字识别。本公开的文字识别方法及装置，能够对待识别文字图像进行修复，得到修复文字图像，并对修复文字图像中的文字信息进行识别，由此能够大大提高文字识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别方法及装置
本公开涉及图像识别
，尤其涉及一种文字识别方法及装置。
技术介绍
相关技术中，文字识别是指利用计算机对图像中文字进行识别、验证和记录等处理的技术。人们在生产和生活中，要处理大量的文字、报表和文本，文字识别技术能够大大减轻人们的工作。目前，对于扭曲文字图像中的文字识别准确率较低，提高扭曲文字图像中的文字识别准确率具有重要意义。
技术实现思路
为克服相关技术中存在的问题，本公开提供一种文字识别方法及装置。根据本公开实施例的第一方面，提供一种文字识别方法，包括：将待识别文字图像输入文字图像生成网络，得到第一修复文字图像；其中，所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到；根据所述第一修复文字图像进行文字识别。在一种可能的实现方式中，所述方法还包括：对所述未扭曲文字图像进行扭曲处理，得到所述扭曲文字图像；根据所述未扭曲文字图像和所述扭曲文字图像，训练判别网络和生成网络，所述判别网络用于判别所述修复文字图像和所述未扭曲文字图像的一致性；重复训练所述生成网络和所述判别网络，在训练次数达到预设阈值或所述判别网络的判别结果表明所述修复文字图像和所述未扭曲文字图像的一致性满足预设条件时，将当前的生成网络确定为所述文字图像生成网络。在一种可能的实现方式中，根据所述未扭曲文字图像和所述扭曲文字图像，训练判别网络和生成网络，包括：将所述扭曲文字图像输入所述生成网络，得到第二修复文字图像；将所述未扭曲文字图像和所述第二修复文字图像输入所述判别网络，得到用于表示所述第二修复文字图像与所述未扭曲文字图像是否一致的判别结果；根据所述判别结果，调整所述...
文字识别方法及装置

【技术保护点】
一种文字识别方法，其特征在于，包括：将待识别文字图像输入文字图像生成网络，得到第一修复文字图像；其中，所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到；根据所述第一修复文字图像进行文字识别。

【技术特征摘要】
1.一种文字识别方法，其特征在于，包括：将待识别文字图像输入文字图像生成网络，得到第一修复文字图像；其中，所述文字图像生成网络通过未扭曲文字图像和扭曲文字图像训练得到；根据所述第一修复文字图像进行文字识别。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：对所述未扭曲文字图像进行扭曲处理，得到所述扭曲文字图像；根据所述未扭曲文字图像和所述扭曲文字图像，训练判别网络和生成网络，所述判别网络用于判别所述修复文字图像和所述未扭曲文字图像的一致性；重复训练所述生成网络和所述判别网络，在训练次数达到预设阈值或所述判别网络的判别结果表明所述修复文字图像和所述未扭曲文字图像的一致性满足预设条件时，将当前的生成网络确定为所述文字图像生成网络。3.根据权利要求2所述的方法，其特征在于，根据所述未扭曲文字图像和所述扭曲文字图像，训练判别网络和生成网络，包括：将所述扭曲文字图像输入所述生成网络，得到第二修复文字图像；将所述未扭曲文字图像和所述第二修复文字图像输入所述判别网络，得到用于表示所述第二修复文字图像与所述未扭曲文字图像是否一致的判别结果；根据所述判别结果，调整所述判别网络或所述生成网络中参数的取值。4.根据权利要求1所述的方法，其特征在于，所述生成网络包括通过残差方式连接的多个编码模块和多个解码模块，所述编码模块包括卷积层、线性整流函数层和最大池化层，所述解码模块包括卷积层、线性整流函数层和最大池化层。5.根据权利要求2所述的方法，其特征在于，所述判别网络包括依次连接的多个编码模块、多个全连接层和阈值函数层，所述编码模块包括卷积层、线性整流函数层和最大池化层。6.一种文字识别装置，其特征在于，包括：修复模块，用于将待识别文字图像输入文字图像生成网络，得到第一修复文字图像；其中，所述文字图像生成网络通过未扭曲文字图...

【专利技术属性】
技术研发人员：张水发，
申请(专利权)人：北京小米移动软件有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人