字符识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:19561997 阅读:23 留言:0更新日期:2018-11-25 00:32
本公开涉及一种字符识别方法、装置、存储介质及电子设备,所述方法包括:首先,可以确定包括待识别字符的目标图像对应的图像类别;接着,通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;然后,从校正处理后的目标图像中提取至少一个文本行图像;最后,通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。由于不同的图像类别对应不同的校正处理方式,这样,可以将不同图像类别的图像按照对应的校正处理方式进行校正处理,并对校正处理后的图像进行字符识别,本公开能够满足对文本图像和场景图像进行字符识别,从而避免了现有技术中字符识别算法的通用性较差的问题。

Character Recognition Method, Device, Storage Media and Electronic Equipment

The present disclosure relates to a character recognition method, device, storage medium and electronic device. The method includes: first, the image category corresponding to the target image including the character to be recognized can be determined; then, the target image can be corrected by the correction processing method corresponding to the image category; and then, the target image can be corrected by the correction processing method corresponding to the image category; At least one text line image is extracted from the corrected target image; finally, the character to be recognized in at least one text line image is recognized by a preset character recognition model. Since different image categories correspond to different correction processing methods, the images of different image categories can be corrected according to corresponding correction processing methods, and character recognition of the corrected images can be carried out. The present disclosure can satisfy character recognition of text images and scene images, thereby avoiding. The problem of poor generality of character recognition algorithm in the existing technology is pointed out.

【技术实现步骤摘要】
【国外来华专利技术】字符识别方法、装置、存储介质及电子设备
本公开涉及图像处理领域,具体地,涉及一种字符识别方法、装置、存储介质及电子设备。
技术介绍
随着计算机技术和多媒体的快速发展,越来越多的信息以图像形式传播,并且图像中的信息可以是描述性的文本,目前,文本图像可以划分为文档图像和场景图像,其中,文档图像通常包括的字符数量较多,字符分布规律,图像背景单一;与文档图像不同,场景图像通常包括的字符数量较少,字符类型丰富,字符分布随意,图像背景复杂。考虑到文档图像和场景图像具备上述不同的图像特征,并且目前的字符识别算法是针对特定的文本图像,使得文档图像和场景图像需要通过不同的字符识别算法分别进行字符识别,从而造成了字符识别算法的通用性较差。
技术实现思路
为了解决上述问题,本公开提供一种字符识别方法、装置、存储介质及电子设备。根据本公开的第一方面,提供一种字符识别方法,所述方法包括:确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;从校正处理后的目标图像中提取至少一个文本行图像;通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。根据本公开的第二方面,提供一种字符识别装置,所述装置包括:确定模块,用于确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;校正模块,用于通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;提取模块,用于从校正处理后的目标图像中提取至少一个文本行图像;识别模块,用于通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。根据本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面所述方法的步骤。根据本公开的第四方面,提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一方面所述方法的步骤。在上述技术方案中,首先,可以确定包括待识别字符的目标图像对应的图像类别;接着,通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;然后,从校正处理后的目标图像中提取至少一个文本行图像;最后,通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。由于不同的图像类别对应不同的校正处理方式,这样,可以将不同图像类别的图像按照对应的校正处理方式进行校正处理,并对校正处理后的图像进行字符识别,本公开能够满足对文本图像和场景图像进行字符识别,从而避免了现有技术中字符识别算法的通用性较差的问题。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是根据一示例性实施例示出的一种字符识别方法的流程示意图;图2是根据一示例性实施例示出的第一种字符识别装置的框图;图3是根据一示例性实施例示出的第二种字符识别装置的框图;图4是根据一示例性实施例示出的第三种字符识别装置的框图;图5是根据一示例性实施例示出的第四种字符识别装置的框图;图6是根据一示例性实施例示出的第五种字符识别装置的框图;图7是根据一示例性实施例示出的第六种字符识别装置的框图;图8是根据一示例性实施例示出的一种电子设备的框图。具体实施方式首先,对本公开的应用场景进行说明,本公开可以应用于字符识别的场景,在该场景下,字符识别算法主要包括字符检测和字符识别两个步骤。目前,字符检测可分为单个字符检测和文本行提取两种方式,其中,单个字符检测即为直接对目标图像中的单个字符进行检测,文本行提取主要是提取出成行分布的字符区域。针对上述两种方式,单个字符检测极易发生漏检的情况,即目标图像中的一个或多个字符未被检测到,从而影响字符识别的准确率;文本行提取是将成行分布的字符当作整体,不易发生漏检,但检测出文本行后需要对文本行中的各个字符进行分割,从而对分割的准确率有较高的要求。对于上述不同的字符检测方式,字符识别方式也不同:在采用单个字符检测时,可以直接对提取的单个字符分别进行识别,并根据单个字符的字符位置信息对全部单个字符进行排列组合,从而生成最终识别结果;在采用文本行提取时,需要先对每个文本行中的字符进行分割,再对分割后的字符进行识别,并根据每个文本行的位置信息对每个文本行的字符识别结果进行排列组合,以生成最终识别结果。由于目前文本图像可以划分为文档图像和场景图像,其中,文档图像通常包括的字符数量较多,字符分布规律,图像背景单一;与文档图像不同,场景图像通常包括的字符数量较少,字符类型丰富,字符分布随意,图像背景复杂。对于文档图像和场景图像,由于具备上述不同的图像特征,使得当前的字符识别算法无法同时对文档图像和场景图像进行字符识别,而需要通过不同的字符识别算法分别进行字符识别,从而造成了字符识别算法的通用性较差。为了解决上述问题,本公开提出了一种字符识别方法、装置、存储介质及电子设备,首先,可以确定目标图像的图像类别,接着,根据图像类别确定该目标图像对应的校正处理方式,然后,根据该目标图像对应的校正处理方式对该目标图像进行校正处理,其次,可以从校正处理后的目标图像中提取至少一个文本行图像,最后,根据字符识别模型识别至少一个文本行图像中的待识别字符。由于不同的图像类别对应不同的校正处理方式,这样,可以将不同图像类别的图像按照对应的校正处理方式进行校正处理,并对校正处理后的图像进行字符识别,本公开能够满足对文本图像和场景图像进行字符识别,从而避免了现有技术中字符识别算法的通用性较差的问题。下面结合具体的实施例对本公开进行详细说明。图1是根据一示例性实施例示出的一种字符识别方法的流程示意图。如图1所示,所述方法包括:S101、确定包括待识别字符的目标图像对应的图像类别。在本步骤中,该图像类别可以包括文档图像和场景图像,其中,文档图像通常包括的字符数量较多,字符分布规律,图像背景单一;与文档图像不同,场景图像通常包括的字符数量较少,字符类型丰富,字符分布随意,图像背景复杂,考虑到文档图像和场景图像之间具备上述不同的图像特征,因此,不同图像类别对应不同的校正处理方式,上述图像类别只是举例说明,本公开对此不作限定。在一种可能的实现方式中,可以获取已确定图像类别的图像样本,并根据该图像样本确定该目标图像对应的图像类别,进一步地,该图像样本可以包括文档图像样本和场景图像样本,并且该文档图像样本的数量和该场景图像样本的数量之间的差值小于或者等于预设阈值,这样,可以基于深度学习的方法,通过文档图像样本和场景图像样本训练预设分类器得到目标分类器,从而在该目标图像输入至该目标分类器中时,该目标分类器可以输出该目标图像对应的图像类别。S102、通过该图像类别对应的校正处理方式对该目标图像进行校正处理。在该图像类别为文档图像时,由于文档图像中待识别字符通常处于密集分布,这样,若文档图像中的待识别字符存在倾斜和/或畸变时,则可能会影响到字符识别的准确率,为了避免该问题,本公开可以对该文档图像进行校正处理,该校正处理方式包括方向校正处理和/或畸变校正处理,此时,本文档来自技高网...

【技术保护点】
1.一种字符识别方法,其特征在于,所述方法包括:确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;从校正处理后的目标图像中提取至少一个文本行图像;通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。

【技术特征摘要】
【国外来华专利技术】1.一种字符识别方法,其特征在于,所述方法包括:确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;从校正处理后的目标图像中提取至少一个文本行图像;通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。2.根据权利要求1所述的方法,其特征在于,所述图像类别包括文档图像和场景图像。3.根据权利要求1或2所述的方法,其特征在于,所述确定包括待识别字符的目标图像对应的图像类别包括:获取已确定图像类别的图像样本;根据所述图像样本确定所述目标图像对应的图像类别。4.根据权利要求2所述的方法,其特征在于,在所述图像类别为文档图像时,所述校正处理方式包括方向校正处理和/或畸变校正处理;在所述校正处理方式包括所述方向校正处理和所述畸变校正处理时,所述通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理包括:获取所述文档图像中的所述待识别字符与水平轴之间的第一倾斜角度;在所述第一倾斜角度大于或者等于预设角度时,对所述文档图像进行方向校正处理;确定所述文档图像中的所述待识别字符是否存在畸变;在所述文档图像中的所述待识别字符存在畸变时,对所述文档图像进行畸变校正处理。5.根据权利要求2所述的方法,其特征在于,在所述图像类别为场景图像时,所述校正处理方式包括方向校正处理;所述通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理包括:对所述场景图像进行文字区域检测得到至少一个文字区域;依次获取至少一个所述文字区域中的所述待识别字符与水平轴之间的第二倾斜角度;在至少一个所述文字区域中的所述第二倾斜角度大于或者等于预设角度时,对至少一个所述文字区域进行方向校正处理。6.根据权利要求1或2所述的方法,其特征在于,在所述通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符前,还包括:获取至少一个所述文本行图像的位置信息;所述通过预设字符识别模型识别至少一个所述文本行中的所述待识别字符包括:通过所述预设字符识别模型和所述位置信息识别至少一个所述文本行图像中的所述待识别字符。7.根据权利要求6所述的方法,其特征在于,所述预设字符识别模型包括深度学习层、循环网络层以及编码层,所述通过所述预设字符识别模型和所述位置信息识别至少一个所述文本行图像中的所述待识别字符包括:根据所述深度学习层对至少一个所述文本行图像进行字符特征提取;将提取的字符特征输入至所述循环网络层得到至少一个所述文本行图像对应的特征向量;将所述特征向量输入到所述编码层得到至少一个所述文本行图像的编码结果,并根据所述编码结果得到至少一个所述文本行图像的文本信息;根据所述位置信息对至少一个所述文本行图像的文本信息进行有序排列得到所述目标图像的目标识别结果。8.一种字符识别装置,其特征在于,所述装置包括:确定模块,用于确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;校正模块,用于通过所述图...

【专利技术属性】
技术研发人员:梁昊南一冰廉士国
申请(专利权)人:深圳前海达闼云端智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1