字符识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：19561997 阅读：23 留言：0更新日期：2018-11-25 00:32

本公开涉及一种字符识别方法、装置、存储介质及电子设备，所述方法包括：首先，可以确定包括待识别字符的目标图像对应的图像类别；接着，通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理；然后，从校正处理后的目标图像中提取至少一个文本行图像；最后，通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。由于不同的图像类别对应不同的校正处理方式，这样，可以将不同图像类别的图像按照对应的校正处理方式进行校正处理，并对校正处理后的图像进行字符识别，本公开能够满足对文本图像和场景图像进行字符识别，从而避免了现有技术中字符识别算法的通用性较差的问题。

Character Recognition Method, Device, Storage Media and Electronic Equipment

The present disclosure relates to a character recognition method, device, storage medium and electronic device. The method includes: first, the image category corresponding to the target image including the character to be recognized can be determined; then, the target image can be corrected by the correction processing method corresponding to the image category; and then, the target image can be corrected by the correction processing method corresponding to the image category; At least one text line image is extracted from the corrected target image; finally, the character to be recognized in at least one text line image is recognized by a preset character recognition model. Since different image categories correspond to different correction processing methods, the images of different image categories can be corrected according to corresponding correction processing methods, and character recognition of the corrected images can be carried out. The present disclosure can satisfy character recognition of text images and scene images, thereby avoiding. The problem of poor generality of character recognition algorithm in the existing technology is pointed out.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】字符识别方法、装置、存储介质及电子设备
本公开涉及图像处理领域，具体地，涉及一种字符识别方法、装置、存储介质及电子设备。
技术介绍
随着计算机技术和多媒体的快速发展，越来越多的信息以图像形式传播，并且图像中的信息可以是描述性的文本，目前，文本图像可以划分为文档图像和场景图像，其中，文档图像通常包括的字符数量较多，字符分布规律，图像背景单一；与文档图像不同，场景图像通常包括的字符数量较少，字符类型丰富，字符分布随意，图像背景复杂。考虑到文档图像和场景图像具备上述不同的图像特征，并且目前的字符识别算法是针对特定的文本图像，使得文档图像和场景图像需要通过不同的字符识别算法分别进行字符识别，从而造成了字符识别算法的通用性较差。
技术实现思路
为了解决上述问题，本公开提供一种字符识别方法、装置、存储介质及电子设备。根据本公开的第一方面，提供一种字符识别方法，所述方法包括：确定包括待识别字符的目标图像对应的图像类别；其中，不同的图像类别对应不同的校正处理方式；通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理；从校正处理后的目标图像中提取至少一个文本行图像；通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。根据本公开的第二方面，提供一种字符识别装置，所述装置包括：确定模块，用于确定包括待识别字符的目标图像对应的图像类别；其中，不同的图像类别对应不同的校正处理方式；校正模块，用于通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理；提取模块，用于从校正处理后的目标图像中提取至少一个文本行图像；识别模块，用于通过预设字符识别模型识别至少一个所...

【技术保护点】
1.一种字符识别方法，其特征在于，所述方法包括：确定包括待识别字符的目标图像对应的图像类别；其中，不同的图像类别对应不同的校正处理方式；通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理；从校正处理后的目标图像中提取至少一个文本行图像；通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。

【技术特征摘要】
【国外来华专利技术】1.一种字符识别方法，其特征在于，所述方法包括：确定包括待识别字符的目标图像对应的图像类别；其中，不同的图像类别对应不同的校正处理方式；通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理；从校正处理后的目标图像中提取至少一个文本行图像；通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。2.根据权利要求1所述的方法，其特征在于，所述图像类别包括文档图像和场景图像。3.根据权利要求1或2所述的方法，其特征在于，所述确定包括待识别字符的目标图像对应的图像类别包括：获取已确定图像类别的图像样本；根据所述图像样本确定所述目标图像对应的图像类别。4.根据权利要求2所述的方法，其特征在于，在所述图像类别为文档图像时，所述校正处理方式包括方向校正处理和/或畸变校正处理；在所述校正处理方式包括所述方向校正处理和所述畸变校正处理时，所述通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理包括：获取所述文档图像中的所述待识别字符与水平轴之间的第一倾斜角度；在所述第一倾斜角度大于或者等于预设角度时，对所述文档图像进行方向校正处理；确定所述文档图像中的所述待识别字符是否存在畸变；在所述文档图像中的所述待识别字符存在畸变时，对所述文档图像进行畸变校正处理。5.根据权利要求2所述的方法，其特征在于，在所述图像类别为场景图像时，所述校正处理方式包括方向校正处理；所述通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理包括：对所述场景图像进行文字区域检测得到至少一个文字区域；依次获取至少一个所述文字区域中的所述待识别字符与水平轴之间的第二倾斜角度；在至少一个所述文字区域中的所述第二倾斜角度大于或者等于预设角度时，对至少一个所述文字区域进行方向校正处理。6.根据权利要求1或2所述的方法，其特征在于，在所述通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符前，还包括：获取至少一个所述文本行图像的位置信息；所述通过预设字符识别模型识别至少一个所述文本行中的所述待识别字符包括：通过所述预设字符识别模型和所述位置信息识别至少一个所述文本行图像中的所述待识别字符。7.根据权利要求6所述的方法，其特征在于，所述预设字符识别模型包括深度学习层、循环网络层以及编码层，所述通过所述预设字符识别模型和所述位置信息识别至少一个所述文本行图像中的所述待识别字符包括：根据所述深度学习层对至少一个所述文本行图像进行字符特征提取；将提取的字符特征输入至所述循环网络层得到至少一个所述文本行图像对应的特征向量；将所述特征向量输入到所述编码层得到至少一个所述文本行图像的编码结果，并根据所述编码结果得到至少一个所述文本行图像的文本信息；根据所述位置信息对至少一个所述文本行图像的文本信息进行有序排列得到所述目标图像的目标识别结果。8.一种字符识别装置，其特征在于，所述装置包括：确定模块，用于确定包括待识别字符的目标图像对应的图像类别；其中，不同的图像类别对应不同的校正处理方式；校正模块，用于通过所述图...

【专利技术属性】
技术研发人员：梁昊，南一冰，廉士国，
申请(专利权)人：深圳前海达闼云端智能科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人