The present disclosure relates to a character recognition method, device, storage medium and electronic device. The method includes: first, the image category corresponding to the target image including the character to be recognized can be determined; then, the target image can be corrected by the correction processing method corresponding to the image category; and then, the target image can be corrected by the correction processing method corresponding to the image category; At least one text line image is extracted from the corrected target image; finally, the character to be recognized in at least one text line image is recognized by a preset character recognition model. Since different image categories correspond to different correction processing methods, the images of different image categories can be corrected according to corresponding correction processing methods, and character recognition of the corrected images can be carried out. The present disclosure can satisfy character recognition of text images and scene images, thereby avoiding. The problem of poor generality of character recognition algorithm in the existing technology is pointed out.
【技术实现步骤摘要】
【国外来华专利技术】字符识别方法、装置、存储介质及电子设备
本公开涉及图像处理领域,具体地,涉及一种字符识别方法、装置、存储介质及电子设备。
技术介绍
随着计算机技术和多媒体的快速发展,越来越多的信息以图像形式传播,并且图像中的信息可以是描述性的文本,目前,文本图像可以划分为文档图像和场景图像,其中,文档图像通常包括的字符数量较多,字符分布规律,图像背景单一;与文档图像不同,场景图像通常包括的字符数量较少,字符类型丰富,字符分布随意,图像背景复杂。考虑到文档图像和场景图像具备上述不同的图像特征,并且目前的字符识别算法是针对特定的文本图像,使得文档图像和场景图像需要通过不同的字符识别算法分别进行字符识别,从而造成了字符识别算法的通用性较差。
技术实现思路
为了解决上述问题,本公开提供一种字符识别方法、装置、存储介质及电子设备。根据本公开的第一方面,提供一种字符识别方法,所述方法包括:确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;从校正处理后的目标图像中提取至少一个文本行图像;通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。根据本公开的第二方面,提供一种字符识别装置,所述装置包括:确定模块,用于确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;校正模块,用于通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;提取模块,用于从校正处理后的目标图像中提取至少一个文本行图像;识别模块,用于通过预设字符识别模型识别至少一个所 ...
【技术保护点】
1.一种字符识别方法,其特征在于,所述方法包括:确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;从校正处理后的目标图像中提取至少一个文本行图像;通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。
【技术特征摘要】
【国外来华专利技术】1.一种字符识别方法,其特征在于,所述方法包括:确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理;从校正处理后的目标图像中提取至少一个文本行图像;通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符。2.根据权利要求1所述的方法,其特征在于,所述图像类别包括文档图像和场景图像。3.根据权利要求1或2所述的方法,其特征在于,所述确定包括待识别字符的目标图像对应的图像类别包括:获取已确定图像类别的图像样本;根据所述图像样本确定所述目标图像对应的图像类别。4.根据权利要求2所述的方法,其特征在于,在所述图像类别为文档图像时,所述校正处理方式包括方向校正处理和/或畸变校正处理;在所述校正处理方式包括所述方向校正处理和所述畸变校正处理时,所述通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理包括:获取所述文档图像中的所述待识别字符与水平轴之间的第一倾斜角度;在所述第一倾斜角度大于或者等于预设角度时,对所述文档图像进行方向校正处理;确定所述文档图像中的所述待识别字符是否存在畸变;在所述文档图像中的所述待识别字符存在畸变时,对所述文档图像进行畸变校正处理。5.根据权利要求2所述的方法,其特征在于,在所述图像类别为场景图像时,所述校正处理方式包括方向校正处理;所述通过所述图像类别对应的校正处理方式对所述目标图像进行校正处理包括:对所述场景图像进行文字区域检测得到至少一个文字区域;依次获取至少一个所述文字区域中的所述待识别字符与水平轴之间的第二倾斜角度;在至少一个所述文字区域中的所述第二倾斜角度大于或者等于预设角度时,对至少一个所述文字区域进行方向校正处理。6.根据权利要求1或2所述的方法,其特征在于,在所述通过预设字符识别模型识别至少一个所述文本行图像中的所述待识别字符前,还包括:获取至少一个所述文本行图像的位置信息;所述通过预设字符识别模型识别至少一个所述文本行中的所述待识别字符包括:通过所述预设字符识别模型和所述位置信息识别至少一个所述文本行图像中的所述待识别字符。7.根据权利要求6所述的方法,其特征在于,所述预设字符识别模型包括深度学习层、循环网络层以及编码层,所述通过所述预设字符识别模型和所述位置信息识别至少一个所述文本行图像中的所述待识别字符包括:根据所述深度学习层对至少一个所述文本行图像进行字符特征提取;将提取的字符特征输入至所述循环网络层得到至少一个所述文本行图像对应的特征向量;将所述特征向量输入到所述编码层得到至少一个所述文本行图像的编码结果,并根据所述编码结果得到至少一个所述文本行图像的文本信息;根据所述位置信息对至少一个所述文本行图像的文本信息进行有序排列得到所述目标图像的目标识别结果。8.一种字符识别装置,其特征在于,所述装置包括:确定模块,用于确定包括待识别字符的目标图像对应的图像类别;其中,不同的图像类别对应不同的校正处理方式;校正模块,用于通过所述图...
【专利技术属性】
技术研发人员:梁昊,南一冰,廉士国,
申请(专利权)人:深圳前海达闼云端智能科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。