【技术实现步骤摘要】
文本识别方法、装置、存储介质及电子设备
[0001]本申请涉及图像处理
,尤其涉及一种文本识别方法、装置、存储介质及电子设备。
技术介绍
[0002]随着图像处理技术的发展,OCR(Optical Character Recognition,光学字符识别)技术的应用也越来越广泛,OCR技术是利用字符识别算法自动化地定位并识别图像中的文字内容。
[0003]由于OCR识别模型的输入尺寸是固定的,当输入图像是长文本图像时,输入图像的尺寸会大于模型的输入尺寸,需要对输入图像进行调整。在一种技术方案中,通过尺寸归一化处理将输入图像缩小到模型的输入尺寸一致。
[0004]然而,这种技术方案中,由于输入图像中的字符被压缩,容易导致出现识别不准确的问题。
技术实现思路
[0005]本申请实施例提供了一种文本识别方法、装置、存储介质及电子设备,能够提高长文本图像的字符识别的准确性。所述技术方案如下:
[0006]第一方面,本申请实施例提供了一种文本识别方法,所述方法包括:
[0007]根 ...
【技术保护点】
【技术特征摘要】
1.一种文本识别方法,其特征在于,所述方法包括:根据预定分割间隔对长文本图像进行分割处理,得到所述长文本图像的第一文本片段和第一分割位置,所述长文本图像能够被按照所述预定分割间隔分成多个文本片段;对所述第一文本片段进行单字符识别,得到所述第一文本片段中各个字符的位置信息和字符信息;若所述第一分割位置位于所述第一文本片段的尾字符上,则根据所述位置信息对所述第一分割位置进行调整,得到所述长文本图像的第二分割位置,所述第二分割位置为所述长文本图像的第二文本片段的起始位置;若所述长文本图像的多个文本片段均已被识别,则基于各个所述文本片段对应的所述字符信息,确定所述长文本图像的文本信息。2.根据权利要求1所述的方法,其特征在于,所述若所述第一分割位置位于所述第一文本片段的尾字符上,则根据所述位置信息对所述第一分割位置进行调整,得到所述长文本图像的第二分割位置,包括:根据所述位置信息确定所述第一分割位置是否位于所述第一文本片段的尾字符上;若所述第一分割位置位于所述第一文本片段的尾字符上,则根据所述尾字符的位置信息对所述第一分割位置进行调整,确定所述长文本图像的第二分割位置,其中,所述第二分割位置位于所述尾字符的与分割方向相反的一侧。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述第一分割位置位于所述第一文本片段的尾字符上,则去除所述第一文本片段的字符信息中所述尾字符的字符信息。4.根据权利要求3所述的方法,其特征在于,所述基于各个所述文本片段对应的所述字符信息,确定所述长文本图像的文本信息,包括:获取所述长文本图像的多个文本片段中各个文本片段的字符信息;基于所述位置信息对各个文本片段的字符信息进行组合处理,得到所述长文本图像的文本信息。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述第一文本片段的长度小于预定图像长度,则将所述第一文本片段的...
【专利技术属性】
技术研发人员:尹康,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。