文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：36949708 阅读：20 留言：0更新日期：2023-03-22 19:10

本申请实施例公开了一种文本识别方法、装置、存储介质及电子设备，涉及图像处理技术领域。该方法包括：根据预定分割间隔对长文本图像进行分割处理，得到长文本图像的第一文本片段和第一分割位置；对第一文本片段进行单字符识别，得到第一文本片段中各个字符的位置信息和字符信息；若第一分割位置位于第一文本片段的尾字符上，则根据位置信息对第一分割位置进行调整，得到长文本图像的第二分割位置，第二分割位置为长文本图像的第二文本片段的起始位置；若长文本图像的多个文本片段均已被识别，则基于各个文本片段对应的字符信息，确定长文本图像的文本信息。根据本申请实施例的技术方案，能够提高长文本图像的字符识别的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、存储介质及电子设备

[0001]本申请涉及图像处理
，尤其涉及一种文本识别方法、装置、存储介质及电子设备。

技术介绍

[0002]随着图像处理技术的发展，OCR(Optical Character Recognition，光学字符识别)技术的应用也越来越广泛，OCR技术是利用字符识别算法自动化地定位并识别图像中的文字内容。
[0003]由于OCR识别模型的输入尺寸是固定的，当输入图像是长文本图像时，输入图像的尺寸会大于模型的输入尺寸，需要对输入图像进行调整。在一种技术方案中，通过尺寸归一化处理将输入图像缩小到模型的输入尺寸一致。
[0004]然而，这种技术方案中，由于输入图像中的字符被压缩，容易导致出现识别不准确的问题。

技术实现思路

[0005]本申请实施例提供了一种文本识别方法、装置、存储介质及电子设备，能够提高长文本图像的字符识别的准确性。所述技术方案如下：
[0006]第一方面，本申请实施例提供了一种文本识别方法，所述方法包括：
[0007]根...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，所述方法包括：根据预定分割间隔对长文本图像进行分割处理，得到所述长文本图像的第一文本片段和第一分割位置，所述长文本图像能够被按照所述预定分割间隔分成多个文本片段；对所述第一文本片段进行单字符识别，得到所述第一文本片段中各个字符的位置信息和字符信息；若所述第一分割位置位于所述第一文本片段的尾字符上，则根据所述位置信息对所述第一分割位置进行调整，得到所述长文本图像的第二分割位置，所述第二分割位置为所述长文本图像的第二文本片段的起始位置；若所述长文本图像的多个文本片段均已被识别，则基于各个所述文本片段对应的所述字符信息，确定所述长文本图像的文本信息。2.根据权利要求1所述的方法，其特征在于，所述若所述第一分割位置位于所述第一文本片段的尾字符上，则根据所述位置信息对所述第一分割位置进行调整，得到所述长文本图像的第二分割位置，包括：根据所述位置信息确定所述第一分割位置是否位于所述第一文本片段的尾字符上；若所述第一分割位置位于所述第一文本片段的尾字符上，则根据所述尾字符的位置信息对所述第一分割位置进行调整，确定所述长文本图像的第二分割位置，其中，所述第二分割位置位于所述尾字符的与分割方向相反的一侧。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：若所述第一分割位置位于所述第一文本片段的尾字符上，则去除所述第一文本片段的字符信息中所述尾字符的字符信息。4.根据权利要求3所述的方法，其特征在于，所述基于各个所述文本片段对应的所述字符信息，确定所述长文本图像的文本信息，包括：获取所述长文本图像的多个文本片段中各个文本片段的字符信息；基于所述位置信息对各个文本片段的字符信息进行组合处理，得到所述长文本图像的文本信息。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：若所述第一文本片段的长度小于预定图像长度，则将所述第一文本片段的...

【专利技术属性】
技术研发人员：尹康，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人