文本识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35208198 阅读：17 留言：0更新日期：2022-10-15 10:20

本申请实施例公开了一种文本识别方法、装置、电子设备及存储介质。方法包括：电子设备通过获取待处理图像，并确定待处理图像中是否存在复杂字符；若待处理图像中存在复杂字符，则对复杂字符在待处理图像中对应的区域进行标记，得到标记区域；确定待处理图像中除标记区域以外的目标区域；确定目标区域内的图像为第一图像，并对第一图像进行文本识别，得到第一识别结果；确定标记区域内的图像为第二图像，并对第二图像进行文本识别，得到第二识别结果。本申请实施例中能够对非复杂字符文本进行优先识别，能够提高文本识别的识别效率。能够提高文本识别的识别效率。能够提高文本识别的识别效率。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、电子设备及存储介质

[0001]本申请涉及图像处理
，具体涉及一种文本识别方法、装置、电子设备及存储介质。

技术介绍

[0002]在现有技术中，为了提高办公效率，从而产生了OCR(Optical Character Recognition，光学字符识别)识别技术，当扫描设备扫描到图像之后，电脑等识别设备能够对图像进行识别，从而得到识别文本。
[0003]但是，一些图像内容中会包含如数学式、化学式等多种类型的复杂字符，而识别设备识别在识别复杂字符的时候，往往会耗费较多的时长，识别效率低下。

技术实现思路

[0004]本申请实施例提供一种文本识别方法、装置、电子设备及存储介质。该文本识别方法能够对非复杂字符文本进行优先识别，能够提高文本识别的识别效率。
[0005]第一方面，本申请实施例提供了一种文本识别方法，包括：
[0006]获取待处理图像，并确定待处理图像中是否存在复杂字符；
[0007]若待处理图像中存在复杂字符，则对复杂字符在待处理图像中对应的区域进行标记，得到标记区域；
[0008]确定待处理图像中除标记区域以外的目标区域；
[0009]确定目标区域内的图像为第一图像，并对第一图像进行文本识别，得到第一识别结果；
[0010]确定标记区域内的图像为第二图像，并对第二图像进行文本识别，得到第二识别结果。
[0011]第二方面，本申请实施例提供了一种文本识别装置，包括：
[0012]获取模块，用于获取...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，包括：获取待处理图像，并确定所述待处理图像中是否存在复杂字符；若所述待处理图像中存在复杂字符，则对所述复杂字符在所述待处理图像中对应的区域进行标记，得到标记区域；确定所述待处理图像中除所述标记区域以外的目标区域；确定所述目标区域内的图像为第一图像，并对所述第一图像进行文本识别，得到第一识别结果；确定所述标记区域内的图像为第二图像，并对所述第二图像进行文本识别，得到第二识别结果。2.根据权利要求1所述的文本识别方法，其特征在于，所述获取待处理图像，并确定所述待处理图像中是否存在复杂字符，包括：将所述待处理图像分割为多个子图像；将每一所述子图像和文本数据库进行对比，以确定每一所述子图像中是否存在复杂字符。3.根据权利要求2所述的文本识别方法，其特征在于，所述将每一所述子图像和文本数据库进行对比，以确定每一所述子图像中是否存在复杂字符，包括：在每一所述子图像中确定出至少一个目标字符；将所述至少一个目标字符和所述文本数据库进行匹配，若所述至少一个目标字符中任一所述目标字符在所述文本数据库中未匹配成功，则确定所述至少一个目标字符对应的所述子图像存在复杂字符。4.根据权利要求1所述的文本识别方法，其特征在于，所述对所述复杂字符在所述待处理图像中对应的区域进行标记，得到标记区域，包括：确定所述复杂字符对应的覆盖范围，并获取所述覆盖范围对应的位置信息；在所述待处理图像中，根据所述位置信息确定所述复杂字符对应的区域进行标记，得到所述标记区域。5.根据权利要求1至4任一项所述的文本识别方法，其特征在于，所述获取待处理图像，包括：...

【专利技术属性】
技术研发人员：孙铁，冯德亮，陈亮亮，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人