文本识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35208198 阅读:17 留言:0更新日期:2022-10-15 10:20
本申请实施例公开了一种文本识别方法、装置、电子设备及存储介质。方法包括:电子设备通过获取待处理图像,并确定待处理图像中是否存在复杂字符;若待处理图像中存在复杂字符,则对复杂字符在待处理图像中对应的区域进行标记,得到标记区域;确定待处理图像中除标记区域以外的目标区域;确定目标区域内的图像为第一图像,并对第一图像进行文本识别,得到第一识别结果;确定标记区域内的图像为第二图像,并对第二图像进行文本识别,得到第二识别结果。本申请实施例中能够对非复杂字符文本进行优先识别,能够提高文本识别的识别效率。能够提高文本识别的识别效率。能够提高文本识别的识别效率。

【技术实现步骤摘要】
文本识别方法、装置、电子设备及存储介质


[0001]本申请涉及图像处理
,具体涉及一种文本识别方法、装置、电子设备及存储介质。

技术介绍

[0002]在现有技术中,为了提高办公效率,从而产生了OCR(Optical Character Recognition,光学字符识别)识别技术,当扫描设备扫描到图像之后,电脑等识别设备能够对图像进行识别,从而得到识别文本。
[0003]但是,一些图像内容中会包含如数学式、化学式等多种类型的复杂字符,而识别设备识别在识别复杂字符的时候,往往会耗费较多的时长,识别效率低下。

技术实现思路

[0004]本申请实施例提供一种文本识别方法、装置、电子设备及存储介质。该文本识别方法能够对非复杂字符文本进行优先识别,能够提高文本识别的识别效率。
[0005]第一方面,本申请实施例提供了一种文本识别方法,包括:
[0006]获取待处理图像,并确定待处理图像中是否存在复杂字符;
[0007]若待处理图像中存在复杂字符,则对复杂字符在待处理图像中对应的区域进行标记,得到标记区域;
[0008]确定待处理图像中除标记区域以外的目标区域;
[0009]确定目标区域内的图像为第一图像,并对第一图像进行文本识别,得到第一识别结果;
[0010]确定标记区域内的图像为第二图像,并对第二图像进行文本识别,得到第二识别结果。
[0011]第二方面,本申请实施例提供了一种文本识别装置,包括:
[0012]获取模块,用于获取待处理图像,并确定待处理图像中是否存在复杂字符;
[0013]标记模块,用于若待处理图像中存在复杂字符,则对复杂字符在待处理图像中对应的区域进行标记,得到标记区域;
[0014]确定模块,用于确定待处理图像中除标记区域以外的目标区域;
[0015]第一识别模块,用于确定目标区域内的图像为第一图像,并对第一图像进行文本识别,得到第一识别结果;
[0016]第二识别模块,用于确定标记区域内的图像为第二图像,并对第二图像进行文本识别,得到第二识别结果。
[0017]第三方面,本申请实施例提供了一种电子设备,包括:存储有可执行程序代码的存储器、与存储器耦合的处理器;处理器调用存储器中存储的可执行程序代码,执行本申请实施例提供的文本识别方法中的步骤。
[0018]第四方面,本申请实施例提供了一种存储介质,存储介质存储有多条指令,指令适
于处理器进行加载,以本申请实施例提供的文本识别方法中的步骤。
[0019]本申请实施例中,电子设备通过获取待处理图像,并确定待处理图像中是否存在复杂字符;若待处理图像中存在复杂字符,则对复杂字符在待处理图像中对应的区域进行标记,得到标记区域;确定待处理图像中除标记区域以外的目标区域;确定目标区域内的图像为第一图像,并对第一图像进行文本识别,得到第一识别结果;确定标记区域内的图像为第二图像,并对第二图像进行文本识别,得到第二识别结果。本申请实施例中能够对非复杂字符文本进行优先识别,能够提高文本识别的识别效率。
附图说明
[0020]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本申请实施例提供的文本识别方法的第一流程示意图。
[0022]图2是本申请实施例提供的文本识别方法的第二流程示意图。
[0023]图3是本申请实施例提供的文本识别装置的结构示意图。
[0024]图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0025]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0026]在相关技术中,在文本识别的过程中,往往是对整页图像进行识别,从而获取其中的文本内容。
[0027]但是,在整页图像中包含了一些插画、图片、图标等不需要识别的内容,如果对整页内不需要识别内容进行了识别,则会导致识别出的文件中出现排版错乱、文字错乱等现象。
[0028]为了解决该技术问题,本申请实施例提供了一种文本识别方法、装置、电子设备及存储介质。该文本识别方法可以对准确的确定出待处理图像中需要识别的内容,然后对需要识别的内容进行识别。
[0029]请参阅图1,图1是本申请实施例提供的文本识别方法的第一流程示意图。该文本识别方法可以包括以下步骤:
[0030]110、获取待处理图像,并确定待处理图像中是否存在复杂字符。
[0031]在一些实施方式中,在电子设备获取到待处理图像之后,电子设备可以将待处理图像分割为多个子图像,然后将每一子图像和文本数据库进行对比,以确定每一子图像中是否存在复杂字符。
[0032]具体的,电子设备可以在每一子图像中确定出至少一个目标字符,将至少一个目标字符和文本数据库进行匹配,若至少一个目标字符中任一目标字符在文本数据库中未匹
配成功,则确定至少一个目标字符对应的子图像存在复杂字符。
[0033]例如,电子设备可以先确定出待处理图像的面积大小,然后根据面积大小确定出待处理图像可以分割的子图像的目标数量,最后根据目标数量对待处理图像进行分割,从而得到多个子图像。
[0034]其中,当待处理图像的面积越大,则可以分割的子图像对应的目标数量越多。当待处理图像的面积越小,则可以分割的子图像对应的目标数量越少。
[0035]当待处理图像分割出多个子图像之后,电子设备可以对每一子图像和文本数据库进行匹配,从而确定其中是否有复杂字符。
[0036]比如,当电子设备选定某一张子图像之后,获取该子图像中的至少一个目标字符,比如随机从该子图像中选取至少一个字符为目标字符。然后将该至少一个目标字符和文本数据库匹配,该文本数据库可以是全部存储非复杂字符的数据库,比如该文本数据库中存储的有汉字、英文字母等。
[0037]如果目标字符中有任何一个没有和文本数据库匹配成功,则说明该子图像中包含了复杂字符。如果该子图像中的所有目标字符均和文本数据库匹配成功,则说明该子图像中不包含复杂字符。
[0038]需要说明的是,复杂字符可以是数学公式、化学式、特殊标记符、手绘字符等多种字符,这些字符均存在不容易被识别出的特征,或者是识别出这些字符需要花费较长的时间和较大的计算量。
[0039]120、若待处理图像中存在复杂字符,则对复杂字符在待处理图像中对应的区域进行标记,得到标记区域。
[0040]在一些实施方式中,如果待处理图像中存在了复杂字符,电子设备可以确定复杂字符对应的覆本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:获取待处理图像,并确定所述待处理图像中是否存在复杂字符;若所述待处理图像中存在复杂字符,则对所述复杂字符在所述待处理图像中对应的区域进行标记,得到标记区域;确定所述待处理图像中除所述标记区域以外的目标区域;确定所述目标区域内的图像为第一图像,并对所述第一图像进行文本识别,得到第一识别结果;确定所述标记区域内的图像为第二图像,并对所述第二图像进行文本识别,得到第二识别结果。2.根据权利要求1所述的文本识别方法,其特征在于,所述获取待处理图像,并确定所述待处理图像中是否存在复杂字符,包括:将所述待处理图像分割为多个子图像;将每一所述子图像和文本数据库进行对比,以确定每一所述子图像中是否存在复杂字符。3.根据权利要求2所述的文本识别方法,其特征在于,所述将每一所述子图像和文本数据库进行对比,以确定每一所述子图像中是否存在复杂字符,包括:在每一所述子图像中确定出至少一个目标字符;将所述至少一个目标字符和所述文本数据库进行匹配,若所述至少一个目标字符中任一所述目标字符在所述文本数据库中未匹配成功,则确定所述至少一个目标字符对应的所述子图像存在复杂字符。4.根据权利要求1所述的文本识别方法,其特征在于,所述对所述复杂字符在所述待处理图像中对应的区域进行标记,得到标记区域,包括:确定所述复杂字符对应的覆盖范围,并获取所述覆盖范围对应的位置信息;在所述待处理图像中,根据所述位置信息确定所述复杂字符对应的区域进行标记,得到所述标记区域。5.根据权利要求1至4任一项所述的文本识别方法,其特征在于,所述获取待处理图像,包括:...

【专利技术属性】
技术研发人员:孙铁冯德亮陈亮亮
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1