特殊区域外文本识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35208214 阅读:16 留言:0更新日期:2022-10-15 10:20
本申请实施例公开了一种特殊区域外文本识别方法、装置、电子设备及存储介质。方法包括:电子设备通过将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;根据每一子图像的图像特征在多个子图像中确定出目标图像;确定目标图像在待识别图像中对应的目标区域;在待识别图像中确定出在目标区域以外的目标识别图像;对目标识别图像进行文本识别,得到识别文本。该特殊区域外文本识别方法能够根据子图像的图像特征准确的定位到需要识别的内容。的定位到需要识别的内容。的定位到需要识别的内容。

【技术实现步骤摘要】
特殊区域外文本识别方法、装置、电子设备及存储介质


[0001]本申请涉及图像处理
,具体涉及一种特殊区域外文本识别方法、装置、电子设备及存储介质。

技术介绍

[0002]现有技术中,在文本识别的过程中,往往是对整页图像进行识别,从而获取其中的文本内容。
[0003]但是,在整页图像中包含了一些插画、图片、图标等不需要识别的内容,如果对整页内不需要识别内容进行了识别,则会导致识别出的文件中出现排版错乱、文字错乱等现象。

技术实现思路

[0004]本申请实施例提供一种特殊区域外文本识别方法、装置、电子设备及存储介质。该特殊区域外文本识别方法能够准确的定位到需要识别的内容。
[0005]第一方面,本申请实施例提供了一种特殊区域外文本识别方法,包括:
[0006]将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;
[0007]根据每一子图像的图像特征在多个子图像中确定出目标图像;
[0008]确定目标图像在待识别图像中对应的目标区域;
[0009]在待识别图像中确定出在目标区域以外的目标识别图像;
[0010]对目标识别图像进行文本识别,得到识别文本。
[0011]第二方面,本申请实施例提供了一种特殊区域外文本识别装置,包括:
[0012]分割模块,用于将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;
[0013]第一确定模块,用于根据每一子图像的图像特征在多个子图像中确定出目标图像;
[0014]第二确定模块,用于确定目标图像在待识别图像中对应的目标区域;
[0015]第三确定模块,用于在待识别图像中确定出在目标区域以外的目标识别图像;
[0016]识别模块,用于对目标识别图像进行文本识别,得到识别文本。
[0017]第三方面,本申请实施例提供了一种电子设备,包括:存储有可执行程序代码的存储器、与存储器耦合的处理器;处理器调用存储器中存储的可执行程序代码,执行本申请实施例提供的特殊区域外文本识别方法中的步骤。
[0018]第四方面,本申请实施例提供了一种存储介质,存储介质存储有多条指令,指令适于处理器进行加载,以本申请实施例提供的特殊区域外文本识别方法中的步骤。
[0019]本申请实施例中,电子设备通过将待识别图像分割为多个子图像,并在多个子图像中确定每一所子图像对应的图像特征;根据每一子图像的图像特征在多个子图像中确定
出目标图像;确定目标图像在待识别图像中对应的目标区域;在待识别图像中确定出在目标区域以外的目标识别图像;对目标识别图像进行文本识别,得到识别文本。该特殊区域外文本识别方法能够根据子图像的图像特征准确的定位到需要识别的内容。
附图说明
[0020]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本申请实施例提供的特殊区域外文本识别方法的第一流程示意图。
[0022]图2是本申请实施例提供的特殊区域外文本识别方法的第二流程示意图。
[0023]图3是本申请实施例提供的文本识别的场景示意图。
[0024]图4是本申请实施例提供的特殊区域外文本识别装置的结构示意图。
[0025]图5是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0026]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0027]在相关技术中,在文本识别的过程中,往往是对整页图像进行识别,从而获取其中的文本内容。
[0028]但是,在整页图像中包含了一些插画、图片、图标等不需要识别的内容,如果对整页内不需要识别内容进行了识别,则会导致识别出的文件中出现排版错乱、文字错乱等现象。
[0029]为了解决该技术问题,本申请实施例提供了一种特殊区域外文本识别方法、装置、电子设备及存储介质。该特殊区域外文本识别方法可以对准确的确定出待识别图像中需要识别的内容,然后对需要识别的内容进行识别。
[0030]请参阅图1,图1是本申请实施例提供的特殊区域外文本识别方法的第一流程示意图。该特殊区域外文本识别方法可以包括以下步骤:
[0031]110、将待识别图像分割为多个子图像,并确定每一子图像对应的图像特征。
[0032]在将待识别图像分割为多个子图像,并确定每一子图像对应的图像特征,电子设备可以先获取原始图像,然后对原始图像的图像参数、方向信息进行校正,得到待识别图像。
[0033]比如,电子设备可以将原始图像的对比度调高,使得文本部分更加容易被识别出来。将原始图像的图像方向调整为预设方向,使得文本部分更加容易被识别出来。对原始图像进行校正处理之后,则得到待识别图像。
[0034]在一些实施方式中,电子设备可以确定待识别图像的尺寸信息,并确定尺寸信息对应的目标尺寸范围;确定目标尺寸范围对应的目标数量,将待识别图像分割为目标数量
的子图像。
[0035]比如,针对于不同尺寸的待识别图像,当待识别图像的尺寸越大时,则可以分割出较多数量的子图像。当待识别图像的尺寸越小时,则可以分割出较少数量的子图像。这样就使得待识别图像的子图像拥有合适的数量,以及每个子图像拥有的合适的尺寸,从而有利于提高电子设备对子图像的处理效率。
[0036]又比如,在电子设备中可以预先设置多个尺寸范围,每一尺寸范围均有对应的目标数量,该尺寸范围可以是面积范围。然后电子设备确定出待识别图像的尺寸信息,当该尺寸信息属于某一尺寸范围内时,则将该尺寸范围对应的目标数量确定为待识别图像需要分割的子图像的数量。最后根据目标数量对待识别图像进行图像分割。
[0037]在一些实施方式中,电子设备还可以确定待识别图像的颜色分布信息;根据颜色分布信息将待识别图像分割为多个子图像。
[0038]比如,在待识别图像中,可能存在多种颜色的背景,如果某一颜色的连续覆盖面积大于预设面积,则将该颜色连续覆盖面积对应的区域在待识别图像中分割出来,从而得到该区域对应的子图像。
[0039]又比如,电子设备还可以确定相邻的相同色系的颜色,然后将相同色系的颜色对应的区域确定为需要进行图像分割的区域,在待识别图像中对该区域进行图像分割,从而得到子图像。
[0040]120、根据每一子图像的图像特征在多个子图像中确定出目标图像。
[0041]在一些实施方式中,电子设备可以确定每一子图像中的线条组合,然后确定线条组合对应的线条流向信息,将线条流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种特殊区域外文本识别方法,其特征在于,包括:将待识别图像分割为多个子图像,并在所述多个子图像中确定每一所子图像对应的图像特征;根据每一所述子图像的图像特征在所述多个子图像中确定出目标图像;确定所述目标图像在所述待识别图像中对应的目标区域;在所述待识别图像中确定出在所述目标区域以外的目标识别图像;对所述目标识别图像进行文本识别,得到识别文本。2.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,所述将待识别图像分割为多个子图像,包括:确定所述待识别图像的尺寸信息,并确定所述尺寸信息对应的目标尺寸范围;确定所述目标尺寸范围对应的目标数量,将所述待识别图像分割为目标数量的所述子图像。3.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,所述将待识别图像分割为多个子图像,包括:确定所述待识别图像的颜色分布信息;根据所述颜色分布信息将所述待识别图像分割为多个所述子图像。4.根据权利要求1所述的特殊区域外文本识别方法,其特征在于,所述确定每一所述子图像对应的图像特征,包括:确定每一所述子图像中的线条组合;确定所述线条组合对应的线条流向信息,将每一所述子图像的线条流向信息确定为每一所述子图像的图像特征。5.根据权利要求4所述的特殊区域外文本识别方法,其特征在于,所述根据每一所述子图像的图像特征在所述多个子图像中确定出目标图像,包括:根据所述线条流向信息,在多个所述子图像中确定出无规律的线条组合;将所述无规律的线条组合对应的所述子图像确定为所述目标图像。6.根据权利要求4所述的特殊区域外文本识别方法,其特征在于,所述根据每一所述子图像的图像特征在所述多个子图像中确定出目标图像,包括:获取所述线条流向信息对应的模板数据库,所述模板...

【专利技术属性】
技术研发人员:孙铁冯德亮蔡妙
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1