文本检测方法、电子设备及计算机可读介质技术

技术编号:26344252 阅读:18 留言:0更新日期:2020-11-13 20:55
本发明专利技术实施例公开了一种文本检测方法,通过对待检测文本图像进行特征提取,得到待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图;然后基于真实文本概率图得到真实文本二值图,再根据真实文本二值图和多个像素点类别概率图生成多个像素点类别二值图,并获得每个像素点类别二值图对应的连通域;然后根据确定的每个连通域对应的文本区域表征向量,获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系,并根据该关系获得待检测文本图像的文本检测结果。相比于相关技术,无需对特征图进行遍历并逐个进行框内是否存在文本的分类判定,在保证文本检测效果的前提下提升了文本检测速度。

Text detection method, electronic equipment and computer-readable medium

【技术实现步骤摘要】
文本检测方法、电子设备及计算机可读介质
本专利技术实施例涉及文本识别
,尤其涉及一种文本检测方法、电子设备及计算机可读介质。
技术介绍
文本检测是一种检测图像中的文本区域并标记其边界框的技术,文本检测应用范围广泛,是很多计算机视觉任务的前置步骤,比如图像搜索、文字识别,身份认证和视觉导航等。文本检测的主要目的是定位文本行或字符在图像中的位置,目前一种比较流行的文本检测方法是基于滑动窗口的文本检测方法。该方法基于通用目标检测的思想,设置大量不同长宽比、不同大小的锚点框,以这些锚点框为滑动窗口,在图像上或者在从图像上进行过卷积操作得到的特征图上进行遍历搜索,对于每个搜索到的位置框,进行框内是否是文本的分类判定。但是,这种方法计算量过大,不仅需要耗费大量计算资源,而且耗时较长,降低文本检测的速度。
技术实现思路
本专利技术提供了一种文本检测方案,以至少部分解决上述问题。根据本专利技术实施例的第一方面,提供了一种文本检测方法,所述方法包括:对待检测文本图像进行特征提取,得到所述待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图;其中,所述像素点类别概率图用于指示所述待检测文本图像中的像素点属于各个不同区域类型的概率;对所述真实文本概率图进行二值化,得到真实文本二值图;根据所述真实文本二值图和多个所述像素点类别概率图,生成多个像素点类别二值图;获得每个所述像素点类别二值图对应的连通域,根据每个连通域和所述文本特征图,确定每个连通域对应的文本区域表征向量;根据每个连通域对应的文本区域表征向量,获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系,并根据所述关系获得所述待检测文本图像的文本检测结果。根据本专利技术实施例的第二方面,提供了一种文本检测装置,所述装置包括:特征提取模块,二值化模块,生成模块,确定模块,结果获取模块;所述特征提取模块,用于对待检测文本图像进行特征提取,得到所述待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图;其中,所述像素点类别概率图用于指示所述待检测文本图像中的像素点属于各个不同区域类型的概率;所述二值化模块,用于对所述真实文本概率图进行二值化,得到真实文本二值图;所述生成模块,用于根据所述真实文本二值图和多个所述像素点类别概率图,生成多个像素点类别二值图;所述确定模块,用于获得每个所述像素点类别二值图对应的连通域,根据每个连通域和所述文本特征图,确定每个连通域对应的文本区域表征向量;所述结果获取模块,用于根据每个连通域对应的文本区域表征向量,获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系,并根据所述关系获得所述待检测文本图像的文本检测结果。根据本专利技术实施例的第三方面,提供了一种电子设备,所述设备包括:一个或多个处理器;计算机可读介质,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的文本检测方法。根据本专利技术实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的文本检测方法。根据本专利技术实施例提供的方案,在对文本进行检测,尤其是对存在文本相交情况的待检测文本图像进行文本检测时,文本所在区域可按照各个文本的相交情况被划分为不同区域类型,通过本方案的像素点类别概率图可明确标示像素点的区域类型;进而,基于真实文本二值图和像素点类别概率图可获得不同区域对应的像素点类别二值图;再基于每个素点类别二值图对应的连通域,由于每个连通域在上述文本特征图中存在对应的文本特征,该文本特征为可学习的文本特征,可有效表征不同像素点关系,如,通过像素点间距离表征不同部分像素点间的相似度,故基于该文本特征图,可确定每个连通域对应的文本区域表征向量,通过该文本区域表征向量表征多个连通域是否属于同一文本区域,根据当前像素点类别二值图中连通域的文本区域表征向量与其他像素点类别二值图中连通域的文本区域表征向量的关系,获得待检测文本图像的文本检测结果。相比于相关技术,在得到真实文本概率图后,无需反复卷积,也无需对特征图进行遍历并逐个进行框内是否存在文本的分类判定,在保证文本检测效果的前提下,实现了比相关技术中更简单的后处理思路,提升了文本检测速度,尤其是密集文本的文本检测速度。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术实施例提供的一种文本检测方法的步骤流程图;图2A为本专利技术实施例提供的一种非重叠文本区域的示意图;图2B为本专利技术实施例提供的一种两两重叠文本区域的示意图;图2C为本专利技术实施例提供的一种三个文本区域重叠的示意图;图2D为本专利技术实施例提供的一种四个文本区域重叠的示意图;图2E为本专利技术实施例提供的文本检测方法的步骤流程图;图3为本专利技术实施例提供的文本检测方法的另一种步骤流程图;图4为本专利技术实施例提供的一种文本检测装置的结构示意图;图5为本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅配置为解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。实施例一参照图1,示出了根据本专利技术实施例一的一种文本检测方法的步骤流程图。本实施例的文本检测方法包括以下步骤:步骤S101、对待检测文本图像进行特征提取,得到待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图。需要说明的是,本申请实施例中的文本检测方法可适用于具有各种文本密度的文本检测,包括但不限于常规密度文本、密集密度文本、稀疏密度文本,尤其是密集密度文本。其中,确定某个文本是否为密集文本的具体指标可以由本领域技术人员根据实际情况适当设置,包括但不限于:根据文本之间的间距(如间距小于2磅等)、根据单位范围内的文本的数量(如每平方厘米中的文本数量多于3个等)等等,本申请实施例对此不作限制。在本实施例中,待检测文本图像可以为包含上述密集密度文本的图像,其中,真实文本概率图可以表征待检测文本图像中的像素点属于文本或是背景的概率,像素点类别概率图用于指示待检测文本图像中的像素点属于各个不同区域类型的概率,文本特征图通过可学习的文本特征不断学习得到,可以用于表征待检测文本图像中不同像素点间的距离,通过该距离可辅助判断像素点属于某一文本区域的概率。可选地,上述区域类型包括以下至少之一:非重叠文本区域和重叠文本区域。其中,重叠文本区域可以包括:两个文本区域相互重叠的区域,和/或,三个文本区域相互重叠的区域,和/或,四本文档来自技高网...

【技术保护点】
1.一种文本检测方法,其特征在于,所述方法包括:/n对待检测文本图像进行特征提取,得到所述待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图;其中,所述像素点类别概率图用于指示所述待检测文本图像中的像素点属于各个不同区域类型的概率;/n对所述真实文本概率图进行二值化,得到真实文本二值图;/n根据所述真实文本二值图和多个所述像素点类别概率图,生成多个像素点类别二值图;/n获得每个所述像素点类别二值图对应的连通域,根据每个连通域和所述文本特征图,确定每个连通域对应的文本区域表征向量;/n根据每个连通域对应的文本区域表征向量,获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系,并根据所述关系获得所述待检测文本图像的文本检测结果。/n

【技术特征摘要】
1.一种文本检测方法,其特征在于,所述方法包括:
对待检测文本图像进行特征提取,得到所述待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图;其中,所述像素点类别概率图用于指示所述待检测文本图像中的像素点属于各个不同区域类型的概率;
对所述真实文本概率图进行二值化,得到真实文本二值图;
根据所述真实文本二值图和多个所述像素点类别概率图,生成多个像素点类别二值图;
获得每个所述像素点类别二值图对应的连通域,根据每个连通域和所述文本特征图,确定每个连通域对应的文本区域表征向量;
根据每个连通域对应的文本区域表征向量,获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系,并根据所述关系获得所述待检测文本图像的文本检测结果。


2.根据权利要求1所述的方法,其特征在于,所述区域类型包括以下至少之一:非重叠文本区域、多个文本区域中两两重叠的区域、多个文本区域均重叠的区域。


3.根据权利要求1或2所述的方法,其特征在于,所述根据所述真实文本二值图和多个所述像素点类别概率图,生成多个像素点类别二值图,包括:
根据多个所述像素点类别概率图,确定所述待检测文本图像中每个像素点的像素点类别;
根据所述每个像素点的像素点类别和所述真实文本二值图,生成不同像素点类别对应的像素点类别二值图。


4.根据权利要求3所述的方法,其特征在于,所述根据多个所述像素点类别概率图,确定所述待检测文本图像中每个像素点的像素点类别,包括:
将所述每个像素点在多个所述像素点类别概率图中概率最大的像素点类别,确定为所述每个像素点的像素点类别。


5.根据权利要求1或2所述的方法,其特征在于,所述获得每个所述像素点类别二值图对应的连通域,根据每个连通域和所述文本特征图,确定每个连通域对应的文本区域表征向量,包括:
获得每个所述像素点类别二值图对应的连通域,对每个连通域所包含的像素点在所述文本特征图中对应的文本特征的特征向量求均值,得到每个连通域对应的文本区域表征向量。


6.根据权利要求5所述的方法,其特征在于,所述根据每个连通域对应的文本区域表征向量,获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系,并根据所述关系获得所述待检测文本图像的文本检测结果,包括:
针对每个所述像素点类别二值图,分别计算当前像素点类别二值图中的连通域对应的文本区域表征向量,与其它像素点类别二值图中的连通域对应的文本区域表征向量之间的距离,根据所述距离获得所述待检测文本图像的文本检测结果。


7.根据权利要求6所述的方法,其特征在于,所述根据所述距离获得所述待检测文本图像的文本检测结果,包括:
若所述距离小于预设距离,则将所述距离小于预设距离对应的两个像素点类别二值图中的连通域进行合并;根据合并结果,获得所述待检测文本图像的文本检测结果。


8.根据权利要求1所述的方法,其特征在于,所述对待检测文本图像进行特征提取...

【专利技术属性】
技术研发人员:杨家博秦勇
申请(专利权)人:北京易真学思教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1