文本检测方法、电子设备及计算机可读介质技术

技术编号：26344252 阅读：18 留言：0更新日期：2020-11-13 20:55

本发明专利技术实施例公开了一种文本检测方法，通过对待检测文本图像进行特征提取，得到待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图；然后基于真实文本概率图得到真实文本二值图，再根据真实文本二值图和多个像素点类别概率图生成多个像素点类别二值图，并获得每个像素点类别二值图对应的连通域；然后根据确定的每个连通域对应的文本区域表征向量，获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系，并根据该关系获得待检测文本图像的文本检测结果。相比于相关技术，无需对特征图进行遍历并逐个进行框内是否存在文本的分类判定，在保证文本检测效果的前提下提升了文本检测速度。

Text detection method, electronic equipment and computer-readable medium

全部详细技术资料下载

【技术实现步骤摘要】
文本检测方法、电子设备及计算机可读介质
本专利技术实施例涉及文本识别
，尤其涉及一种文本检测方法、电子设备及计算机可读介质。
技术介绍
文本检测是一种检测图像中的文本区域并标记其边界框的技术，文本检测应用范围广泛，是很多计算机视觉任务的前置步骤，比如图像搜索、文字识别，身份认证和视觉导航等。文本检测的主要目的是定位文本行或字符在图像中的位置，目前一种比较流行的文本检测方法是基于滑动窗口的文本检测方法。该方法基于通用目标检测的思想，设置大量不同长宽比、不同大小的锚点框，以这些锚点框为滑动窗口，在图像上或者在从图像上进行过卷积操作得到的特征图上进行遍历搜索，对于每个搜索到的位置框，进行框内是否是文本的分类判定。但是，这种方法计算量过大，不仅需要耗费大量计算资源，而且耗时较长，降低文本检测的速度。
技术实现思路
本专利技术提供了一种文本检测方案，以至少部分解决上述问题。根据本专利技术实施例的第一方面，提供了一种文本检测方法，所述方法包括：对待检测文本图像进行特征提取，得到所述待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图；其中，所述像素点类别概率图用于指示所述待检测文本图像中的像素点属于各个不同区域类型的概率；对所述真实文本概率图进行二值化，得到真实文本二值图；根据所述真实文本二值图和多个所述像素点类别概率图，生成多个像素点类别二值图；获得每个所述像素点类别二值图对应的连通域，根据每个连通域和所述文本特征图，确定每个连通域对应的文本区域表征向量；根据每...

【技术保护点】
1.一种文本检测方法，其特征在于，所述方法包括：/n对待检测文本图像进行特征提取，得到所述待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图；其中，所述像素点类别概率图用于指示所述待检测文本图像中的像素点属于各个不同区域类型的概率；/n对所述真实文本概率图进行二值化，得到真实文本二值图；/n根据所述真实文本二值图和多个所述像素点类别概率图，生成多个像素点类别二值图；/n获得每个所述像素点类别二值图对应的连通域，根据每个连通域和所述文本特征图，确定每个连通域对应的文本区域表征向量；/n根据每个连通域对应的文本区域表征向量，获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系，并根据所述关系获得所述待检测文本图像的文本检测结果。/n

【技术特征摘要】
1.一种文本检测方法，其特征在于，所述方法包括：
对待检测文本图像进行特征提取，得到所述待检测文本图像对应的真实文本概率图、多个像素点类别概率图和文本特征图；其中，所述像素点类别概率图用于指示所述待检测文本图像中的像素点属于各个不同区域类型的概率；
对所述真实文本概率图进行二值化，得到真实文本二值图；
根据所述真实文本二值图和多个所述像素点类别概率图，生成多个像素点类别二值图；
获得每个所述像素点类别二值图对应的连通域，根据每个连通域和所述文本特征图，确定每个连通域对应的文本区域表征向量；
根据每个连通域对应的文本区域表征向量，获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系，并根据所述关系获得所述待检测文本图像的文本检测结果。

2.根据权利要求1所述的方法，其特征在于，所述区域类型包括以下至少之一：非重叠文本区域、多个文本区域中两两重叠的区域、多个文本区域均重叠的区域。

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述真实文本二值图和多个所述像素点类别概率图，生成多个像素点类别二值图，包括：
根据多个所述像素点类别概率图，确定所述待检测文本图像中每个像素点的像素点类别；
根据所述每个像素点的像素点类别和所述真实文本二值图，生成不同像素点类别对应的像素点类别二值图。

4.根据权利要求3所述的方法，其特征在于，所述根据多个所述像素点类别概率图，确定所述待检测文本图像中每个像素点的像素点类别，包括：
将所述每个像素点在多个所述像素点类别概率图中概率最大的像素点类别，确定为所述每个像素点的像素点类别。

5.根据权利要求1或2所述的方法，其特征在于，所述获得每个所述像素点类别二值图对应的连通域，根据每个连通域和所述文本特征图，确定每个连通域对应的文本区域表征向量，包括：
获得每个所述像素点类别二值图对应的连通域，对每个连通域所包含的像素点在所述文本特征图中对应的文本特征的特征向量求均值，得到每个连通域对应的文本区域表征向量。

6.根据权利要求5所述的方法，其特征在于，所述根据每个连通域对应的文本区域表征向量，获得当前像素点类别二值图对应的连通域与其它像素点类别二值图对应的连通域之间的关系，并根据所述关系获得所述待检测文本图像的文本检测结果，包括：
针对每个所述像素点类别二值图，分别计算当前像素点类别二值图中的连通域对应的文本区域表征向量，与其它像素点类别二值图中的连通域对应的文本区域表征向量之间的距离，根据所述距离获得所述待检测文本图像的文本检测结果。

7.根据权利要求6所述的方法，其特征在于，所述根据所述距离获得所述待检测文本图像的文本检测结果，包括：
若所述距离小于预设距离，则将所述距离小于预设距离对应的两个像素点类别二值图中的连通域进行合并；根据合并结果，获得所述待检测文本图像的文本检测结果。

8.根据权利要求1所述的方法，其特征在于，所述对待检测文本图像进行特征提取...

【专利技术属性】
技术研发人员：杨家博，秦勇，
申请(专利权)人：北京易真学思教育科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人