文本检测方法、装置、电子设备及存储装置制造方法及图纸

技术编号：24458144 阅读：24 留言：0更新日期：2020-06-10 16:10

一种文本检测方法，应用于文本检测技术领域，包括：提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图，将该多种尺度的文本特征图进行级联，得到包含多种尺度信息的级联文本特征图，根据该级联文本特征图，预测该待检测图像中的文本区域和文本中心区域，采用形状感知的聚类算法，根据该文本区域和文本中心区域，重建得到该待检测图像中的精确的文本框。本申请还提供了一种文本检测装置、电子设备及存储装置，可从场景图像中检测出任意形状的文本，提升文本检测效果。

Text detection method, device, electronic equipment and storage device

A text detection method is applied in the field of text detection technology, including: extracting text features of multiple scales of the image to be detected, obtaining text feature maps of multiple scales, cascading the text feature maps of multiple scales, obtaining cascaded text feature maps containing multiple scales of information, and predicting the text area in the image to be detected according to the cascaded text feature map And the text center region, using the shape aware clustering algorithm, according to the text region and the text center region, the accurate text box in the image to be detected is reconstructed. The application also provides a text detection device, an electronic device and a storage device, which can detect any shape of text from the scene image and improve the text detection effect.

全部详细技术资料下载

【技术实现步骤摘要】
文本检测方法、装置、电子设备及存储装置
本申请涉及文本检测领域，尤其涉及一种文本检测方法、装置、电子设备及存储装置。
技术介绍
场景文本检测是指从自然场景图像中定位出其中包含的所有文本，是文本识别的前提步骤，在图像检索，场景理解，自动驾驶和文本翻译等领域有很多应用。主流的文本检测方法可以大致分为基于回归和基于分割两类方法。这些方法存在两个主要的问题：1、由于缺乏多尺度感受野，它们对于多尺度文本的检测效果不好；2、由于相邻文本的边界框可能存在重叠，因此经常会错误地将靠得近的几个文本检测为一个。
技术实现思路
本申请的主要目的在于提供一种文本检测方法、装置、电子设备及存储装置，可提升文本检测效果。为实现上述目的，本申请实施例第一方面提供一种文本检测方法，包括：提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图；将所述多种尺度的文本特征图进行级联，得到包含多种尺度信息的级联文本特征图；根据所述级联文本特征图，预测所述待检测图像中的文本区域和文本中心区域；采用形状感知的聚类算法，根据所述文本区域和文本中心区域，重建得到所述待检测图像中的精确的文本框。可选的，所述文本区域中的文本置信度为[0，1]之间的实数。可选的，所述提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图包括：采用多种不同尺度的池化操作，提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图。可选的，所述多种不同尺度包括1×1、3×3、5×5、7...

【技术保护点】
1.一种文本检测方法，其特征在于，包括：/n提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图；/n将所述多种尺度的文本特征图进行级联，得到包含多种尺度信息的级联文本特征图；/n根据所述级联文本特征图，预测所述待检测图像中的文本区域和文本中心区域；/n采用形状感知的聚类算法，根据所述文本区域和文本中心区域，重建所述待检测图像中的精确的文本框。/n

【技术特征摘要】
1.一种文本检测方法，其特征在于，包括：
提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图；
将所述多种尺度的文本特征图进行级联，得到包含多种尺度信息的级联文本特征图；
根据所述级联文本特征图，预测所述待检测图像中的文本区域和文本中心区域；
采用形状感知的聚类算法，根据所述文本区域和文本中心区域，重建所述待检测图像中的精确的文本框。

2.根据权利要求1所述的文本检测方法，其特征在于，所述文本区域中的文本置信度为[0，1]之间的实数。

3.根据权利要求1或2所述的文本检测方法，其特征在于，所述提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图包括：
采用多种不同尺度的池化操作，提取待检测图像的多种尺度的文本特征，得到多种尺度的文本特征图。

4.根据权利要求3所述的文本检测方法，其特征在于，所述多种不同尺度包括1×1、3×3、5×5、7×7。

5.根据权利要求1或2所述的文本检测方法，其特征在于，所述将所述多种尺度的文本特征图进行级联，得到包含多种尺度信息的级联文本特征图之前，包括：
将所述多种尺度的文本特征图分别经过上采样到1/4所述待检测图像的大小。

6.根据权利要求1或2所述的文本检测方法，其特征在于，所述根据所述级联文本特征图，预测所述待...

【专利技术属性】
技术研发人员：张勇东，周宇，谢洪涛，
申请(专利权)人：中国科学技术大学，北京中科研究院，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人