图像文本检测方法、装置、存储介质和计算机程序产品制造方法及图纸

技术编号：34358610 阅读：16 留言：0更新日期：2022-07-31 07:04

本公开涉及图像文本检测方法、装置、存储介质和计算机程序产品。用于从待检测图像中识别文本区域的方法包括：将已标记出文字区域的图像作为训练数据输入到特征提取模块进行训练以得到文本行区域模型；将待检测图像输入到文本行区域模型以得到文本行区域概率图；将已标记出文本中心区域的图像作为训练数据输入到特征提取模块进行训练以得到文本中心区域模型；将待检测图像输入到文本中心区域模型以得到文本中心区域概率图；基于文本行区域阈值和文本行区域概率图从待检测图像中提取文本行区域；基于文本中心区域阈值和文本中心区域概率图从待检测图像中提取文本中心区域；以及将文本行区域和文本中心区域进行组合以得到待检测图像中的文本区域。待检测图像中的文本区域。待检测图像中的文本区域。

全部详细技术资料下载

【技术实现步骤摘要】
图像文本检测方法、装置、存储介质和计算机程序产品

[0001]本公开总体上涉及图像处理领域，更具体地涉及一种图像文本检测方法及装置。

技术介绍

[0002]图像文本检测具有广泛的实际应用，诸如场景理解，产品搜索和自动驾驶等，因此在学术界和行业引起了广泛的关注。例如，在网络信息内容安全领域，在图像中嵌入文字信息为不良信息的传播提供了多样化且隐蔽的信息传播手段。不良的文字信息嵌入到图像中并在网络中快速传播可能会给社会的安定团结带来影响。对图像中的文本进行检测是网络信息内容治理面临的新挑战。
[0003]对文本区域的定位是文本阅读系统的重要前提，其准确性将极大地影响文本识别的性能。
[0004]随着卷积神经网络(CNN)的兴起，一般的图像文本检测算法对于具有规则的形状和长宽比的文本实例能达到良好的检测效果。通常，图像文本检测算法通过直接回归网络预测文本目标中心和文本目标先验框，再叠加尺度回归网络学习文本尺度因子，可以实现自适应输出图像中规则文本的区域。
[0005]然而，由于CNN接收域的大小和文本表示形式的限制，现有技术中的方法无法满足长文本和不规则形状文本的检测需求。在检测图像中的长文本时，因为整个文本的大小超出了文本检测器的接受范围，可能无法编码足够的信息来捕获远距离依赖关系。另一方面，现有技术中的方法大都采用相对简单的形状表示(如轴对齐的矩形、旋转的矩形或四边形的边框)来进行文本检测。当检测诸如弯曲的形状之类的不规则形状文本时，简单的形状表示可能会覆盖很多非文本区域，这将影响后续文本的识别。...

【技术保护点】

【技术特征摘要】
1.一种用于从待检测图像中识别文本区域的方法，包括：将已标记出文字区域的图像作为训练数据，输入到特征提取模块进行训练，以得到文本行区域模型；将所述待检测图像输入到文本行区域模型，以得到文本行区域概率图；将已标记出文本中心区域的图像作为训练数据，输入到特征提取模块进行训练，以得到文本中心区域模型；将所述待检测图像输入到文本中心区域模型，以得到文本中心区域概率图；基于文本行区域阈值和文本行区域概率图，从所述待检测图像中提取文本行区域；基于文本中心区域阈值和文本中心区域概率图，从所述待检测图像中提取文本中心区域；以及将文本行区域和文本中心区域进行组合，以得到待检测图像中的文本区域。2.根据权利要求1所述的方法，其中，所述特征提取模块被配置为：利用卷积网络的多个卷积阶段提取图像的特征；将各个阶段的所提取的特征以元素相加的方式进行整合，以得到各个阶段的特征图；以及对所述多个阶段的特征图进行处理以得到融合概率图。3.根据权利要求2所述的方法，其中，对所述多个阶段的特征图进行处理以得到融合概率图包括：将特征图降维，以生成单通道的特征图；将单通道特征图进行上采样和裁剪，以得到与提取特征之前的图像具有相同大小的特征图；将经上采样和裁剪的特征图在通道维度上进行拼接；以及将拼接得到的特征图降维并输入Sigmoid激活函数，以得到融合概率图。4.根据权利要求2所述的方法，其中，所述特征提取模块采取去除池化层的VGG
‑
16作为卷积网络。5.根据权利要求1所述的方法，其中，已标记出文本中心区域的图像采用高斯分布来限定中心区域。6.一种用于从待检测图像中识别文本区域的装置，包括：特征提取模块；文本行检测模块，被配置为：将已标记出文字区域的图像作为训练数据，输入到特征提取模块进行训练，以得到文本行区域模型，以及将所述待检测图像输入到文本行区域模型，以得到文本行区域概率图；文本中心区域检测模块，被配置为：将已标记出中心区域的图像作为训练数据，输入到特征提取模块进行训练，以得到文本中心区域模型，以...

【专利技术属性】
技术研发人员：马兆铭，王铮，杨迪，任华，汪少敏，渠凯，田庆华，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人