文本检测方法、装置、设备和介质制造方法及图纸

技术编号：39319790 阅读：7 留言：0更新日期：2023-11-12 16:01

本申请的一种文本检测方法，包括：对目标图像提取若干个不同尺度的初始特征信息，并对所述初始特征信息叠加，得到叠加特征信息；通过预设的感受野模块对所述叠加特征信息进行特征增强，得到第一增强特征；通过预设的注意力模块对所述第一增强特征进行注意力增强，得到第二增强特征；根据所述第二增强特征，对所述目标图像进行文本框拟合，并通过拟合的文本框进行文本检测，从而在文本和背景区分难度较大的情况下，提高文本检测的完整性。提高文本检测的完整性。提高文本检测的完整性。

全部详细技术资料下载

【技术实现步骤摘要】
文本检测方法、装置、设备和介质

[0001]本申请涉及图像处理
，例如涉及一种文本检测方法、装置、设备和介质。

技术介绍

[0002]文本检测是图像处理中的一个重要部分，现有技术中的文本检测方法通常是将图像进行二值化处理，使图像的文本区域和背景区域出现明显的黑白效果。
[0003]当文本在图像中较为明显，即文本与背景容易区分时，现有的文本检测算法就能很容易地对文本区域和背景区域进行区分。然而，当文本的颜色与背景较为相似，即文本与背景很难区分时，现有的文本检测算法在进行二值化处理时，很容易将其误划分为背景区域，从而导致对此类文本的漏检。

技术实现思路

[0004]本申请目的在于：提供一种文本检测方法、装置、设备和介质，其能够在文本和背景区分难度较大的情况下，提高文本检测的完整性。
[0005]为达到上述目的，本申请提供了一种文本检测方法，包括：
[0006]对目标图像提取若干个不同尺度的初始特征信息，并对所述初始特征信息叠加，得到叠加特征信息；
[0007]通过预设的感受野模块对所述叠加特征信息进行特征增强，得到第一增强特征；
[0008]通过预设的注意力模块对所述第一增强特征进行注意力增强，得到第二增强特征；
[0009]根据所述第二增强特征，对所述目标图像进行文本框拟合，并通过拟合得到的文本框进行文本检测。
[0010]本申请还提供了一种文本检测装置，包括：
[0011]特征识别单元，用于对目标图像提取若干个不同尺度的初始特征信息...

【技术保护点】

【技术特征摘要】
1.一种文本检测方法，其特征在于，包括：对目标图像提取若干个不同尺度的初始特征信息，并对所述初始特征信息叠加，得到叠加特征信息；通过预设的感受野模块对所述叠加特征信息进行特征增强，得到第一增强特征；通过预设的注意力模块对所述第一增强特征进行注意力增强，得到第二增强特征；根据所述第二增强特征，对所述目标图像进行文本框拟合，并通过拟合得到的文本框进行文本检测。2.根据权利要求1所述的文本检测方法，其特征在于，所述通过预设的感受野模块对所述叠加特征信息进行特征增强，得到第一增强特征，包括：将所述叠加特征信息输入所述感受野模块中的多分枝结构中，得到不同尺寸的卷积层输出结果，其中，所述多分枝结构包括不同尺寸卷积核的卷积层；对所述卷积层输出结果进行融合，得到所述第一增强特征。3.根据权利要求1所述的文本检测方法，其特征在于，所述通过预设的注意力模块对所述第一增强特征进行注意力增强，得到第二增强特征，包括：通过预设的通道注意力模块，获取不同通道的所述叠加特征信息对应的最大池矢量和平均池矢量；将所述最大池矢量和平均池矢量输入预设的隐藏层中，得到第一注意力矢量和第二注意力矢量；将所述第一注意力矢量和第二注意力矢量整合至所述叠加特征信息中，得到通道增强特征；对所述通道增强特征进行空间增强，得到所述第二增强特征。4.根据权利要求3所述的文本检测方法，其特征在于，所述对所述通道增强特征进行空间增强，得到所述第二增强特征，包括：通过预设的空间注意力模块，在预设的轴的方向上，对所述通道增强特征进行全局计算，得到第一空间矢量和第二空间矢量；对所述第一空间矢量和第二空间矢量进行叠加，得到空间增强特征；对所述空间增强特征进行卷积和激活计算，得到包含空间注意力权重的空间注意力矩阵；将所述空间注意力矩阵与所述通道增强特征对应相乘，得到所述第二增强特征。5.根据权利...

【专利技术属性】
技术研发人员：赵佳鹏，
申请(专利权)人：广州视源人工智能创新研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人