一种微型文本检测方法、计算机设备及存储介质技术

技术编号：41242521 阅读：3 留言：0更新日期：2024-05-09 23:54

本发明专利技术属于场景文本检测技术领域，具体公开了一种微型文本检测方法、计算机设备及存储介质。本发明专利技术方法通过集成上下文提取模块和注意力指导模块来增强模型架构，使其更适合微型文本的检测场景，通过提出一种特征有效融合因子，使模型能够自适应控制从深层特征到浅层特征传递的信息，有效突出微型的文本特征；在计算损失函数时，提出一种尺度敏感损失，能够更公平地处理不同大小的文本，在保持准确性的同时，有效地减少了微型文本的漏检；最后提出一种可微分二值化模块Th‑DB，在提高模型性能的同时进一步缩短模型的推理时间。本发明专利技术在检测微型文本方面具有高敏感度和高精确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于场景文本检测领域，涉及一种微型文本检测方法、计算机设备及存储介质。

技术介绍

1、场景文本检测在自动驾驶、金融安全、图像检索等各个领域都有应用，因其重要性和广阔的前景而受到越来越多的关注。同时，它仍然带来了重大挑战，例如复杂的背景干扰、文本重叠以及各种文本形状和大小。近年来，研究人员尝试了多种方法进行场景文本区域检测，总结起来大致可分为两类：基于机器学习的方法和基于深度学习的方法。

2、传统的机器学习方法中，基于最大稳定极值区域的检测算法通过提取图像中的局部极值区域，并对其进行过滤和合并得到候选文本区域。基于笔划宽度变换(stroke widthtransform，swt)的检测算法通过canny边缘检测算法来检测图像中的边缘，并将边缘连接成连通区域，根据swt值的方差和均值来过滤掉非文本区域。基于滑动窗口的检测算法在图像上以固定大小的窗口进行滑动，检测窗口内是否存在文本。传统的文本区域检测方法需要手工设计复杂的特征、分类器以及后处理流程，这些技术难以满足复杂的自然场景文本检测需求。

3、基于深度学习的方法可细分为三类：基于回归的文本检测方法、基于分割的文本检测方法和基于部件的文本检测方法。基于回归的文本检测方法受到目标检测领域的yolo和faster r-cnn等算法的启发，使用边界框回归参数来矫正区域建议网络生成的多个不同尺寸的候选框。该类型的算法准确率较高，速度快，然而此类算法由于自然场景中的文本形状各异，尺寸和宽高比差异极大，预先设定的候选框尺寸大小无法近似匹配真实文本实例。基于分割

4、然而，上述几种方法在检测微型文本(区域)时存在一些缺陷，这是由于微型文本的特殊性、各种外部干扰以及训练数据不足造成的，由此，需要对微型文本检测方法进行改进。

技术实现思路

1、本专利技术的目的在于提出一种微型文本检测方法，该方法基于尺度敏感损失和特征有效融合因子，能够对微型文本更敏感，利于提高微型文本区域检测的准确性。

2、本专利技术为了实现上述目的，采用如下技术方案：

3、一种微型文本检测方法，包括如下步骤：

4、步骤1.准备训练数据集，对训练数据先经过预处理，包括图像增强和标签制作；

5、步骤2.搭建微型文本检测模型，该微型文本检测模型包括主干网络、上下文提取模块、注意力指导模块、特征融合模块、文本预测模块以及可微二值化模块；

6、输入图像在微型文本检测模型中的处理流程如下：

7、首先输入图像到主干网络中进行图像特征提取，将提取到的深层特征输入到上下文提取模块中以提取丰富的上下文信息，并使用注意力指导模块来捕获有效的上下文依赖关系；

8、然后特征融合模块利用特征有效融合因子进行自适应特征融合，生成级联特征图；

9、在文本预测模块中使用级联特征图进行文本预测生成概率图和阈值图；

10、概率图和阈值图进入可微二值化模块，通过可微二值化得到二值图，将二值图中值为1的像素点连通起来得到收缩后的文本，并以偏移量扩大收缩后的文本，得到文本边界框；

11、步骤3.利用训练数据集对步骤2搭建的微型文本检测模型进行训练，得到训练好的微型文本检测模型，最后利用训练好的微型文本检测模型实现微型文本区域的检测。

12、此外，在微型文本检测方法的基础上，本专利技术还提出了一种计算机设备，该计算机设备包括存储器和一个或多个处理器。所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，用于实现上面述及的微型文本检测方法的步骤。

13、此外，在微型文本检测方法的基础上，本专利技术还提出了一种计算机可读存储介质，其上存储有程序。该程序被处理器执行时，用于实现上面述及的微型文本检测方法的步骤。

14、本专利技术具有如下优点：

15、如上所述，本专利技术述及了一种微型文本检测方法，该检测方法通过集成上下文提取模块和注意力指导模块来增强模型架构，使其更适合微型文本的检测，本专利技术提出的特征有效融合因子，能够使模型自适应控制从深层特征到浅层特征传递的信息，有效突出微小的文本特征。在损失函数计算方面，本专利技术提出了一种尺度敏感损失，它可以更公平地处理不同大小的文本，在保持准确性的同时，所提出的方法能够有效地减少了微型文本的漏检。本专利技术还提出了一种可微分二值化模块th-db，能够在提升模型性能的同时进一步缩短模型的推理时间。本专利技术方法在检测微型文本方面具有高敏感度和高精确度，并在icdar2015上取得了86.0％的f1-score，本专利技术还在ctw1500和total-text上比较了该方法的优越性。

本文档来自技高网...

【技术保护点】

1.一种微型文本检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的微型文本检测方法，其特征在于，

3.根据权利要求2所述的微型文本检测方法，其特征在于，

4.根据权利要求2所述的微型文本检测方法，其特征在于，

5.根据权利要求2所述的微型文本检测方法，其特征在于，

6.根据权利要求5所述的微型文本检测方法，其特征在于，

7.根据权利要求1所述的微型文本检测方法，其特征在于，

8.根据权利要求1所述的微型文本检测方法，其特征在于，

9.一种计算机设备，包括存储器和一个或多个处理器，所述存储器中存储有可执行代码，其特征在于，所述处理器执行所述可执行代码时，实现如权利要求1至8任一项所述的微型文本检测方法的步骤。

10.一种计算机可读存储介质，其上存储有程序，其特征在于，该程序被处理器执行时，实现如权利要求1至8任一项所述的微型文本检测方法的步骤。

【技术特征摘要】

1.一种微型文本检测方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的微型文本检测方法，其特征在于，

3.根据权利要求2所述的微型文本检测方法，其特征在于，

4.根据权利要求2所述的微型文本检测方法，其特征在于，

5.根据权利要求2所述的微型文本检测方法，其特征在于，

6.根据权利要求5所述的微型文本检测方法，其特征在于，

7.根据权利要求1所述的微型文...

【专利技术属性】
技术研发人员：魏光村，付纪华，李海鹏，潘志飞，方卿阁，马鹏浩，孔垂珂，徐浩辰，
申请(专利权)人：山东科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人