一种基于特征校正和差异指导注意力的文本检测方法技术

技术编号：40901430 阅读：19 留言：0更新日期：2024-04-18 11:19

本发明专利技术公开了一种基于特征校正和差异指导注意力的文本检测方法，步骤：以一张自然场景图像作为输入，骨干网络提取多级特征；将骨干网络的多级输出特征的高层级特征送入TFCM，对亚像素卷积特征进行两阶段特征校正，再从最高级特征开始逐级向下与低层级特征特征融合，得到融合特征；DGAM利用融合特征和最低级特征的差异信息对融合特征分别进行通道和空间维度上的细节信息补偿；输出模块输出文本预测框。本发明专利技术通过TFCM对亚像素卷积特征进行特征校正，可显著提升上采样特征的质量；通过DGAM对融合特征进行细节信息补偿，可有效补偿边缘细节信息，使得网络更准确地分割文本边界，从而获得更准确的文本检测结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于文本检测，特别涉及一种基于特征校正和差异指导注意力的文本检测方法。

技术介绍

1、文本检测技术是从场景图像中提取文本信息的核心技术之一。自然场景文本检测技术旨在旨在检测自然场景图像中的文本区域，并使用四边形或多边形边界框对其进行定位。作为文本信息提取的第一步，文本检测的准确性直接影响着后续的字符识别任务，对能否成功提取出文本信息起着至关重要的作用。除此之外，文本在图像中的定位信息还可以作为先验知识来辅助完成图像理解、图像版面分析等诸多视觉任务。因此自然场景文本检测技术是计算机视觉领域中的一项关键性技术。

2、作为一项面向具体应用的技术，自然场景文本检测技术在诸多领域有着广泛的实际应用。在自动驾驶领域：利用文本检测与识别技术提取交通路标和指示牌等文本信息，并根据信息来判断路况、躲避危险等，确保自动驾驶的安全性和可靠性；在视盲辅助领域，便携式视觉系统采集用户周围场景的图像并进行文本检测，获取其中的文本信息为用户进行语音播报，为视觉障碍人士的生活提供极大便利；在图像检索领域，借助于文本检测与识别技术，可以提取出文本等...

【技术保护点】

1.一种基于特征校正和差异指导注意力的文本检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于特征校正和差异指导注意力的文本检测方法，其特征在于，所述将高层级特征送入两阶段特征校正模块，对亚像素卷积特征进行两阶段的特征校正，再与低层级特征融合，具体步骤包括：

3.根据权利要求2所述的基于特征校正和差异指导注意力的文本检测方法，其特征在于，步骤A14中，所述将四级特征进行特征整合，具体包括：先将四级特征通过双线性插值的方式将分辨率调整到相同大小，均为输入图像的1/4；然后通过3×3卷积层将特征的通道数降为64；再将四级特征沿通道维度拼接到一起，得到多尺...

【技术特征摘要】

1.一种基于特征校正和差异指导注意力的文本检测方法，其特征在于，包括以下步骤：

3.根据权利要求2所述的基于特征校正和差异指导注意力的文本检测方法，其特征在于，步骤a14中，所述将四级特征进行特征整合，具体包括：先将四级特征通过双线性插值的方式将分辨率调整到相同大小，均为输入图像的1/4；然后通过3×3卷积层将特征的通道数降为64；再将四级特征沿通道维度拼接到一起，得到多尺度融合特征f*，特征整合过程通过下式表示：

4.根据权利要求1所述的基于特征校正和差异指导注意力的文本检测方法，其特征在于，步骤s3中，所述通过差异指导注意力模块对(多尺度)融合...

【专利技术属性】
技术研发人员：李素梅，张慧林，张海妍，
申请(专利权)人：天津大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人