【技术实现步骤摘要】
本专利技术属于文本检测,特别涉及一种基于特征校正和差异指导注意力的文本检测方法。
技术介绍
1、文本检测技术是从场景图像中提取文本信息的核心技术之一。自然场景文本检测技术旨在旨在检测自然场景图像中的文本区域,并使用四边形或多边形边界框对其进行定位。作为文本信息提取的第一步,文本检测的准确性直接影响着后续的字符识别任务,对能否成功提取出文本信息起着至关重要的作用。除此之外,文本在图像中的定位信息还可以作为先验知识来辅助完成图像理解、图像版面分析等诸多视觉任务。因此自然场景文本检测技术是计算机视觉领域中的一项关键性技术。
2、作为一项面向具体应用的技术,自然场景文本检测技术在诸多领域有着广泛的实际应用。在自动驾驶领域:利用文本检测与识别技术提取交通路标和指示牌等文本信息,并根据信息来判断路况、躲避危险等,确保自动驾驶的安全性和可靠性;在视盲辅助领域,便携式视觉系统采集用户周围场景的图像并进行文本检测,获取其中的文本信息为用户进行语音播报,为视觉障碍人士的生活提供极大便利;在图像检索领域,借助于文本检测与识别技术,可以提取出文本等
...【技术保护点】
1.一种基于特征校正和差异指导注意力的文本检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于特征校正和差异指导注意力的文本检测方法,其特征在于,所述将高层级特征送入两阶段特征校正模块,对亚像素卷积特征进行两阶段的特征校正,再与低层级特征融合,具体步骤包括:
3.根据权利要求2所述的基于特征校正和差异指导注意力的文本检测方法,其特征在于,步骤A14中,所述将四级特征进行特征整合,具体包括:先将四级特征通过双线性插值的方式将分辨率调整到相同大小,均为输入图像的1/4;然后通过3×3卷积层将特征的通道数降为64;再将四级特征沿通道维度
...【技术特征摘要】
1.一种基于特征校正和差异指导注意力的文本检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于特征校正和差异指导注意力的文本检测方法,其特征在于,所述将高层级特征送入两阶段特征校正模块,对亚像素卷积特征进行两阶段的特征校正,再与低层级特征融合,具体步骤包括:
3.根据权利要求2所述的基于特征校正和差异指导注意力的文本检测方法,其特征在于,步骤a14中,所述将四级特征进行特征整合,具体包括:先将四级特征通过双线性插值的方式将分辨率调整到相同大小,均为输入图像的1/4;然后通过3×3卷积层将特征的通道数降为64;再将四级特征沿通道维度拼接到一起,得到多尺度融合特征f*,特征整合过程通过下式表示:
4.根据权利要求1所述的基于特征校正和差异指导注意力的文本检测方法,其特征在于,步骤s3中,所述通过差异指导注意力模块对(多尺度)融合...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。