基于迭代优化与交叉知识增强的任意形状文本检测方法技术

技术编号:41221504 阅读:21 留言:0更新日期:2024-05-09 23:41
本发明专利技术公开了基于迭代优化与交叉知识增强的任意形状文本检测方法,涉及自然场景文本检测技术领域。本发明专利技术与之前的文本信息检测相比,改进了现有边界迭代方法的处理流程复杂,仅应用于单一尺度下的特征,计算量较大,无法满足实际应用的要求的问题,通过语义分割获取表征先验信息并进行初始边界点的生成,并通过特征增强将表征先验语义信息与跨尺度特征信息进行融合使其特征具备丰富的语义信息,并通过一个统一的能够充分利用多尺度信息的边界迭代Transformer来预测边界偏移值从而不断优化初始边界点。本方法简单高效的网络流程可以大大降低网络复杂度并高效的利用跨尺度信息和表征语义信息使其能够兼顾实时检测的速度和性能要求。

【技术实现步骤摘要】

本专利技术涉及自然场景文本检测,尤其涉及基于迭代优化与交叉知识增强的任意形状文本检测方法


技术介绍

1、随着信息技术的迅速发展,各类图像视频设备在人类社会生活中得到了广泛地应用,海量增长的图像数据已成为当今社会获取信息的主要来源。这些设备在产生大量图像的同时,也蕴含着重要的文本信息,其特定的语义知识对场景内容理解至关重要。但受开放场景下光照、字体大小、形状、排布、语种、复杂背景等综合因素影响,相对成熟的光学字符识别(optical character recognition,ocr)已然不能适应复杂场景下的文本检测任务,因此,如何突破复杂场景下拍摄随机性对文本检测任务的限制,进而提高文本检测精度与效率,已成为实现场景语义理解与达到人类视觉认知的科学前沿问题。近年来,随着文本检测方法的发展,大致可分为两大类:自底向上(即首先检测像素或片段,然后通过各种后处理算法将这些成分聚合在一起,产生最终的检测结果)、自顶向下(即将每个文本目标当做一个整体来预测),然而这些方法都无法实现令人满意的性能要求。现有文献“progressivecontour regressi本文档来自技高网...

【技术保护点】

1.基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,所述S1中的FPN对Ci进行融合得到UPj的融合过程具体如下:

3.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,S2中所述先验语义特征图包括文本置信度图、距离图和二维方向图。

4.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,所述S3中的信息融合过程具体如下:

5.根据权利要求1所述的基于迭代优化与交叉...

【技术特征摘要】

1.基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,所述s1中的fpn对ci进行融合得到upj的融合过程具体如下:

3.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,s2中所述先验语义特征图包括文本置信度图、距离图和二维方向图。

4.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征...

【专利技术属性】
技术研发人员:孙巍王乾宙崔睿嘉孔宪光
申请(专利权)人:西安邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1