【技术实现步骤摘要】
本专利技术涉及自然场景文本检测,尤其涉及基于迭代优化与交叉知识增强的任意形状文本检测方法。
技术介绍
1、随着信息技术的迅速发展,各类图像视频设备在人类社会生活中得到了广泛地应用,海量增长的图像数据已成为当今社会获取信息的主要来源。这些设备在产生大量图像的同时,也蕴含着重要的文本信息,其特定的语义知识对场景内容理解至关重要。但受开放场景下光照、字体大小、形状、排布、语种、复杂背景等综合因素影响,相对成熟的光学字符识别(optical character recognition,ocr)已然不能适应复杂场景下的文本检测任务,因此,如何突破复杂场景下拍摄随机性对文本检测任务的限制,进而提高文本检测精度与效率,已成为实现场景语义理解与达到人类视觉认知的科学前沿问题。近年来,随着文本检测方法的发展,大致可分为两大类:自底向上(即首先检测像素或片段,然后通过各种后处理算法将这些成分聚合在一起,产生最终的检测结果)、自顶向下(即将每个文本目标当做一个整体来预测),然而这些方法都无法实现令人满意的性能要求。现有文献“progressivecontou
...【技术保护点】
1.基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,所述S1中的FPN对Ci进行融合得到UPj的融合过程具体如下:
3.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,S2中所述先验语义特征图包括文本置信度图、距离图和二维方向图。
4.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,所述S3中的信息融合过程具体如下:
5.根据权利要求1所述
...【技术特征摘要】
1.基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,所述s1中的fpn对ci进行融合得到upj的融合过程具体如下:
3.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征在于,s2中所述先验语义特征图包括文本置信度图、距离图和二维方向图。
4.根据权利要求1所述的基于迭代优化与交叉知识增强的任意形状文本检测方法,其特征...
【专利技术属性】
技术研发人员:孙巍,王乾宙,崔睿嘉,孔宪光,
申请(专利权)人:西安邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。