当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于上下文引导和语义补偿的任意场景文本检测方法技术

技术编号:46056978 阅读:8 留言:0更新日期:2025-08-11 15:43
本发明专利技术公开了一种基于上下文引导和语义补偿的任意场景文本检测方法,属于计算机视觉技术领域;本发明专利技术提出了一种基于上下文引导和语义补偿的任意场景文本检测方法,旨在解决文本边界区域错误分割的问题,以精准定位场景图像中的文本实例。本发明专利技术主要包括上下文引导的特征增强模块、高级语义信息补偿模块,其中上下文力引导的特征增强模块通过结合卷积和注意力,学习局部和全局上下文信息,对复杂的文本特征进行充分建模;而高级语义补偿模块能够弥补了融合特征中缺失的高级语义信息,从而增强了特征表达的语义丰富性和准确性。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,具体为一种基于上下文引导和语义补偿的任意场景文本检测方法


技术介绍

1、近年来,随着现代智能手机、运动相机和无人机等各种移动终端的普及和应用,自然场景图像呈爆炸式增长。自然场景图像中通常包含着丰富的文本信息,如交通路牌的指示信息、快递单上的收寄人信息、商品表面的介绍说明和店铺招牌的广告信息等等。这些文本信息携带大量的语义信息,因此通过理解分析场景图像中的文本信息能够大幅度提高各种应用场景中的工作效率,以及辅助其他计算机视觉任务。从场景图像中提取文本信息可以分为文本检测和文本识别两个步骤。文本检测的任务是从图像中定位并检测出文本区域,文本识别的任务是将图像中的文本转化为计算机可处理的字符或单词序列。文本检测作为文本信息提取的第一步,文本检测结果的准确性直接影响到后续文本识别任务。因此,设计一种检测精度高、检测速度快、泛化性强的自然场景文本检测算法,具有重要的研究价值和实际意义。

2、目前,场景文本检测技术已经在多个领域得到了广泛应用。在自动驾驶领域:通过文本检测与识别技术实时识别道路上的交通路标、指示牌、车牌等标志,自本文档来自技高网...

【技术保护点】

1.一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述方法通过基于上下文引导和语义补偿的任意场景文本检测系统实现,所述系统包括骨干网络、上下文引导的特征增强模块、高级语义信息补偿模块以及输出模块;

2.根据权利要求1所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述S1具体包括如下内容:

3.根据权利要求2所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述上下文注意力引导的特征增强模块包括基于小波卷积的形状校准分支、全局自注意力分支、通道注意力分支,其中:

4.根据权利要求3所述的一种基...

【技术特征摘要】

1.一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述方法通过基于上下文引导和语义补偿的任意场景文本检测系统实现,所述系统包括骨干网络、上下文引导的特征增强模块、高级语义信息补偿模块以及输出模块;

2.根据权利要求1所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述s1具体包括如下内容:

3.根据权利要求2所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述上下文注意力引导的特...

【专利技术属性】
技术研发人员:田梦圆李素梅
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1