【技术实现步骤摘要】
本专利技术涉及计算机视觉,具体为一种基于上下文引导和语义补偿的任意场景文本检测方法。
技术介绍
1、近年来,随着现代智能手机、运动相机和无人机等各种移动终端的普及和应用,自然场景图像呈爆炸式增长。自然场景图像中通常包含着丰富的文本信息,如交通路牌的指示信息、快递单上的收寄人信息、商品表面的介绍说明和店铺招牌的广告信息等等。这些文本信息携带大量的语义信息,因此通过理解分析场景图像中的文本信息能够大幅度提高各种应用场景中的工作效率,以及辅助其他计算机视觉任务。从场景图像中提取文本信息可以分为文本检测和文本识别两个步骤。文本检测的任务是从图像中定位并检测出文本区域,文本识别的任务是将图像中的文本转化为计算机可处理的字符或单词序列。文本检测作为文本信息提取的第一步,文本检测结果的准确性直接影响到后续文本识别任务。因此,设计一种检测精度高、检测速度快、泛化性强的自然场景文本检测算法,具有重要的研究价值和实际意义。
2、目前,场景文本检测技术已经在多个领域得到了广泛应用。在自动驾驶领域:通过文本检测与识别技术实时识别道路上的交通路标、指
...【技术保护点】
1.一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述方法通过基于上下文引导和语义补偿的任意场景文本检测系统实现,所述系统包括骨干网络、上下文引导的特征增强模块、高级语义信息补偿模块以及输出模块;
2.根据权利要求1所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述S1具体包括如下内容:
3.根据权利要求2所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述上下文注意力引导的特征增强模块包括基于小波卷积的形状校准分支、全局自注意力分支、通道注意力分支,其中:
4.根据权
...【技术特征摘要】
1.一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述方法通过基于上下文引导和语义补偿的任意场景文本检测系统实现,所述系统包括骨干网络、上下文引导的特征增强模块、高级语义信息补偿模块以及输出模块;
2.根据权利要求1所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述s1具体包括如下内容:
3.根据权利要求2所述的一种基于上下文引导和语义补偿的任意场景文本检测方法,其特征在于,所述上下文注意力引导的特...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。