当前位置: 首页 > 专利查询>山西大学专利>正文

基于边缘特征增强的任意形状文本检测方法技术

技术编号:37108992 阅读:47 留言:0更新日期:2023-04-01 05:07
本发明专利技术属于图像处理技术领域,具体涉及一种基于边缘特征增强的任意形状文本检测方法,主要解决了现有基于深度学习文本检测方法对于文本对象检测不准确的问题。本发明专利技术将现有基于深度学习的文本检测方法作为文本检测分支,首先增添文本边缘区域检测分支从而提高模型对文本边缘区域的检测能力,然后通过浅层特征增强模块使得模型能够更多地提取到与边缘区域相关地浅层特征,最后,模型通过分支特征融合模块通过注意力机制突出两个检测分支的特征中的相关特征,并在进行融合后对两个检测分支进行调整。本发明专利技术的优点在于通过增强模型对于文本边缘相关特征的提取,提高了文本检测的精度。精度。精度。

【技术实现步骤摘要】
基于边缘特征增强的任意形状文本检测方法


[0001]本专利技术涉及图像处理
,尤其涉及任意场景的一种基于边缘特征增强的任意形状文本检测方法。

技术介绍

[0002]传统场景文本检测方法主要使用了文本区域的形状、边缘等特征对文本区域进行检测,而相较于传统的检测方法,基于深度学习的检测方法能够提取到与文本对象更相关、更深层的特征,尤其是多尺度的复杂特征,由于场景文本检测的精度与文本区域的特征提取密切相关,基于深度学习的检测方法往往能够得到更高的文本检测精度。
[0003]自然场景中的文本对象通常具有不同的形状,在对文本对象的检测过程中,准确地检测任意形状文本是提高文本检测精度的关键。因此,在基于回归和基于分割的两种文本检测方法的基础上,很多研究工作对于任意形状文本对象检测的方法进行相应改进。在基于回归的检测方法方面,相关研究通常对于所回归的文本包围框进行改进,一个常见的方法是改进文本包围框的表示方式,另一种方法是根据文本区域特征对初步得到的文本框使用子网络进行调整;而在基于语义分割的检测方法方面,主要通过在进行分割时增加不同类别像素之本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于边缘特征增强的任意形状文本检测方法,其特征在于,所述方法包括以下3个步骤:步骤A:获取所包含文本对象边界框标记的图像集合作为训练样本集,并对训练样本集中的每一幅图像进行预处理;步骤B:利用基于残差网络的深度学习模型对步骤A所述训练样本进行训练,得到训练好的文本检测学习模型;步骤C:对没有标记的训练集图像,根据步骤B所述的训练好的学习模型对其进行预测,得到文本区域分割图以及内核区域分割图,并使用PSE算法通过渐进扩张的方式得到最终的文本区域预测结果。2.根据权利要求1所述的基于边缘特征增强的任意形状文本检测方法,其特征在于,步骤A所述的对训练样本集中的每一幅图像进行预处理,具体为:步骤A1、使用多边形裁剪算法得到原文本区域标记的收缩文本框和扩张文本框;步骤A2、根据原标记文本框得到完整文本区域标记分割图,根据收缩的边界框得到内核区域标记分割图,根据收缩文本框和扩张文本框得到文本边缘区域标记分割图;步骤A3、将训练样本中的图像随机剪切成640
×
640像元固定大小的图像,之后在水平方向进行随机翻转并进行随机缩放和随机选择,并进行归一化处理。3.根据权利要求1所述的基于边缘特征增强的任意形状文本检测方法,其特征在于,步骤B所述基于残差网络(ResNet)的深度学习模型具体为:步骤B1、将所述步骤A中预处理过的样本图像作为ResNet的输入,得到ResNet特征图F
R
,并使用特征金字塔(FPN)进行初步的特征融合得到特征F
f1
;步骤B2、浅层特征增强模块首先使用卷积处理特征F
o
获取各像元在更大尺度上的深层特征F
h
,将深层特征F
h
从融合后的特征F
f1
中以相减的方式剥离得到尽可能保留更多浅层信息的特征F
l
;随后,将特征F
l
同FPN最高分辨率的特征F
P2
进行拼接和卷积以增强浅层特征得到特征F
le
;最后将特征F
le
与特征F
h
逐像元相加作为后续文本检测的图像特征F
e
;步骤B3、将特征F
e
通过不同的卷积处理以构建面向文本实例与其边缘的特征,得到文本区域特征F
t
和文本边缘区域特征F
b
;为了突出最具有代表性的特征并抑制无关特征,分别对特征F
t
...

【专利技术属性】
技术研发人员:白鹤翔王浩然
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1