【技术实现步骤摘要】
文字检测方法、系统、设备及存储介质
本专利技术涉及文本检测
,尤其涉及一种文字检测方法、系统、设备及存储介质。
技术介绍
场景文本检测技术旨在定位场景图像中的文本区域,其在自动驾驶,商标识别,盲人导向等计算机视觉任务中发挥着重要的作用。近年来,基于边界点的文本表示方式较为流行,主要因为边界点可以更灵活地贴合曲形文本的形状,曲形文本的检测任务十分受用。然而,背景中与文本纹理相似的区域很容易被模型误判为文本区域,所以直接将边界点的分割或回归结果用于后续文本定位是不准确的。目前的文本检测方法仅在二维空间对于文本区域的特征表达,由于二维空间的限制,一些背景噪声无法很好地消除,使得于文本区域表达不准确。
技术实现思路
本申请实施例通过提供一种文字检测方法、系统、设备及存储介质,旨在解决现有技术中文本检测方法仅在二维空间对于文本区域的特征进行表达,无法很好地消除文本区域背景噪声的问题。本申请实施例提供了一种文字检测方法,该方法包括:采用残差网络进行特征提取得到特征图像;对所述特征 ...
【技术保护点】
1.一种文字检测方法,其特征在于,包括:/n采用残差网络进行特征提取得到特征图像;/n对所述特征图像进行上下文注意力处理,生成语义增强特征图;/n对所述语义增强特征图采用金字塔网络进行处理,生成共享特征图;/n对所述共享特征图采用区域提案网络进行处理,获得预测建议框;/n基于所述预测建议框,采用边界分割分支获得候选边界点;/n采用与所述边界分割分支并行的像素级嵌入分支对所述候选边界点进行过滤,得到最终边界点,以定位文本区域。/n
【技术特征摘要】
1.一种文字检测方法,其特征在于,包括:
采用残差网络进行特征提取得到特征图像;
对所述特征图像进行上下文注意力处理,生成语义增强特征图;
对所述语义增强特征图采用金字塔网络进行处理,生成共享特征图;
对所述共享特征图采用区域提案网络进行处理,获得预测建议框;
基于所述预测建议框,采用边界分割分支获得候选边界点;
采用与所述边界分割分支并行的像素级嵌入分支对所述候选边界点进行过滤,得到最终边界点,以定位文本区域。
2.如权利要求1所述的方法,其特征在于,所述采用残差网络进行特征提取得到特征图像的步骤,包括:
获取文本图像;
对所述文本图像进行卷积运算,生成所述特征图像。
3.如权利要求2所述的方法,其特征在于,所述对所述特征图像进行上下文注意力处理,生成语义增强特征图的步骤,包括:
采用1×1的卷积核对所述特征图像进行线性映射,得到第一预处理特征图;
计算所述第一预处理特征图的自相关性,并根据所述自相关性,对所述第一预处理特征图与所述特征图像做残差运算,得到第一分支输出;
对所述特征图像进行1×1卷积,得到第二预处理特征图;
采用归一层对所述第二预处理特征图与所述特征图做残差运算,得到第二分支输出;
分别对所述第一分支输出和所述第二分支输出进行3×3卷积,将所述第一分支输出的卷积结果和所述第二分支输出的卷积结果进行相加,得到卷积和,并对所述卷积和进行串联以及1×1卷积,得到所述语义增强特征图。
4.如权利要求1所述的方法,其特征在于,所述对所述语义增强特征图采用金字塔网络进行处理,生成共享特征图的步骤,包括:
对所述语义增强特征图和所述特征图像进行高低层级语义特征融合,生成所述共享特征图。
5.如权利要求1所述的方法,其特征在于,所述对所述共享特征图采用区域提案网络进行处理,获得预测建议框的步骤,包括:
采用预置锚框对所述共享特征图进行预测,得到区域建议框;
采用微调网络对所述区域建议框进行调整,生成所述预测建议框。
<...
【专利技术属性】
技术研发人员:张勇东,行梦婷,谢洪涛,
申请(专利权)人:合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。