一种文本检测方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号：32465597 阅读：59 留言：0更新日期：2022-02-26 09:03

本申请公开了一种文本检测方法、装置、电子设备及可读存储介质。其中，方法包括判断原始图像是有雾图像还是无雾图像；若原始图像为有雾图像，则对原始图像执行去雾操作，得到待检测图像；将待检测图像输入至预先构建的基于视觉转换器的文本检测模型，得到原始图像中文本的位置信息；其中，该基于视觉转换器的文本检测模型的序列特征采用视觉转换器模块进行提取，其后处理方法采用预设位置精细检测方法确定原始图像中文本的位置信息；该预设位置精细检测方法为基于交并比以及置信度分数将NMS和Soft

全部详细技术资料下载

【技术实现步骤摘要】
一种文本检测方法、装置、电子设备及可读存储介质

[0001]本申请涉及图像处理
，特别是涉及一种文本检测方法、装置、电子设备及可读存储介质。

技术介绍

[0002]图像中不可避免会有文本，相应的，从图像中检测、识别并提取文本的技术也就应用而生。目前已经提出了许多有效的文本检测方法，并取得了一些令人满意的结果。然而，这些方法主要是针对非雾场景中的文本检测而设计的。
[0003]可以理解的是，有雾场景是很常见的，对雾场景下的文本的检查也是很有必要的。传统的雾检测方法可以有效地利用雾的某种特征来区分雾图像和非雾图像。基于灰度直方图的方法是计算灰度直方图的特征参数，再利用一系列阈值确定原始图像所属的雾级。然而，对于颜色与雾相似的文本，传统方法并不会检测出这些文本，导致最终文本检测精度较低，并无法满足用户需求。
[0004]鉴于此，如何提升文本检测精度，是所属领域技术人员需要解决的技术问题。

技术实现思路

[0005]本申请提供了一种文本检测方法、装置、电子设备及可读存储介质，可以有效提升文本检测精度。
[0006]为解决上述技术问题，本专利技术实施例提供以下技术方案：本专利技术实施例一方面提供了一种文本检测方法，包括：判断原始图像是有雾图像还是无雾图像；若所述原始图像为有雾图像，则对所述原始图像执行去雾操作，得到待检测图像；将所述待检测图像输入至预先构建的基于视觉转换器的文本检测模型，得到所述原始图像中文本的位置信息；其中，所述文本检测模型的序列特征采用视觉转换器模块进行提取，所...

【技术保护点】

【技术特征摘要】
1.一种文本检测方法，其特征在于，包括：判断原始图像是有雾图像还是无雾图像；若所述原始图像为有雾图像，则对所述原始图像执行去雾操作，得到待检测图像；将所述待检测图像输入至预先构建的基于视觉转换器的文本检测模型，得到所述原始图像中文本的位置信息；其中，所述文本检测模型的序列特征采用视觉转换器模块进行提取，所述文本检测模型的后处理方法采用预设位置精细检测方法确定所述原始图像中文本的位置信息；所述预设位置精细检测方法为基于交并比以及置信度分数将非极大值抑制方法NMS和缓和的非极大值抑制方法Soft
‑
NMS融合所得。2.根据权利要求1所述的文本检测方法，其特征在于，所述判断原始图像是有雾图像还是无雾图像，包括：预先利用训练样本集训练雾检测模型，所述雾检测模型包括特征提取层、特征输出层和特征识别层；将所述原始图像输入至所述雾检测模型；根据所述雾检测模型的输出结果判断所述原始图像是有雾图像还是无雾图像；其中，所述特征提取层包括多个卷积结构，所述特征输出层包括多个全连接层，所述特征识别层利用第一函数计算所述特征输出层输出特征属于雾天图像特征的概率值，并利用第二函数输出分类结果。3.根据权利要求2所述的文本检测方法，其特征在于，所述训练样本集包括多张雾天场景的文本图像，所述根据所述雾检测模型的输出结果判断所述原始图像是有雾图像还是无雾图像，包括：若根据所述雾检测模型的输出结果判定所述原始图像为有雾图像，则获取所述原始图像的灰度直方图，以基于直方图统计方法进行雾检测；统计所述灰度直方图中超过预设个数阈值的目标像素点的总个数；若所述总个数大于等于预设类别阈值，则所述原始图像为有雾图像；若所述总个数小于所述预设类别阈值，则所述原始图像为无雾图像。4.根据权利要求1所述的文本检测方法，其特征在于，所述对所述原始图像执行去雾操作，包括：将所述原始图像输入至预先训练的深度模型，得到所述原始图像的深度图；所述深度图是由雾图生成的；调用修正计算关系式对所述深度图进行修正处理，得到校正深度图；调用复原计算关系式对所述校正深度图进行图像复原处理，以得到所述待检测图像。5.根据权利要求1至4任意一项所述的文本检测方法，其特征在于，所述将所述待检测图像输入至预先构建的基于视觉转换器的文本检测模型，得到所述原始图像中文本的位置信息，包括：对经过图像预处理的所述待检测图像进行文本间的空间特征的提取，得到空间特征图；所述空间特征图采用视觉转换器模块；根据所述空间特征图提取文本间的序列特征，并将所述序列特征输入至全连接层以执行分类和回归操作，得到各...

【专利技术属性】
技术研发人员：王润民，刘莹莹，朱桂林，陈华，朱姿諭，刘明昊，张翔宇，代建华，丁亚军，
申请(专利权)人：湖南师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人