一种文字大小检测方法、装置及存储介质制造方法及图纸

技术编号：32529203 阅读：24 留言：0更新日期：2022-03-05 11:22

本发明专利技术公开了一种文字大小检测方法、装置及存储介质，包括获取文字数据；对文字数据中的每个文字进行检测并做文本框标记，识别得到文字的类别、文本框的第一坐标信息和文字的旋转角度；根据第一坐标信息和旋转角度，对文字进行角度矫正，并得到第二坐标信息；根据第二坐标信息，转换得到文字的字号大小；提高了检测效率和精准度，节约了人力物力，模型体积小，速度较快，精度高，泛化能力强，通用性好，稳定性佳。性佳。性佳。

全部详细技术资料下载

【技术实现步骤摘要】
一种文字大小检测方法、装置及存储介质

[0001]本专利技术涉及数据处理领域，特别是一种文字大小检测方法、装置及存储介质。

技术介绍

[0002]在现有的文字大小检测技术中，主要分为两大类：一类是基于传统图像处理算法实现的，另一类则是基于深度学习的算法实现的。基于传统图像处理算法实现的文字检测方法，其速度较快，对硬件要求也不高，但其检测精度较差，泛化能力不强，表现很不稳定，通常只能适应一种特定场景或格式。基于深度学习的文字检测算法，其精度高，检测到的文本框更贴近实际区域，泛化能力较强，通用性更好，稳定性更佳；然而，但也存在模型体积较大、漏检的问题。

技术实现思路

[0003]本专利技术的目的在于至少解决现有技术中存在的技术问题之一，提供一种文字大小检测方法、装置及存储介质。
[0004]本专利技术解决其问题所采用的技术方案是：
[0005]本专利技术的第一方面，一种文字大小检测方法，包括：
[0006]获取文字数据；
[0007]对所述文字数据中的每个文字进行检测并做文本框标记...

【技术保护点】

【技术特征摘要】
1.一种文字大小检测方法，其特征在于，包括：获取文字数据；对所述文字数据中的每个文字进行检测并做文本框标记，识别得到所述文字的类别、所述文本框的第一坐标信息和所述文字的旋转角度；根据所述文本框的第一坐标信息和所述文字的旋转角度，对所述文字进行角度矫正，并得到经角度矫正后的所述文本框的第二坐标信息；根据所述第二坐标信息，转换得到所述文字的字号大小。2.根据权利要求1所述的一种文字大小检测方法，其特征在于，所述文本框标记为矩形文本框，所述文本框贴合所述文字设置。3.根据权利要求1所述的一种文字大小检测方法，其特征在于，所述识别得到所述文字的类别、所述文本框的第一坐标信息和所述文字的旋转角度，包括：对所述文字数据进行特征提取，得到目标特征；根据所述目标特征进行分类，得到所述文字的类别、所述文本框的第一坐标信息和所述文字的旋转角度。4.根据权利要求3所述的一种文字大小检测方法，其特征在于，所述对所述文字数据进行特征提取，得到目标特征，包括：将所述文字数据输入依次连接的多个特征提取子模块进行特征提取，将最后一个所述特征提取子模块的输出作为所述目标特征，其中前一个所述特征提取子模块的输出作为后一个所述特征提取子模块的输入。5.根据权利要求4所述的一种文字大小检测方法，其特征在于，在每个所述特征提取子模块中执行以下步骤：将输入数据从通道层面分割成多个第一子数据；对每个所述第一子数据，将所述第一子数据输入至注意力模块中，将所述第一子数据从通道层面分割成多个第二子数据，对每个所述第二子数据进行卷积计算得到卷积结果，将多个所述卷积结果进行注意力计...

【专利技术属性】
技术研发人员：梁继允，冯南飞，张哲，朱正元，谭晓悦，杨紫晴，
申请(专利权)人：深圳赛西信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人