字符检测方法、装置、电子设备及可读介质制造方法及图纸

技术编号：33532176 阅读：75 留言：0更新日期：2022-05-19 02:05

本发明专利技术实施例提供了一种字符检测方法、装置、电子设备及可读介质，方法包括：获取包含待检测的字符的图像，将图像输入特征提取模型，得到图像的图像特征，将图像的图像特征输入字符定位模型，得到字符的定位框和定位框的图像特征，对定位框的图像特征进行重建处理，得到重建的定位框的图像特征，获取重建的定位框的图像特征与定位框的图像特征的重建误差值，所述重建误差值用于确定将字符是否为异常字符。应用本发明专利技术实施例，可以确定出垂直、水平、倾斜和弧形等文本中的单个字符的定位框，然后再检测定位框中的单个字符是否为异常字符，从而实现对垂直、水平、倾斜和弧形等文本中的字符进行检测，适用各种文本检测的复杂场景。适用各种文本检测的复杂场景。适用各种文本检测的复杂场景。

全部详细技术资料下载

【技术实现步骤摘要】
字符检测方法、装置、电子设备及可读介质

[0001]本专利技术涉及字符检测
，特别是涉及一种字符检测方法、一种字符检测装置、一种电子设备以及一种计算机可读介质。

技术介绍

[0002]对于印刷字符，往往存在字符印刷异常或错误的情况发生，因此需要对印刷的字符进行检测，识别出各种印刷异常或错误的字符，以提高印刷品的印刷质量。
[0003]目前，通常会采用各种模型对印刷字符进行检测，如深度学习模型、神经网络模型等等；但是这些模型是对整行或整段文本进行检测，仅适用于特定场景下印刷字符的检测，例如检测垂直或水平文本中的字符，然而对于弧形文本或倾斜等文本中字符的检测的效果并不好，导致无法准确地检测出印刷异常或错误的字符。

技术实现思路

[0004]本专利技术实施例是提供一种字符检测方法、装置、电子设备以及计算机可读存储介质，以解决对于不是特定场景下的印刷字符，无法准确检测的问题。
[0005]本专利技术实施例公开了一种字符检测方法，包括：
[0006]获取包含待检测的字符的图像；
[...

【技术保护点】

【技术特征摘要】
1.一种字符检测方法，其特征在于，包括：获取包含待检测的字符的图像；将所述图像输入特征提取模型，得到所述图像的图像特征；其中，所述特征提取模块依据标准的图像数据集和包含无印刷异常的字符的正样本图像数据集训练得到；将所述图像的图像特征输入字符定位模型，得到所述字符的定位框和所述定位框的图像特征；其中，所述字符定位模型依据定位框标注的正样本图像数据集和所述正样本图像数据集训练得到；对所述定位框的图像特征进行重建处理，得到重建的定位框的图像特征；获取所述重建的定位框的图像特征与所述定位框的图像特征的重建误差值，所述重建误差值用于确定所述字符是否为异常字符。2.根据权利要求1所述的方法，其特征在于，所述特征提取模型包括MobileNet网络和特征金字塔网络，所述将所述图像输入特征提取模型，得到所述图像的图像特征，包括：将所述图像输入所述MobileNet网络，得到所述图像的多层图像特征；通过所述特征金字塔网络对所述多层图像特征进行特征融合，得到所述图像的图像特征。3.根据权利要求1所述的方法，其特征在于，所述字符定位模型包括区域生成网络、分类网络和回归预测网络，所述将所述图像的图像特征输入字符定位模型，得到所述字符的定位框和所述定位框的图像特征，包括：将所述图像的图像特征输入所述区域生成网络，得到候选框；通过所述分类网络确定出包含字符的所述候选框；通过所述回归预测网络对所述包含字符的所述候选框进行边框回归处理，得到所述字符的定位框，并提取所述定位框的图像特征。4.根据权利要求3所述的方法，其特征在于，所述通过所述回归预测网络对所述包含字符的所述候选框进行边框回归处理，得到所述字符的定位框，包括：通过所述回归预测网络预测所述候选框中像素点的概率值；其中，所述概率值表征所述像素点为所述字符的概率；基于所述候选框中像素点的概率值，确定出所述字符的定位框。5.根据权利要求1所述的方法，其特征在于，所述对所述定位框的图像特征进行重建处理，得到重建的定位框的图像特征，包括：对所述定位框的图像特征进行全局池化处理，得到所述定位框的特征向量；对所述定位框的特征向量进行归一化处理，得到归一化的特征向量；通过自编码器对所述归一化的特征向量进行重建，得到重建的特征向量；所述获取所述重建的定位框的图像特征与所述定位框的图像特征的重建误差值，所述重建误差值用于确定所述字符是否为异常字符，包括：计算所述重建的特征向量与所述归一化的特征向量的重建误差值，所述重建误差值用于，在大于第一预设阈值时，确定所述字符为异常字符。6.根据权利要求1所述的方法，其特征在于，所述标准的图像数据集为ImageNet图像数据集，在所述将所述图像输入特征提取模型之前，还包括：获取在所述ImageNet图像数据集上预先训练好的特征提取模型；
基于所述正样本图像数据集，调整所述预先训练好的特征提取模型，得到训练完成的特征提取模型。7.根据权利要求1所述的方法，其特征在于，在所述将所述图像的图像特征输入字符定位模型之前，还包括：将所述定位框标注的正样本图像数据集中的第一定位框标注图像输入所述特征提取模型，得到所述第一定位框标注图像的图像特征；采用所述第一定位框标注图像的图像特征，对待训练的字符定位模型进...

【专利技术属性】
技术研发人员：赵松，杨怀宇，
申请(专利权)人：南京中科创达软件科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人