文本图像的质量检测方法、装置、介质及电子设备制造方法及图纸

技术编号:31230050 阅读:9 留言:0更新日期:2021-12-08 10:00
本申请属于计算机技术领域,具体涉及一种文本图像的质量检测方法、装置、计算机可读介质及电子设备。该方法包括:检测文本图像的字符尺度;当文本图像的字符尺度小于第一预设尺度时,对文本图像进行放大处理,当文本图像的字符尺度大于第二预设尺度时,对文本图像进行缩小处理;将文本图像输入到第一神经网络中,以检测出文本图像中的一个或多个文本区域;对文本区域进行质量分预测,得到文本区域的质量分;基于预设权重对文本区域的质量分进行加权求和处理得到文本图像的质量分。本申请实施例能够提高对文本区域乃至文本图像的质量分的预测的准确性。预测的准确性。预测的准确性。

【技术实现步骤摘要】
文本图像的质量检测方法、装置、介质及电子设备


[0001]本申请属于计算机
,具体涉及一种文本图像的质量检测方法、装置、计算机可读介质及电子设备。

技术介绍

[0002]随着OCR(Optical Character Recognition,光学字符识别)技术应用越来越广泛,采集得到的文本图像质量受到更多关注,文本图像质量评估方法也引起学术界和工业界的更广泛的兴趣。
[0003]现有的大部分图像质量评估方法针对的是自然场景图像,并不适合文本图像质量评价,所以需要提供一种针对文本图像质量的评估方法。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本申请的目的在于提供一种文本图像的质量检测方法、装置、计算机可读介质及电子设备,至少在一定程度上克服相关技术中文本行识别不准确等技术问题。
[0006]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0007]根据本申请实施例的一个方面,提供一种文本图像的质量检测方法,包括:
[0008]检测所述文本图像的字符尺度,所述文本图像的字符尺度为所述文本图像的字符的平均尺度;
[0009]当所述文本图像的字符尺度小于第一预设尺度时,对所述文本图像进行放大处理以使得所述文本图像的字符尺度处于预设尺度范围中,当所述文本图像的字符尺度大于第二预设尺度时,对所述文本图像进行缩小处理以使得所述文本图像的字符尺度处于预设尺度范围中,所述预设尺度范围为大于第一预设尺度并且小于第二预设尺度的尺度范围;
[0010]将所述文本图像输入到第一神经网络中,通过第一神经网络对文本图像进行特征提取和映射处理,以检测出文本图像中的一个或多个文本区域;其中,所述第一神经网络中配置了感受窗,所述感受窗处于预设尺度范围中,所述感受窗用于在所述文本图像上移动以对所述文本图像进行特征提取;所述文本区域为所述文本图像中由部分或者全部字符组成的连续图像区域;
[0011]对所述文本图像中的文本区域进行质量分预测,得到所述文本区域的质量分;
[0012]获取与各个所述文本区域相对应的预设权重,并基于所述预设权重对所述文本区域的质量分进行加权求和处理得到所述文本图像的质量分。
[0013]根据本申请实施例的一个方面,提供一种文本图像的质量检测装置,所述质量检测装置包括:
[0014]字符尺度检测模块,被配置为检测所述文本图像的字符尺度,所述文本图像的字
符尺度为所述文本图像的字符的平均尺度;
[0015]缩放模块,被配置为当所述文本图像的字符尺度小于第一预设尺度时,对所述文本图像进行放大处理以使得所述文本图像的字符尺度处于预设尺度范围中,当所述文本图像的字符尺度大于第二预设尺度时,对所述文本图像进行缩小处理以使得所述文本图像的字符尺度处于预设尺度范围中,所述预设尺度范围为大于第一预设尺度并且小于第二预设尺度的尺度范围;
[0016]文本区域检测模块,被配置为将所述文本图像输入到第一神经网络中,通过第一神经网络对文本图像进行特征提取和映射处理,以检测出文本图像中的一个或多个文本区域;其中,所述第一神经网络中配置了感受窗,所述感受窗处于预设尺度范围中,所述感受窗用于在所述文本图像上移动以对所述文本图像进行特征提取;所述文本区域为所述文本图像中由部分或者全部字符组成的连续图像区域;
[0017]质量分预测模块,被配置为对所述文本图像中的文本区域进行质量分预测,得到所述文本区域的质量分;
[0018]加权求和模块,被配置为获取与各个所述文本区域相对应的预设权重,并基于所述预设权重对所述文本区域的质量分进行加权求和处理得到所述文本图像的质量分。
[0019]在本申请的一些实施例中,基于以上技术方案,所述加权求和模块包括:
[0020]字数获取单元,被配置为获取各个所述文本区域的字数,并将各个所述文本区域的字数进行求和运算得到所述文本图像的总字数;
[0021]预设权重计算单元,被配置为分别获取各个所述文本区域的字数与所述文本图像的总字数的比值,将所述比值作为与各个所述文本区域相对应的预设权重。
[0022]在本申请的一些实施例中,基于以上技术方案,所述文本区域为文本行,所述文本行为所述文本图像中包含一个或多个串行排列的字符的连续图像区域,所述质量分预测模块包括:
[0023]长高比检测单元,被配置为检测所述文本图像中的文本行及所述文本行的长高比,所述长高比为所述文本行的长度和高度的比值,所述文本行的长度为所述文本行沿着所述文本行中的字符排列方向延伸的延伸线的长度,所述文本行的高度为所述文本行垂直于所述延伸线的高度;
[0024]文本行分割单元,被配置为将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行;
[0025]质量分预测单元,被配置为分别对所述多个长高比小于或等于预设值的文本行进行特征提取和质量分预测,得到所述多个长高比小于或等于预设值的文本行的质量分。
[0026]在本申请的一些实施例中,基于以上技术方案,所述文本行分割单元包括:
[0027]文本行投影子单元,被配置为将所述长高比大于预设值的文本行投影到文本行的长度方向上,形成一维的投影点集合,其中,字符所在位置的像素点在文本行的长度方向上的投影形成实点投影,除所述字符所在位置以外的位置的像素点在文本行的长度方向上的投影形成虚点投影,实点投影和虚点投影组成投影点集合;
[0028]文本行分割子单元,被配置为在所述虚点投影聚集的线段上取分割点,根据所述分割点对所述文本行进行分割,以将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行。
[0029]在本申请的一些实施例中,基于以上技术方案,所述质量分预测模块可以包括:
[0030]输入单元,被配置为将所述文本图像中的文本区域输入到第二神经网络中;
[0031]特征提取单元,被配置为通过所述第二神经网络的卷积层对所述文本区域进行特征提取,获得平面特征;
[0032]降维处理单元,被配置为通过所述第二神经网络的池化层对所述平面特征进行降维处理,获得特征向量;
[0033]全连接计算单元,被配置为通过所述第二神经网络的全连接层对所述特征向量进行全连接计算,获得所述文本区域的预测质量分。
[0034]在本申请的一些实施例中,基于以上技术方案,所述质量分预测模块可以还包括:
[0035]数据集获取单元,被配置为获取文本识别数据集,所述文本识别数据集包括文本图像及所述文本图像的识别准确率,其中,所述文本图像的识别准确率为所述文本图像的可识别字符数占实际字符数的比率,所述可识别字符数为所述文本图像能够被字符识别模型正确识别出的字符数,所述实际字符数为所述文本图像中实际包括的字符数;
[0036]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本图像的质量检测方法,其特征在于,包括:检测所述文本图像的字符尺度,所述文本图像的字符尺度为所述文本图像的字符的平均尺度;当所述文本图像的字符尺度小于第一预设尺度时,对所述文本图像进行放大处理以使得所述文本图像的字符尺度处于预设尺度范围中,当所述文本图像的字符尺度大于第二预设尺度时,对所述文本图像进行缩小处理以使得所述文本图像的字符尺度处于预设尺度范围中,所述预设尺度范围为大于第一预设尺度并且小于第二预设尺度的尺度范围;将所述文本图像输入到第一神经网络中,通过第一神经网络对文本图像进行特征提取和映射处理,以检测出文本图像中的一个或多个文本区域;其中,所述第一神经网络中配置了感受窗,所述感受窗处于预设尺度范围中,所述感受窗用于在所述文本图像上移动以对所述文本图像进行特征提取;所述文本区域为所述文本图像中由部分或者全部字符组成的连续图像区域;对所述文本图像中的文本区域进行质量分预测,得到所述文本区域的质量分;获取与各个所述文本区域相对应的预设权重,并基于所述预设权重对所述文本区域的质量分进行加权求和处理得到所述文本图像的质量分。2.根据权利要求1所述的文本图像的质量检测方法,其特征在于,所述获取与各个所述文本区域相对应的预设权重,包括:获取各个所述文本区域的字数,并将各个所述文本区域的字数进行求和运算得到所述文本图像的总字数;分别获取各个所述文本区域的字数与所述文本图像的总字数的比值,将所述比值作为与各个所述文本区域相对应的预设权重。3.根据权利要求1所述的文本图像的质量检测方法,其特征在于,所述文本区域为文本行,所述文本行为所述文本图像中包含一个或多个串行排列的字符的连续图像区域,所述对所述文本图像中的文本区域进行质量分预测,得到所述文本区域的质量分,包括:检测所述文本图像中的文本行及所述文本行的长高比,所述长高比为所述文本行的长度和高度的比值,所述文本行的长度为所述文本行沿着所述文本行中的字符排列方向延伸的延伸线的长度,所述文本行的高度为所述文本行垂直于所述延伸线的高度;将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行;分别对所述多个长高比小于或等于预设值的文本行进行特征提取和质量分预测,得到所述多个长高比小于或等于预设值的文本行的质量分。4.根据权利要求3所述的文本图像的质量检测方法,其特征在于,所述将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行,包括:将所述长高比大于预设值的文本行投影到文本行的长度方向上,形成一维的投影点集合,其中,字符所在位置的像素点在文本行的长度方向上的投影形成实点投影,除所述字符所在位置以外的位置的像素点在文本行的长度方向上的投影形成虚点投影,实点投影和虚点投影组成投影点集合;在所述虚点投影聚集的线段上取分割点,根据所述分割点对所述文本行进行分割,以将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行。5.根据权利要求1所述的文本图像的质量检测方法,其特征在于,所述...

【专利技术属性】
技术研发人员:黄鹏程
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1