文本图像的质量检测方法、装置、介质及电子设备制造方法及图纸

技术编号：31230050 阅读：9 留言：0更新日期：2021-12-08 10:00

本申请属于计算机技术领域，具体涉及一种文本图像的质量检测方法、装置、计算机可读介质及电子设备。该方法包括：检测文本图像的字符尺度；当文本图像的字符尺度小于第一预设尺度时，对文本图像进行放大处理，当文本图像的字符尺度大于第二预设尺度时，对文本图像进行缩小处理；将文本图像输入到第一神经网络中，以检测出文本图像中的一个或多个文本区域；对文本区域进行质量分预测，得到文本区域的质量分；基于预设权重对文本区域的质量分进行加权求和处理得到文本图像的质量分。本申请实施例能够提高对文本区域乃至文本图像的质量分的预测的准确性。预测的准确性。预测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
文本图像的质量检测方法、装置、介质及电子设备

[0001]本申请属于计算机
，具体涉及一种文本图像的质量检测方法、装置、计算机可读介质及电子设备。

技术介绍

[0002]随着OCR(Optical Character Recognition，光学字符识别)技术应用越来越广泛，采集得到的文本图像质量受到更多关注，文本图像质量评估方法也引起学术界和工业界的更广泛的兴趣。
[0003]现有的大部分图像质量评估方法针对的是自然场景图像，并不适合文本图像质量评价，所以需要提供一种针对文本图像质量的评估方法。
[0004]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本申请的目的在于提供一种文本图像的质量检测方法、装置、计算机可读介质及电子设备，至少在一定程度上克服相关技术中文本行识别不准确等技术问题。
[0006]本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。
[0007]根据本申请实施例的一个方面，提供一种文本图像的质量检测方法，包括：
[0008]检测所述文本图像的字符尺度，所述文本图像的字符尺度为所述文本图像的字符的平均尺度；
[0009]当所述文本图像的字符尺度小于第一预设尺度时，对所述文本图像进行放大处理以使得所述文本图像的字符尺度处于预设尺度范围中，当所述文本图像的字符尺度大于第二预设尺度时，对...

【技术保护点】

【技术特征摘要】
1.一种文本图像的质量检测方法，其特征在于，包括：检测所述文本图像的字符尺度，所述文本图像的字符尺度为所述文本图像的字符的平均尺度；当所述文本图像的字符尺度小于第一预设尺度时，对所述文本图像进行放大处理以使得所述文本图像的字符尺度处于预设尺度范围中，当所述文本图像的字符尺度大于第二预设尺度时，对所述文本图像进行缩小处理以使得所述文本图像的字符尺度处于预设尺度范围中，所述预设尺度范围为大于第一预设尺度并且小于第二预设尺度的尺度范围；将所述文本图像输入到第一神经网络中，通过第一神经网络对文本图像进行特征提取和映射处理，以检测出文本图像中的一个或多个文本区域；其中，所述第一神经网络中配置了感受窗，所述感受窗处于预设尺度范围中，所述感受窗用于在所述文本图像上移动以对所述文本图像进行特征提取；所述文本区域为所述文本图像中由部分或者全部字符组成的连续图像区域；对所述文本图像中的文本区域进行质量分预测，得到所述文本区域的质量分；获取与各个所述文本区域相对应的预设权重，并基于所述预设权重对所述文本区域的质量分进行加权求和处理得到所述文本图像的质量分。2.根据权利要求1所述的文本图像的质量检测方法，其特征在于，所述获取与各个所述文本区域相对应的预设权重，包括：获取各个所述文本区域的字数，并将各个所述文本区域的字数进行求和运算得到所述文本图像的总字数；分别获取各个所述文本区域的字数与所述文本图像的总字数的比值，将所述比值作为与各个所述文本区域相对应的预设权重。3.根据权利要求1所述的文本图像的质量检测方法，其特征在于，所述文本区域为文本行，所述文本行为所述文本图像中包含一个或多个串行排列的字符的连续图像区域，所述对所述文本图像中的文本区域进行质量分预测，得到所述文本区域的质量分，包括：检测所述文本图像中的文本行及所述文本行的长高比，所述长高比为所述文本行的长度和高度的比值，所述文本行的长度为所述文本行沿着所述文本行中的字符排列方向延伸的延伸线的长度，所述文本行的高度为所述文本行垂直于所述延伸线的高度；将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行；分别对所述多个长高比小于或等于预设值的文本行进行特征提取和质量分预测，得到所述多个长高比小于或等于预设值的文本行的质量分。4.根据权利要求3所述的文本图像的质量检测方法，其特征在于，所述将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行，包括：将所述长高比大于预设值的文本行投影到文本行的长度方向上，形成一维的投影点集合，其中，字符所在位置的像素点在文本行的长度方向上的投影形成实点投影，除所述字符所在位置以外的位置的像素点在文本行的长度方向上的投影形成虚点投影，实点投影和虚点投影组成投影点集合；在所述虚点投影聚集的线段上取分割点，根据所述分割点对所述文本行进行分割，以将长高比大于预设值的文本行分割成多个长高比小于或等于预设值的文本行。5.根据权利要求1所述的文本图像的质量检测方法，其特征在于，所述...

【专利技术属性】
技术研发人员：黄鹏程，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人