文本行检测方法及文本行检测装置制造方法及图纸

技术编号：21342077 阅读：38 留言：0更新日期：2019-06-13 22:04

一种文本行检测方法及文本行检测装置，该文本行检测方法包括对待检测图像进行预处理，以生成连通域；对连通域进行过滤处理，以获取符合预设要求的连通域；基于处理结果进行文本行识别操作。本发明专利技术提供的文本行检测方法，通过对待检测图像进行预处理和过滤处理，以获取符合预设要求的连通域，然后基于处理结果进行文本行识别操作的方式，使待检测图像中的文字等元素以连通域的形式呈现，并且基于过滤处理去除了异常连通域的干扰，从而提高了文本行的检测与识别的精确度，以及提高了文本行的检测与识别的效率。

Text Line Detection Method and Text Line Detection Device

A text line detection method and a text line detection device are presented in this paper. The text line detection method includes preprocessing the detected image to generate the connected region, filtering the connected region to obtain the connected region that meets the preset requirements, and recognizing the text line based on the processing results. The text line detection method provided by the present invention obtains the connected region that meets the preset requirements by preprocessing and filtering the detected image, and then performs the text line recognition operation based on the processing results, so that the text and other elements in the image to be detected are presented in the form of connected region, and the interference of abnormal connected region is removed based on filtering processing, thereby improving the performance of the method. The accuracy of text line detection and recognition and the efficiency of text line detection and recognition are improved.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】文本行检测方法及文本行检测装置本申请要求2017年10月13日提交的申请号为No.201710953107.1的中国申请的优先权，通过引用将其全部内容并入本文。
本专利技术涉及计算机图像处理领域，特别涉及一种文本行检测方法及文本行检测装置。
技术介绍
图像中的文本行检测一直是文本图像处理的研究热点，也是OCR(光学字符识别，OpticalCharacterRecognition)的最重要环节之一，由于图像中的文本部分常包含图像的重要信息，所以对图像中的文本行进行检测对于图像分析、图像信息获取具有重要作用。现有的文本行检测方法主要有传统方法和深度学习的方法。深度学习的方法适用的场景比较广泛，识别的精度也相对较高，但是需要大量的高质量标注过的数据和长时间的训练调参过程，且每次检测时运算量巨大，耗时久，不利于快速识别处理；而传统方法则有精度不高的问题，有较多的误报(falsepositive)，需要后期处理去除。所以，亟需一种既快速又不失准确率的文本行检测方法。
技术实现思路
有鉴于此，本专利技术实施例提供一种文本行检测方法及文本行检测装置，以解决现有文本行检测方法检测精度...

【技术保护点】
1.一种文本行检测方法，包括：对待检测图像进行预处理，以生成连通域；对所述连通域进行过滤处理，以获取符合预设要求的连通域；基于处理结果进行文本行识别操作。

【技术特征摘要】
【国外来华专利技术】2017.10.13 CN 20171095310711.一种文本行检测方法，包括：对待检测图像进行预处理，以生成连通域；对所述连通域进行过滤处理，以获取符合预设要求的连通域；基于处理结果进行文本行识别操作。2.根据权利要求1所述的文本行检测方法，其中，所述对待检测图像进行预处理，以生成连通域，包括：对所述待检测图像进行二值化处理；基于处理后的所述待检测图像生成连通域。3.根据权利要求2所述的文本行检测方法，其中，在所述对所述待检测图像进行二值化处理后，进一步包括：对二值化处理后的所述待检测图像进行闭运算处理。4.根据权利要求1至3任一所述的文本行检测方法，其中，所述对所述连通域进行过滤处理，以获取符合预设要求的连通域，包括：基于预设标准尺寸数据和获取的所述连通域的尺寸数据细过滤所述连通域，以获取符合预设要求的连通域。5.根据权利要求4所述的文本行检测方法，其中，在所述基于预设标准尺寸数据和获取的所述连通域的尺寸数据细过滤所述连通域，以获取符合预设要求的连通域之前，进一步包括：基于预设异常阈值和获取的所述连通域的尺寸数据粗过滤所述连通域；对粗过滤后的所述连通域的所述尺寸数据进行聚类统计；将出现次数达到预设次数的所述尺寸数据作为所述预设标准尺寸数据。6.根据权利要求5所述的文本行检测方法，其中，所述预设异常阈值包括按照像素设置的预设异常阈值和/或按照所述连通域的所述尺寸数据设置的预设异常阈值。7.根据权利要求1至6任一所述的文本行检测方法，其中，在所述对所述连通域进行过滤处理，以获取符合预设要求的连通域后，进一步包括：基于获取的符合预设要求的所述连通域生成对应的外部矩形框。8.根据权利要求7所述的文本行检测方法，其中，在所述基于获取的符合预设要求的所述连通域生成对应的外部矩形框后，进一步包括：按照预设比例，基于所述外部矩形框生成扩展矩形框；根据生成的所述扩展矩形框对所述外部矩形框进行聚合处理。9.根据权利要求8所述的文本行检测方法，其中，所述按照预设比例，基于所述外部矩形框生成扩展矩形框，包括：按照预设比例，将所述连通域的所述外部矩形框扩展为宽大于高的扩展矩形框，其中，所述外部矩形框和对应扩展的所述扩展矩形框的中心对齐。10.根据权利要求8或9所述的文本行检测方法，其中，所述根据生成的所述扩展矩形框对所述外部矩形框进行聚合处理，包括：判断至少两个连通域对应的所述扩展矩形框的IOU值是否达到预设IOU阈值范围；当所述至少两个连通域对应的所述扩展矩形框的IOU值达到预设IOU阈值范围时，将所述至少两个连通域的所述扩展矩形框对应的所述外部矩形框进行聚合操作，以生成包括所述至少两个外部矩形框的聚合类。11.根据权利要求10所述的文本行检测方法，其中，所述基于处理结果进行文本行识别操作，包括：当所述聚合类中的所述外部矩形框的个数大于或等于预设个数，并且聚合类中的所述外部矩形框的中心位置坐标的方差小于预设值时，则...

【专利技术属性】
技术研发人员：李宏宇，彭宇翔，
申请(专利权)人：众安信息技术服务有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人