文本行的识别方法、装置、存储介质和电子设备制造方法及图纸

技术编号：38822414 阅读：29 留言：0更新日期：2023-09-15 20:01

本公开涉及一种文本行的识别方法、装置、存储介质和电子设备，涉及图像识别技术领域，该方法包括：获取待识别的文本行图像；将所述文本行图像转换为二值图像；获取所述二值图像中的二值图矩形框，以及所述文本行图像中与所述二值图矩形框对应的待定文本行框；基于所述二值图矩形框，去除所述待定文本行框中的冗余信息，得到目标文本行框；所述目标文本行框中仅包含一行文本；根据所述目标文本行框，确定所述文本行图像中的印刷体文本对应的文本行信息。这样，可以确保每个目标文本行框中仅包含一行文本，从而在根据目标文本行框进行文本识别的时候，能够准确的识别出对应的印刷体文本的文本行信息。本的文本行信息。本的文本行信息。

全部详细技术资料下载

【技术实现步骤摘要】
文本行的识别方法、装置、存储介质和电子设备

[0001]本公开涉及图像识别
，具体地，涉及一种文本行的识别方法、装置、存储介质和电子设备。

技术介绍

[0002]在教育场景下，常常需要通过识别纸质版试卷来获取电子版试卷，且在一些场景下，纸质版试卷中还会包含手写体文本，那么此时就需要将试卷中的印刷体文本识别出来。但由于拍照场景的复杂性，常常会出现拍摄的图像中文本发生弯曲的情况，也即纸面不平整。此时，将会影响印刷体文本识别的准确性。

技术实现思路

[0003]为了解决上述技术问题，本公开提供一种文本行的识别方法、装置、存储介质和电子设备。
[0004]根据本公开实施例的第一方面，提供一种文本行的识别方法，所述方法包括：获取待识别的文本行图像；将所述文本行图像转换为二值图像；获取所述二值图像中的二值图矩形框，以及所述文本行图像中与所述二值图矩形框对应的待定文本行框；基于所述二值图矩形框，去除所述待定文本行框中的冗余信息，得到目标文本行框；所述目标文本行框中仅包含一行文本；根据所述目标文本行框，确定所述...

【技术保护点】

【技术特征摘要】
1.一种文本行的识别方法，其特征在于，所述方法包括：获取待识别的文本行图像；将所述文本行图像转换为二值图像；获取所述二值图像中的二值图矩形框，以及所述文本行图像中与所述二值图矩形框对应的待定文本行框；基于所述二值图矩形框，去除所述待定文本行框中的冗余信息，得到目标文本行框；所述目标文本行框中仅包含一行文本；根据所述目标文本行框，确定所述文本行图像中的印刷体文本对应的文本行信息。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：确定所述二值图矩形框中包含的连通域数量；所述基于所述二值图矩形框，去除所述待定文本行框中的冗余信息，得到目标文本行框包括：在所述连通域数量大于或等于预设数量阈值的情况下，基于所述二值图矩形框，去除所述待定文本行框中的冗余信息，得到所述目标文本行框。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：在所述连通域数量小于所述预设数量阈值的情况下，将所述待定文本行框作为所述目标文本行框。4.根据权利要求1所述的方法，其特征在于，所述基于所述二值图矩形框，去除所述待定文本行框中的冗余信息，得到目标文本行框包括：对所述二值图矩形框进行外扩；根据外扩后的二值图矩形框中的背景部分，遮盖所述待定文本行框，得到所述目标文本行框。5.根据权利要求1所述的方法，其特征在于，所述获取所述二值图像中的二值图矩形框，以及所述文本行图像中与所述二值图矩形框对应的待定文本行框包括：获取所述二值图像中每个文本行所在的最小外接矩形，得到所述二值图矩形框；根据所述二值图矩形框在所述二值图像中的位置，从所述文本行图像中获取所述待定文本行框。6.根据权利要求1所述的方法，其特征在于，所述将所述文本行图像转换为二值图像包括：将所述文本行图像输入预先生成的文本行检测模型中，得到所述文本行检测模型输出的所述二值图像。7.根据权利要求6所述的方法，其特征在于，所述文本行检测模型包括：特征采样模块、通道注意力模块、特征融合模块和处理模块；所述特征采样模块，用于通过多个下采样通道，对所述文本行图像进行下采样处理，以得到多尺度的特征图；所述通道注意力模块，用于对不同尺度的特征图进行加权；所述特征融合模块，用于对多个加权后的特征图进行特征融合，得到...

【专利技术属性】
技术研发人员：杨明坤，马志国，张飞飞，
申请(专利权)人：新东方教育科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人