【技术实现步骤摘要】
文本信息获取方法、装置、存储介质及电子设备
[0001]本公开涉及图像处理
,具体地,涉及一种文本信息获取方法、装置、存储介质及电子设备。
技术介绍
[0002]在教育场景下,对于试卷中的手写体文本进行检测是获取学生作答内容的重要环节,手写体文本检测的目标可以包括手写体的单词、词组、句子等英文手写内容,还可以包括手写体的字、词、句等中文手写内容。手写体文本检测可以通过扫描试卷内容或对试卷内容进行拍照等方式获取包含试卷内容高的图像,通过对图像中的文本进行检测,从而获取图像中的文本信息。
[0003]相关技术中通过目标检测方法或文本检测方法对图像中的文本进行检测时,因图像中的文本存在倾斜和弯曲的情况,使得识别结果不鲁棒,且因图像中的文本存在文本间距不一的长句,会导致出现语句断开的情况。
技术实现思路
[0004]本公开的目的是提供一种文本信息获取方法、装置、存储介质及电子设备,解决了相关技术中因图像中文本存在倾斜和弯曲导致的识别结果不鲁棒的技术问题。
[0005]为了实现上述目的,第一方面, ...
【技术保护点】
【技术特征摘要】
1.一种文本信息获取方法,其特征在于,所述方法包括:获取目标图像;将所述目标图像输入到优化后的文本行检测模型中,得到所述文本行检测模型输出的对应所述目标图像中文本内容的二值图;根据所述二值图获取对应所述目标图像中各文本内容的文本包围框;对各所述文本包围框进行后处理,得到对应所述目标图像的目标文本包围框;对所述目标文本包围框中的文本内容进行文本识别,得到对应所述目标图像的文本信息。2.根据权利要求1所述的方法,其特征在于,所述对各所述文本包围框进行后处理,得到对应所述目标图像的目标文本包围框,包括:遍历各所述文本包围框,判断两相邻所述文本包围框是否存在交集;在两相邻所述文本包围框存在交集的情况下,对两相邻所述文本包围框进行筛选;对筛选后的所述两相邻文本包围框进行合并处理,得到目标文本包围框。3.根据权利要求2所述的方法,其特征在于,两相邻所述文本包围框包括第一文本包围框和第二文本包围框,所述判断两相邻所述文本包围框是否存在交集,包括:获取所述第一文本包围框和所述第二文本包围框在坐标轴Oxy中上下左右的边界值;根据所述边界值判断所述第一文本包围框与所述第二文本包围框在所述坐标轴Oxy中X轴方向或Y轴方向是否相交;在所述第一文本包围框与所述第二文本包围框在所述X轴方向或所述Y轴方向相交的情况下,确定所述第一文本包围框与所述第二文本包围框存在交集。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:在所述第一文本包围框与所述第二文本包围框在所述X轴方向和所述Y轴方向不相交的情况下,计算所述第一文本包围框与所述第二文本包围框的交并比面积;在所述交并比面积大于零的情况下,确定所述第一文本包围框与所述第二文本包围框存在交集。5.根据权利要求4所述的方法,其特征在于,所述对两相邻所述文本包围框进行筛选,包括:获取所述第一文本包围框在所述X轴上的最小值x1和最大值x2,以及所述第二文本包围框在所述X轴上的最小值x3和最大值x4;在x1<x3、x2<x4且x3<x2的情况下,确定所述第一文本包围框为在前文本包围框,所述第二文本包围框为在后文本包围框;从所述在前文本包围框和所述在后文本包围框中筛选出目标在前文本包围框和目标在后文本包围框,所述目标在前文本...
【专利技术属性】
技术研发人员:杨明坤,马志国,张飞飞,
申请(专利权)人:北京鼎事兴教育咨询有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。