一种文本处理方法及相关装置制造方法及图纸

技术编号:30753837 阅读:34 留言:0更新日期:2021-11-10 12:07
本申请公开了一种文本处理方法及相关装置。该方法包括:获取第一文本图片;第一文本图片为包括第一文本的图片;将第一文本图片输入至文本矫正网络进行文本矫正,得到包括第二文本的第二文本图片;文本矫正网络为利用第一文本中的每个字符的位置信息进行矫正的网络,第二文本的文本内容与第一文本的文本内容相同,第二文本图片中的第二文本为水平文本。本方法对于输入的文本图片,通过检测其包含的文本信息得到每个字符的位置信息,并利用该位置信息重构出每个字符的坐标框,再根据该坐标框对字符进行更精细的控制点采样,使得矫正后的文本更加水平,提高了文本矫正的准确率及效率,进而提高文本识别的准确率及效率。而提高文本识别的准确率及效率。而提高文本识别的准确率及效率。

【技术实现步骤摘要】
一种文本处理方法及相关装置


[0001]本申请涉及场景文本识别(scene text recognition,STR)
,尤其涉及一种文本处理方法及相关装置。

技术介绍

[0002]场景文本识别指的是通过将特定场景中包含文本信息的文本图片输入到程序中,由程序将输入的包含文本信息的文本图片转换成计算机可理解的文本符号。场景文本识别在计算机视觉领域中为一个重要的分支,在自动驾驶、盲人辅助等应用场景中有着重要作用及前景,提高场景文本识别的准确率及效率尤为重要。
[0003]目前的场景文本识别往往只对水平的文本信息有较高的识别准确率。对于文本图片中包含的倾斜甚至弯曲的文本,目前的场景文本识别方法很难对其正确识别。所以,在对文本图片包含的文本信息进行识别之前,通常需要将原本倾斜甚至弯曲的文本矫正为水平的文本。
[0004]因此,如何高效的对文本进行矫正,使提高场景文本识别的准确率及效率,成为了本领域技术人员重要的研究课题。

技术实现思路

[0005]本申请实施例提供了一种文本处理方法及相关装置,对于输入的文本图片,通本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取第一文本图片;所述第一文本图片为包括第一文本的图片;将所述第一文本图片输入至文本矫正网络进行文本矫正,得到包括第二文本的第二文本图片;所述文本矫正网络为利用所述第一文本中的每个字符的位置信息进行矫正的网络,所述第二文本的文本内容与所述第一文本的文本内容相同,所述第二文本图片中的所述第二文本为水平文本。2.根据权利要求1所述的方法,其特征在于,所述将所述第一文本图片输入至文本矫正网络进行文本矫正,得到包括第二文本的第二文本图片的步骤,包括:获取所述第一文本中的字符的各个不同层级的掩码;所述各个不同层级的掩码大小不同,所述各个不同层级的掩码用于表征所述字符的位置信息;根据所述字符的位置信息构建所述字符的坐标框;所述坐标框用于确定所述字符的控制点;根据所述控制点对所述字符进行矫正,得到包括所述第二文本的所述第二文本图片。3.根据权利要求2所述的方法,其特征在于,所述根据所述字符的位置信息构建所述字符的坐标框之前,所述方法还包括:查找所述各个不同层级的掩码对应的连通域,得到目标连通域;所述目标连通域用于优化所述字符的位置信息。4.根据权利要求3所述的方法,其特征在于,所述查找所述各个不同层级的掩码对应的连通域,得到目标连通域,包括:查找第一掩码对应的连通域,得到第一连通域;以及,查找第二掩码对应的连通域,得到第二连通域;所述第二连通域不与所述第一连通域重合,所述第二掩码大于所述第一掩码;将所述第一连通域和所述第二连通域作为所述目标连...

【专利技术属性】
技术研发人员:李明付彬乔宇
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1