文字坐标确定方法及装置制造方法及图纸

技术编号:37407905 阅读:25 留言:0更新日期:2023-04-30 09:34
本申请提供文字坐标确定方法及装置,其中所述文字坐标确定方法包括:提取文本行图像中目标文本行的文本轮廓,基于文本轮廓确定目标文本行在文本行图像中的文本框坐标;确定目标文本行中初始文字对应的位置信息,并对目标文本行进行垂直分割处理,根据处理结果确定目标文本行对应的分割区间坐标;根据位置信息更新分割区间坐标,基于更新结果确定初始文字对应的目标分割区间坐标;基于文本框坐标和目标分割区间坐标计算初始文字对应的文字坐标。通过文本框坐标和目标分割区间坐标精确的计算出初始文字的文字坐标,提高初始文字的坐标识别准确率。准确率。准确率。

【技术实现步骤摘要】
文字坐标确定方法及装置


[0001]本申请涉及图像处理
,特别涉及一种文字坐标确定方法。本申请同时涉及一种文字坐标确定装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着科技技术的快速发展,文字识别技术也随之不断的发展,且被广泛应用于各个行业中,如在图片类型中进行信息抽取、合同比对等场景使用广泛。而在文字识别技术中单字坐标计算是极其重要的,在信息抽取场景中,准确的单字坐标计算可以精确地向用户展示信息抽取结果。目前的单字坐标计算常使用OCR文字检测模型结合文本识别算法进行单字坐标的检测,但是现有的相关技术过于依赖模型输出结果,无法精确定位文本行中单字位置,导致单字坐标计算结果不准确。因此,如何提高单字坐标检测的准确率是目前亟需解决的问题。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种文字坐标确定方法,用于识别图像中文字的具体位置,并计算出文字在图像中的坐标。本申请同时涉及一种文字坐标确定装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的文字坐标识别准确率低的问题。...

【技术保护点】

【技术特征摘要】
1.一种文字坐标确定方法,其特征在于,包括:提取文本行图像中目标文本行的文本轮廓,基于所述文本轮廓确定所述目标文本行在所述文本行图像中的文本框坐标;确定所述目标文本行中初始文字对应的位置信息,并对所述目标文本行进行垂直分割处理,根据处理结果确定所述目标文本行对应的分割区间坐标;根据所述位置信息更新所述分割区间坐标,基于更新结果确定所述初始文字对应的目标分割区间坐标;基于所述文本框坐标和所述目标分割区间坐标计算所述初始文字对应的文字坐标。2.如权利要求1所述的方法,其特征在于,提取文本行图像中目标文本行的文本轮廓之前,所述方法还包括:确定初始文本行图像;对所述初始文本行图像进行反色处理、去噪处理和/或去线处理,获得文本行图像。3.如权利要求2所述的方法,其特征在于,对所述初始文本行图像进行反色处理,包括:提取所述初始文本行图像中像素点的像素值;基于所述像素值确定黑色像素点集合和白色像素点集合;在所述黑色像素点集合的像素点数量大于所述白色像素点集合的像素点数量的情况下,反转所述像素值并获得反色文本行图像。4.如权利要求2所述的方法,其特征在于,对所述初始文本行图像进行去噪处理,包括:对所述初始文本行图像进行二值化处理;对所述初始文本行图像与二值化后的初始文本行图像进行去噪计算,获得去噪文本行图像。5.如权利要求2所述的方法,其特征在于,对所述初始文本行图像进行去线处理,包括:对所述初始文本行图像进行投影处理,确定所述初始文本行图像中的待删除线条;对所述待删除线条进行删除处理,获得去线文本行图像。6.如权利要求1所述的方法,其特征在于,提取文本行图像中目标文本行的文本轮廓,基于所述文本轮廓确定所述目标文本行在所述文本行图像中的文本框坐标,包括:基于预设矩形框对所述文本行图像进行补边处理,并在补边后的文本行图像中确定目标文本行;基于补边后的文本行图像中的预设矩形框确定所述目标文本行的文本轮廓;确定所述文本行图像对应的图像坐标系,并根据所述文本轮廓的边长信息计算所述目标文本行在所述图像坐标系中的文本框坐标。7.如权利要求1所述的方法,其特征在于,确定所述目标文本行中初始文字对应的位置信息,包括:将所述文本行图像输入至文字识别模型,获得所述文字识别模型输出的所述目标文本行中初始文字对应的位置信息。8.如权利要求1所述的方法,其特征在于,对所述目标文本行进行垂直分割处理,根据处理结果确定所述目标...

【专利技术属性】
技术研发人员:陈丽娟李道振陈华华高晶晶张芸菲项蕾
申请(专利权)人:恒生电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1