System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本中字符位置确定方法以及装置制造方法及图纸_技高网

一种文本中字符位置确定方法以及装置制造方法及图纸

技术编号:40610142 阅读:4 留言:0更新日期:2024-03-12 22:17
本申请提供一种文本中字符位置确定方法以及装置,属于文本识别技术领域。该方法包括:获取待识别的文本行图片,文本行图片包括排列在同一行或同一列的多个字符;对文本行图片进行文字识别处理,得到存在字符的索引集合,索引集合中包括与多个字符一一对应的多个索引的信息;对文本行图片进行投影处理,得到各字符投影后的像素坐标集合;根据索引集合和像素坐标集合,确定文本行图片中各字符的边界位置。本申请可以提高获取文本中字符位置的准确性。

【技术实现步骤摘要】

本申请涉及文本识别,具体而言,涉及一种文本中字符位置确定方法以及装置


技术介绍

1、为了便于对文本进行编辑和转换等工作,对于图片中存在的文本,通常需要识别文本在图片中的位置,以得到对应位置的文本内容。

2、现有技术中,可以通过深度学习模型进行回归计算,以确定出每个字符的在图片中的边界位置。深度学习模型需要基于大量的样本数据进行训练。其中,合成数据由于不需要进行额外的数据标注,成为样本数据的一种重要获取方式。

3、但是,使用合成数据会导致深度学习模型的训练推理分布不一致,进而导致深度学习模型的准确率较低。


技术实现思路

1、本申请的目的在于提供一种文本中字符位置确定方法以及装置,可以提高获取文本中字符位置的准确性。

2、本申请的实施例是这样实现的:

3、本申请实施例的一方面,提供一种文本中字符位置确定方法,包括:

4、获取待识别的文本行图片,文本行图片包括排列在同一行或同一列的多个字符;

5、对文本行图片进行文字识别处理,得到存在字符的索引集合,索引集合中包括与多个字符一一对应的多个索引的信息;

6、对文本行图片进行投影处理,得到各字符投影后的像素坐标集合;

7、根据索引集合和像素坐标集合,确定文本行图片中各字符的边界位置。

8、可选地,索引的信息包括索引的目标参考位置;根据索引集合和像素坐标集合,确定文本行图片中各字符的边界位置,包括:

9、针对文本行图片中的每个字符执行以下操作:

10、在索引集合中,将对应字符的索引的目标参考位置作为初始位置;

11、若文本行图片包括排列在同一行的多个字符,由初始位置分别向左右两侧进行渐进扩张计算,并基于像素坐标集合确定字符的左右边界位置,根据文本行图片的行高确定字符的上下边界位置;

12、若文本行图片包括排列在同一列的多个字符,由初始位置分别向上下两侧进行渐进扩张计算,并基于像素坐标集合确定字符的上下边界位置,根据文本行图片的行宽确定字符的左右边界位置。

13、可选地,索引的信息还包括索引的范围;基于像素坐标集合确定字符的左右边界位置,包括:

14、基于像素坐标集合以及索引的范围确定字符的左右边界位置;

15、基于像素坐标集合确定字符的上下边界位置,包括:

16、基于像素坐标集合以及索引的范围确定字符的上下边界位置。

17、可选地,基于像素坐标集合以及索引的范围确定字符的左右边界位置,包括:

18、根据像素坐标集合,将到达字符对应的索引左侧边界位置前最后一个存在像素点的位置作为字符的左侧边界位置,其中,索引左侧边界位置为索引的范围所指示的左侧边界位置;

19、根据像素坐标集合,将到达字符对应的索引右侧边界位置前最后一个存在像素点的位置作为字符的右侧边界位置,其中,索引右侧边界位置为索引的范围所指示的右侧边界位置。

20、可选地,基于像素坐标集合以及索引的范围确定字符的上下边界位置,包括:

21、根据像素坐标集合,将到达字符对应的索引上侧边界位置前最后一个存在像素点的位置作为字符的上侧边界位置,其中,索引上侧边界位置为索引的范围所指示的上侧边界位置;

22、根据像素坐标集合,将到达字符对应的索引下侧边界位置前最后一个存在像素点的位置作为字符的下侧边界位置,其中,索引下侧边界位置为索引的范围所指示的下侧边界位置。

23、可选地,基于像素坐标集合确定字符的左右边界位置,包括:

24、根据像素坐标集合,将到达预设左侧边界位置前最后一个存在像素点的位置作为字符的左侧边界位置,其中,预设左侧边界位置与索引的目标参考位置的距离为第一预设值;

25、根据像素坐标集合,将到达预设右侧边界位置前最后一个存在像素点的位置作为字符的右侧边界位置,其中,预设右侧边界位置与索引的目标参考位置的距离为第二预设值。

26、可选地,基于像素坐标集合确定字符的上下边界位置,包括:

27、根据像素坐标集合,将到达预设上侧边界位置前最后一个存在像素点的位置作为字符的上侧边界位置,其中,预设上侧边界位置与索引的目标参考位置的距离为第三预设值;

28、根据像素坐标集合,将到达预设下侧边界位置前最后一个存在像素点的位置作为字符的下侧边界位置,其中,预设下侧边界位置与索引的目标参考位置的距离为第四预设值。

29、可选地,对文本行图片进行文字识别处理,得到存在字符的索引集合,包括:

30、将文本行图片输入至文字识别模型中,得到空白分割字符的概率分布矩阵;

31、基于空白分割字符的概率分布矩阵确定满足预设条件的字符分布矩阵;

32、根据字符分布矩阵构建文本行图片中存在字符的索引集合。

33、可选地,根据字符分布矩阵构建文本行图片中存在字符的索引集合,包括:

34、根据字符分布矩阵中各字符的位置以及文字识别模型的下采样率,确定索引集合中各索引的信息,其中,各索引的信息包括索引的范围以及索引的目标参考位置。

35、本申请实施例的另一方面,提供一种文本中字符位置确定装置,包括:获取模块、识别处理模块、投影处理模块以及位置确定模块;

36、获取模块,用于获取待识别的文本行图片,文本行图片包括排列在同一行或同一列的多个字符;

37、识别处理模块,用于对文本行图片进行文字识别处理,得到存在字符的索引集合,索引集合中包括与多个字符一一对应的多个索引的信息;

38、投影处理模块,用于对文本行图片进行投影处理,得到各字符投影后的像素坐标集合;

39、位置确定模块,用于根据索引集合和像素坐标集合,确定文本行图片中各字符的边界位置。

40、可选地,所述索引的信息包括索引的目标参考位置;位置确定模块,具体用于针对所述文本行图片中的每个所述字符执行以下操作:在所述索引集合中,将对应所述字符的索引的目标参考位置作为初始位置;若所述文本行图片包括排列在同一行的多个字符,由所述初始位置分别向左右两侧进行渐进扩张计算,并基于所述像素坐标集合确定所述字符的左右边界位置,根据所述文本行图片的行高确定所述字符的上下边界位置;若所述文本行图片包括排列在同一列的多个字符,由所述初始位置分别向上下两侧进行渐进扩张计算,并基于所述像素坐标集合确定所述字符的上下边界位置,根据所述文本行图片的行宽确定所述字符的左右边界位置。

41、可选地,所述索引的信息还包括索引的范围;位置确定模块,具体用于基于所述像素坐标集合以及所述索引的范围确定所述字符的左右边界位置;基于所述像素坐标集合以及所述索引的范围确定所述字符的上下边界位置。

42、可选地,位置确定模块,具体用于根据所述像素坐标集合,将到达所述字符对应的索引左侧边界位置前最后一个存在像素点的位置作为所述字符的左侧边界位本文档来自技高网...

【技术保护点】

1.一种文本中字符位置确定方法,其特征在于,包括:

2.如权利要求1所述的文本中字符位置确定方法,其特征在于,所述索引的信息包括索引的目标参考位置;

3.如权利要求2所述的文本中字符位置确定方法,其特征在于,所述索引的信息还包括索引的范围;

4.如权利要求3所述的文本中字符位置确定方法,其特征在于,所述基于所述像素坐标集合以及所述索引的范围确定所述字符的左右边界位置,包括:

5.如权利要求3所述的文本中字符位置确定方法,其特征在于,所述基于所述像素坐标集合以及所述索引的范围确定所述字符的上下边界位置,包括:

6.如权利要求2所述的文本中字符位置确定方法,其特征在于,所述基于所述像素坐标集合确定所述字符的左右边界位置,包括:

7.如权利要求1所述的文本中字符位置确定方法,其特征在于,所述对所述文本行图片进行文字识别处理,得到存在字符的索引集合,包括:

8.如权利要求7所述的文本中字符位置确定方法,其特征在于,所述根据所述字符分布矩阵构建所述文本行图片中存在字符的索引集合,包括:

9.如权利要求1所述的文本中字符位置确定方法,其特征在于,所述对所述文本行图片进行投影处理,得到各字符投影后的像素坐标集合,包括:

10.一种文本中字符位置确定装置,其特征在于,包括:获取模块、识别处理模块、投影处理模块以及位置确定模块;

...

【技术特征摘要】

1.一种文本中字符位置确定方法,其特征在于,包括:

2.如权利要求1所述的文本中字符位置确定方法,其特征在于,所述索引的信息包括索引的目标参考位置;

3.如权利要求2所述的文本中字符位置确定方法,其特征在于,所述索引的信息还包括索引的范围;

4.如权利要求3所述的文本中字符位置确定方法,其特征在于,所述基于所述像素坐标集合以及所述索引的范围确定所述字符的左右边界位置,包括:

5.如权利要求3所述的文本中字符位置确定方法,其特征在于,所述基于所述像素坐标集合以及所述索引的范围确定所述字符的上下边界位置,包括:

6.如权利要求2所述的文本中字符位置确定方法...

【专利技术属性】
技术研发人员:罗志旺
申请(专利权)人:珠海金山办公软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1