文字识别方法及其装置、可读介质和电子设备制造方法及图纸

技术编号：41417848 阅读：31 留言：0更新日期：2024-05-21 20:50

本申请涉及文字识别技术领域，公开了一种文字识别方法、排序装置、可读介质和电子设备。本申请中的文字识别方法包括：获取包含文字的待识别图像；确定出待识别图像中的多个文本块；在多个文本块形成的文本块区域的数量符合数量阈值时，将每一个文本块区域中符合合并规则的文本块进行合并，得到合并文本块，对未合并的文本块和合并文本块进行排序，得到排序结果对应的文本。通过本申请实施例提供的文字识别方法，可以在待识别图像中对文字版面包括多栏区域，即，多个文本块区域的较复杂的文档版面分析场景中，即在获取的文本块存在多栏的情况下，提高文档阅读顺序识别的准确性，提高用户使用体验感。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及文字识别，特别涉及文字识别方法及其装置、可读介质和电子设备。

技术介绍

1、随着文字识别技术的发展，人们可以从包括文字的各种格式文件中识别出文字得到完整的文本。例如，以包括文字的图像为例，可以通过光学字符识别(optical characterrecognition,ocr)识别出图像中的文本块，对文本块进行排序，基于排序后的文本块提取文字得到文本。

2、然而，如果图像中的文本块的布局比较复杂，例如：文本块组成多个栏目(也就是，存在多行多列的文本块)，各个文本块的大小不一致等等，通过ocr技术进行文字识别的过程中，会造成文本块的排序错乱，导致得到的文本中的语序错乱，影响用户体验。

技术实现思路

1、本申请的目的在于提供一种文字识别方法及其装置、可读介质和电子设备。

2、本申请的第一方面提供了一种文字识别方法，应用于电子设备，包括：

3、获取包含文字的待识别图像；

4、确定出待识别图像中的多个文本块；

5、根据多个文本块的...

【技术保护点】

1.一种文字识别方法，应用于电子设备，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述多个文本块的宽度确定文本框区域的数量，包括：

3.根据权利要求2所述的方法，其特征在于，所述多个文本块的横坐标值包括所述文本块的左侧边界或者右侧边界对应的横坐标值。

4.根据权利要求3所述的方法，其特征在于，所述根据所述多个文本块的横坐标值和所述目标区间的横坐标值之间的关系确定所述文本块区域的数量，包括：

5.根据权利要求4所述的方法，其特征在于，对应于所述第一横坐标值位于所述目标区间之外，确定所述文本块区域的数量为多个，包括：<...

【技术特征摘要】

1.一种文字识别方法，应用于电子设备，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述多个文本块的宽度确定文本框区域的数量，包括：

3.根据权利要求2所述的方法，其特征在于，所述多个文本块的横坐标值包括所述文本块的左侧边界或者右侧边界对应的横坐标值。

5.根据权利要求4所述的方法，其特征在于，对应于所述第一横坐标值位于所述目标区间之外，确定所述文本块区域的数量为多个，包括：

6.根据权利要求5所述的方法，其特征在于，所述目标区间由所述多个文本块中与所述纵坐标轴最接近的第二横坐标值和目标文本宽度...

【专利技术属性】
技术研发人员：张煜楠，沈少强，李一博，徐超劲，刘石磊，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人