【技术实现步骤摘要】
本申请涉及文字识别,特别涉及文字识别方法及其装置、可读介质和电子设备。
技术介绍
1、随着文字识别技术的发展,人们可以从包括文字的各种格式文件中识别出文字得到完整的文本。例如,以包括文字的图像为例,可以通过光学字符识别(optical characterrecognition,ocr)识别出图像中的文本块,对文本块进行排序,基于排序后的文本块提取文字得到文本。
2、然而,如果图像中的文本块的布局比较复杂,例如:文本块组成多个栏目(也就是,存在多行多列的文本块),各个文本块的大小不一致等等,通过ocr技术进行文字识别的过程中,会造成文本块的排序错乱,导致得到的文本中的语序错乱,影响用户体验。
技术实现思路
1、本申请的目的在于提供一种文字识别方法及其装置、可读介质和电子设备。
2、本申请的第一方面提供了一种文字识别方法,应用于电子设备,包括:
3、获取包含文字的待识别图像;
4、确定出待识别图像中的多个文本块;
5、根据多个文本块的
...【技术保护点】
1.一种文字识别方法,应用于电子设备,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个文本块的宽度确定文本框区域的数量,包括:
3.根据权利要求2所述的方法,其特征在于,所述多个文本块的横坐标值包括所述文本块的左侧边界或者右侧边界对应的横坐标值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多个文本块的横坐标值和所述目标区间的横坐标值之间的关系确定所述文本块区域的数量,包括:
5.根据权利要求4所述的方法,其特征在于,对应于所述第一横坐标值位于所述目标区间之外,确定所述文本块区域的
...【技术特征摘要】
1.一种文字识别方法,应用于电子设备,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个文本块的宽度确定文本框区域的数量,包括:
3.根据权利要求2所述的方法,其特征在于,所述多个文本块的横坐标值包括所述文本块的左侧边界或者右侧边界对应的横坐标值。
4.根据权利要求3所述的方法,其特征在于,所述根据所述多个文本块的横坐标值和所述目标区间的横坐标值之间的关系确定所述文本块区域的数量,包括:
5.根据权利要求4所述的方法,其特征在于,对应于所述第一横坐标值位于所述目标区间之外,确定所述文本块区域的数量为多个,包括:
6.根据权利要求5所述的方法,其特征在于,所述目标区间由所述多个文本块中与所述纵坐标轴最接近的第二横坐标值和目标文本宽度...
【专利技术属性】
技术研发人员:张煜楠,沈少强,李一博,徐超劲,刘石磊,
申请(专利权)人:荣耀终端有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。