字符识别方法及装置制造方法及图纸

技术编号:14799751 阅读:59 留言:0更新日期:2017-03-14 21:51
本公开是关于字符识别方法及装置。该方法包括:对字符图像进行字符识别,获得字符识别结果;从字符识别结果中,确定出置信度小于或等于第一预设阈值的目标字符;对目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个字符图像块中包括一个单元字符;根据至少两个字符图像块对字符图像区域重新进行字符识别。该技术通过对字符图像区域进行细致的切割,获得无法再进一步分割的字符图像块,再通过对字符图像块中单元字符的组合处理,获得置信度较高的字符组合,将置信度较高的字符组合确定为字符图像区域的字符识别结果。该技术提高了字符识别结果的准确度。

【技术实现步骤摘要】

本公开涉及字符识别
,尤其涉及字符识别方法及装置
技术介绍
目前,字符识别技术被应用在了众多领域。在进行诸如身份证信息提取等任务时,出于种种原因字符切割地未必准确,会出现一些错误,常见的错是会将前一个字的偏旁被切到了下一个字中,例如“川”字,在切割时,很容易把最右边的竖切到后面的字符中,从而导致字符识别结果的准确度较低。
技术实现思路
本公开实施例提供了字符识别方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种字符识别方法,包括:对字符图像进行字符识别,获得字符识别结果;从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标字符;对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个所述字符图像块中包括一个单元字符;根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。在一个实施例中,所述对所述目标字符所在的字符图像区域进行切割,包括:获取所述目标字符的字符排列方向;将所述字符排列方向作为切割方向,对所述目标字符所在的字符图像区域进行切割。在一个实施例中,所述根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别,包括:分别对所述至少两个字符图像块进行字符识别,获得所述至少两个字符图像块各自所包括的单元字符;按照所述至少两个字符图像块在所述字符图像区域中的排列顺序,对所述至少两个字符图像块各自所包括的单元字符进行排列;对排列后的所述单元字符进行组合处理,获得至少两组字符组合;从所述至少两组字符组合中,确定出置信度满足预设条件的字符组合;将所述置信度满足预设条件的字符组合确定为所述字符图像区域的字符识别结果。在一个实施例中,所述置信度满足预设条件的字符组合,包括以下第一种字符组合或者第二种字符组合:第一种字符组合包括:组合内每个字符各自的置信度均大于第二预设阈值的字符组合;其中,所述第二预设阈值大于或等于第一预设阈值;第二种字符组合包括:在所述至少两组字符组合中,组合内所有字符各自的置信度之和最高的字符组合。在一个实施例中,当所述目标字符包括汉字时,所述单元字符包括偏旁部首、或者独体字。根据本公开实施例的第二方面,提供一种字符识别装置,包括:第一识别模块,用于对字符图像进行字符识别,获得字符识别结果;确定模块,用于从所述第一识别模块获得的所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标字符;切割模块,用于对所述确定模块确定出的所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个所述字符图像块中包括一个单元字符;第二识别模块,用于根据所述切割模块获得的所述至少两个字符图像块对所述字符图像区域重新进行字符识别。在一个实施例中,所述切割模块包括:获取子模块,用于获取所述目标字符的字符排列方向;切割子模块,用于将所述获取子模块获取到的所述字符排列方向作为切割方向,对所述目标字符所在的字符图像区域进行切割。在一个实施例中,所述第二识别模块,包括:识别子模块,用于分别对所述至少两个字符图像块进行字符识别,获得所述至少两个字符图像块各自所包括的单元字符;排序子模块,用于按照所述至少两个字符图像块在所述字符图像区域中的排列顺序,对所述至少两个字符图像块各自所包括的单元字符进行排列;组合子模块,用于对所述排列后的所述单元字符进行组合处理,获得至少两组字符组合;第一确定子模块,用于从所述至少两组字符组合中,确定出置信度满足预设条件的字符组合;第二确定子模块,用于将所述置信度满足预设条件的字符组合确定为所述字符图像区域的字符识别结果。在一个实施例中,所述置信度满足预设条件的字符组合,包括以下第一种字符组合或者第二种字符组合:第一种字符组合包括:组合内每个字符各自的置信度均大于第二预设阈值的字符组合;其中,所述第二预设阈值大于或等于第一预设阈值;第二种字符组合包括:在所述至少两组字符组合中,组合内所有字符各自的置信度之和最高的字符组合。在一个实施例中,当所述目标字符包括汉字时,所述单元字符包括偏旁部首、或者独体字。根据本公开实施例的第三方面,提供了一种字符识别装置,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:对字符图像进行字符识别,获得字符识别结果;从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标字符;对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个所述字符图像块中包括一个单元字符;根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。本公开的实施例提供的技术方案可以包括以下有益效果:本公开的实施例提供的技术方案,通过对字符图像区域进行细致的切割,获得无法再进一步分割的字符图像块,再通过对字符图像块中单元字符的组合处理,获得置信度较高的字符组合,将置信度较高的字符组合确定为字符图像区域的字符识别结果。该技术提高了字符识别结果的准确度。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种字符识别方法的流程图。图2是根据一示例性实施例示出的一种字符图像的示意图。图3是根据一示例性实施例示出的另一种字符图像的示意图。图4是根据一示例性实施例示出的另一种字符识别方法的流程图。图5是根据一示例性实施例示出的一种字符识别装置的框图。图6是根据一示例性实施例示出的一种字符识别装置的框图。图7是根据一示例性实施例示出的适用于字符识别装置的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。本公开实施例提供了字符识别技术,该技术通过对字符图像区域进行细致的切割,获得无法再进一步分割的字符图像块,再通过对字符图像块中单元字符的组合处理,获得置信度较高的字符组合,将置信度较高的字符组合确本文档来自技高网...

【技术保护点】
一种字符识别方法,其特征在于,包括:对字符图像进行字符识别,获得字符识别结果;从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标字符;对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个所述字符图像块中包括一个单元字符;根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。

【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:
对字符图像进行字符识别,获得字符识别结果;
从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标
字符;
对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像
块,每个所述字符图像块中包括一个单元字符;
根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。
2.如权利要求1所述的方法,其特征在于,所述对所述目标字符所在的
字符图像区域进行切割,包括:
获取所述目标字符的字符排列方向;
将所述字符排列方向作为切割方向,对所述目标字符所在的字符图像区
域进行切割。
3.如权利要求1所述的方法,其特征在于,所述根据所述至少两个字符
图像块对所述字符图像区域重新进行字符识别,包括:
分别对所述至少两个字符图像块进行字符识别,获得所述至少两个字符
图像块各自所包括的单元字符;
按照所述至少两个字符图像块在所述字符图像区域中的排列顺序,对所
述至少两个字符图像块各自所包括的单元字符进行排列;
对排列后的所述单元字符进行组合处理,获得至少两组字符组合;
从所述至少两组字符组合中,确定出置信度满足预设条件的字符组合;
将所述置信度满足预设条件的字符组合确定为所述字符图像区域的字符
识别结果。
4.如权利要求3所述的方法,其特征在于,所述置信度满足预设条件的
字符组合,包括以下第一种字符组合或者第二种字符组合:
第一种字符组合包括:组合内每个字符各自的置信度均大于第二预设阈
值的字符组合;其中,所述第二预设阈值大于或等于第一预设阈值;
第二种字符组合包括:在所述至少两组字符组合中,组合内所有字符各
自的置信度之和最高的字符组合。
5.如权利要求1所述的方法,其特征在于,
当所述目标字符包括汉字时,所述单元字符包括偏旁部首、或者独体字。
6.一种字符识别装置,其特征在于,包括:
第一识别模块,用于对字符图像进行字符识别,获得字符识别结果;
确定模块,用于从所述第一识别模块获得的所述字符识别结果中,确定
出置信度小于或等于第一预设阈值的目标字符;
切割模块,用于对所述确定模块确定出的所述目标字符所在的字符图像
区域进行切割,获得至少两个字符...

【专利技术属性】
技术研发人员:龙飞王百超侯文迪
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1