【技术实现步骤摘要】
本公开涉及字符识别
,尤其涉及字符识别方法及装置。
技术介绍
目前,字符识别技术被应用在了众多领域。在进行诸如身份证信息提取等任务时,出于种种原因字符切割地未必准确,会出现一些错误,常见的错是会将前一个字的偏旁被切到了下一个字中,例如“川”字,在切割时,很容易把最右边的竖切到后面的字符中,从而导致字符识别结果的准确度较低。
技术实现思路
本公开实施例提供了字符识别方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种字符识别方法,包括:对字符图像进行字符识别,获得字符识别结果;从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标字符;对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个所述字符图像块中包括一个单元字符;根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。在一个实施例中,所述对所述目标字符所在的字符图像区域进行切割,包括:获取所述目标字符的字符排列方向;将所述字符排列方向作为切割方向,对所述目标字符所在的字符图像区域进行切割。在一个实施例中,所述根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别,包括:分别对所述至少两个字符图像块进行字符识别,获得所述至少两个字符图像块各自所包括的单元字符;按照所述至少两个字符图像块在所述字符图像区域中的排列顺序,对所述至少两个字符图 ...
【技术保护点】
一种字符识别方法,其特征在于,包括:对字符图像进行字符识别,获得字符识别结果;从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标字符;对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像块,每个所述字符图像块中包括一个单元字符;根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。
【技术特征摘要】
1.一种字符识别方法,其特征在于,包括:
对字符图像进行字符识别,获得字符识别结果;
从所述字符识别结果中,确定出置信度小于或等于第一预设阈值的目标
字符;
对所述目标字符所在的字符图像区域进行切割,获得至少两个字符图像
块,每个所述字符图像块中包括一个单元字符;
根据所述至少两个字符图像块对所述字符图像区域重新进行字符识别。
2.如权利要求1所述的方法,其特征在于,所述对所述目标字符所在的
字符图像区域进行切割,包括:
获取所述目标字符的字符排列方向;
将所述字符排列方向作为切割方向,对所述目标字符所在的字符图像区
域进行切割。
3.如权利要求1所述的方法,其特征在于,所述根据所述至少两个字符
图像块对所述字符图像区域重新进行字符识别,包括:
分别对所述至少两个字符图像块进行字符识别,获得所述至少两个字符
图像块各自所包括的单元字符;
按照所述至少两个字符图像块在所述字符图像区域中的排列顺序,对所
述至少两个字符图像块各自所包括的单元字符进行排列;
对排列后的所述单元字符进行组合处理,获得至少两组字符组合;
从所述至少两组字符组合中,确定出置信度满足预设条件的字符组合;
将所述置信度满足预设条件的字符组合确定为所述字符图像区域的字符
识别结果。
4.如权利要求3所述的方法,其特征在于,所述置信度满足预设条件的
字符组合,包括以下第一种字符组合或者第二种字符组合:
第一种字符组合包括:组合内每个字符各自的置信度均大于第二预设阈
值的字符组合;其中,所述第二预设阈值大于或等于第一预设阈值;
第二种字符组合包括:在所述至少两组字符组合中,组合内所有字符各
自的置信度之和最高的字符组合。
5.如权利要求1所述的方法,其特征在于,
当所述目标字符包括汉字时,所述单元字符包括偏旁部首、或者独体字。
6.一种字符识别装置,其特征在于,包括:
第一识别模块,用于对字符图像进行字符识别,获得字符识别结果;
确定模块,用于从所述第一识别模块获得的所述字符识别结果中,确定
出置信度小于或等于第一预设阈值的目标字符;
切割模块,用于对所述确定模块确定出的所述目标字符所在的字符图像
区域进行切割,获得至少两个字符...
【专利技术属性】
技术研发人员:龙飞,王百超,侯文迪,
申请(专利权)人:小米科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。