一种字符切分的方法和装置制造方法及图纸

技术编号:7917901 阅读:205 留言:0更新日期:2012-10-25 02:54
本发明专利技术公开了一种字符切分的方法,首先,输入待处理的图像,将所述图像转换成二值或灰度图像;利用提取连通域或投影方法对图像中的一行字符进行第一次切分;对于第一次切分后得到的字符按照预定规则进行拆分和/或合并;对于经过以上步骤处理后得到的每个字符计算匹配分数,根据这些分数建立一个二维的字符匹配表;按照一行内所有字符加起来匹配分数最高的规则确定一行内所有字符的切分点,进行第二次切分得到最终切分结果。采用了本发明专利技术的技术方案,能够解决图像中一行字符的通用切分问题,对汉字、数字和英文字母的任意组合进行切分。

【技术实现步骤摘要】

本专利技术涉及图像识别及处理
,尤其涉及一种字符切分的方法和装置
技术介绍
一般情况下,针对某种类型的字符,例如文档影像中的中文字符、字母和数字,都会通过专门的独立算法进行专门的切分,因为这样的切分准确度最高。例如专门通过算法A来实现对汉字的切分,通过算法B对字母和数字切分,当出现数字、字母和中文字符混排的情况时,再写一个算法C专门处理这种情况。这样处理存在两个问题,第一是没有办法做到通用切分,不能使用一种方法来保 证各种字符切分的准确度;第二是在实际使用各种切分方法时,有时候并不能预先确定一行字符的具体类型,一行字符可能有时候是全汉字类型,有时候是混排类型,当不能确定字符的具体类型时,就不能选用对应的具体算法来进行切分。也有研究人员曾提出一种基于识别反馈的粘连字符切分的方法,主要是针对粘连字符的切分处理,该方法具体实现的流程图如图I所示,主要通过搜索可能的切分位置,也就是找到可能的粘连字符,把粘连字符提取出来,然后进行切分和辨认,通过调用识别模块对粘连字符进行识别,根据反馈结果找出可靠度最大的切分点。这种方法主要有以下缺点一是仅针对粘连字符来进行切分,不具有通用性;二是该方法并不支持多个识别引擎的反馈,很多时候一个识别引擎的识别结果可能不是最优的,在不同的情况下,不同的识别引擎表现不同;三是该方法只是对给定的一个粘连字符进行切分,没有考虑到粘连字符本身可能并不是由两个独立的字符粘连到一起,他们可能是其他字符的组成部分,即使这些字符被切分开了,由于没有合并,那么这些字符也不能正确定位;四是粘连字符切分过程中要确定是汉字粘连还是字母数字粘连,一种粘连切分失败后,在去判断另外一种类型的粘连,并且把切分正确与否的决定权完全交给了识别模块,这对识别模块提出了很高的要求。实际上我们使用识别模块的时候识别率并不是100%的;五是由于该方法只是考虑了单个粘连字符的处理,因此在实际应用中只能作为字符切分方法的一部分,并不是一个完整的技术方案。
技术实现思路
本专利技术的目的是提出的一种字符切分的方法和装置,能够解决图像中一行字符的通用切分问题,适用的字符类型包括中文字符、数字和字母。本专利技术通过充分利用单字字符本身的特征、字符之间间距的特征、单字识别核心库的特征以及整体合并拆分策略来实现用通用的处理方式对汉字、数字和英文字母的任意组合进行识别切分。本专利技术的思想在于,对图像中的一行字符进行预处理及初步切分,对初步切分过的每一个字符计算匹配分数,建立行内所有字符的字符匹配表,每一个字符或者字符组合得到的识别结果都允许由多个识别器来确定,这样增强了准确性。最终的切分点以字符匹配表为基础,以一行内所有字符的匹配分数最高为原则来确定。为达此目的,本专利技术采用以下技术方案本专利技术的一个方面,提供了一种字符切分的方法,包括步骤A、输入待处理的图像,将所述图像转换成二值或灰度图像;B、利用提取连通域或投影方法对图像中的一行字符进行第一次切分;C、对于第一次切分后得到的字符按照预定规则进行拆分和/或合并;D、对于经过步骤C处理后得到的每个字符计算匹配分数,建立一个二维的字符匹配表。E、按照一行内所有字符加起来匹配分数最高的规则确定每个字符的切分点,进行第二次切分,得到最终切分结果。 上述技术方案中,优选地,还包括步骤F、对步骤E得到的最终切分结果进行聚类处理,去掉干扰字符。上述技术方案中,优选地,所述步骤A还包括去黑边和去噪处理。上述技术方案中,优选地,所述步骤C中的预定规则具体为当一个字符的最大宽度超过了第一预设值时,对这个字符进行拆分处理;当两个相邻字符的重合度大于第二预设值时,对这两个相邻字符进行合并处理。上述技术方案中,优选地,所述步骤D中计算字符的匹配分数具体包括以下步骤步骤一首先,将第i个字符到第j个字符进行合并,并设置Aij的初始值Aij =0 ;步骤二 如果合并后的字符宽度大于所述第一预设值时转至步骤八,否则继续执行步骤三;步骤三根据合并后的字符的外部信息及所有的识别引擎的信息确定合并后的字符类型A ;步骤四用一个还未参与过本次合并字符识别的识别引擎对所述合并后的字符进行识别,得到识别结果,确定合并后的字符类型B ;如果所有识别引擎都参与了识别,转步骤八;步骤五如果A和B相同,则根据本次识别结果的置信度信息和合并字符的外部信息得到合并后的字符的本次匹配分数Bij ;如果A和B不同转步骤四;步骤六取Aij和Bij中较大值作为第i个字符的匹配分数;步骤七重复步骤四-步骤六;步骤八Aij计算完成。上述技术方案中,优选地,还包括步骤用其他的识别引擎,分别重复识别步骤并计算匹配分数,比较得到的各个匹配分数,取最大的匹配分数作为第i个字符的匹配分数;其中,当识别引擎的置信度信息表示不统一时,预先对置信度信息进行归一化处理。根据本专利技术的另一个方面,还提供了一种字符切分的装置,包括图像预处理单元、字符第一次切分单元、字符拆分合并单元、匹配分数计算单元和字符第二次切分单元,上述单各元依次连接,其中所述图像预处理单元,用于输入待处理的图像,将所述图像转换成二值或灰度图像;所述字符第一次切分单元,用于利用提取连通域或投影方法对图像中的字符进行第一次切分;所述字符拆分合并单元,用于对于第一次切分后得到的不少于一个的字符按照预定规则进行拆分和/或合并;所述匹配分数计算单元,用于对于经过第一次切分后得到的字符,建立一个二维的字符匹配表并计算每一个字符的匹配分数; 所述字符第二次切分单元,用于按照一行内所有字符加起来匹配分数最高的规则确定所述剩余的字符的切分点,进行第二次切分,得到最终切分结果。上述技术方案中,优选地,还包括聚类单元,用于对步骤E得到的最终切分结果进行聚类处理,去掉干扰字符。上述技术方案中,优选地,所述图像预处理单元还用于去黑边和去噪处理。上述技术方案中,优选地,所述第一次切分单元进一步用于当一个字符的最大宽度超过了第一预设值时,对这个字符进行拆分处理;当两个相邻字符的重合度大于第二预设值时,对这两个相邻字符进行合并处理。采用了本专利技术的技术方案,能够实现对图像中中文字符、英文字符和数字字符三种字符任意排列情况下的切分,使得在实际应用中不用根据字符类型去选择切分算法,对于模板化的系统带来了便利。同时本专利技术具有很强的扩展性,如果需要对其他类型的字符进行切分,只需要描述准确该类型字符的特征,如宽高比,字符间距等,并且有相应的识别引擎作支持即可。附图说明图I是本专利技术现有技术的流程图。图2是本专利技术中具体实施方式中一种字符切分方法的流程图。图3是本专利技术中具体实施方式中匹配分数计算的流程图。图4是本专利技术中具体实施方式中一种字符切分装置的结构示意图。具体实施例方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图2是本专利技术具体实施方式中一种字符切分的方法的流程图。如图2所示,该字符切分方法包括以下步骤步骤201 :输入待处理的图像,将所述图像转换成二值或灰度图像。图像预处理的目的是将给定图像处理成初步的字符切分时需要的二值或者灰度图像类型,同时可能包括去黑边,去噪等操作。步骤202 :在给定图像进行预处理之后,利用提取连通域或者投影的算法或者其他方法来对字符进行初步切分。字本文档来自技高网
...

【技术保护点】
一种字符切分的方法,其特征在于,包括步骤:A、输入待处理的图像,将所述图像转换成二值或灰度图像;B、利用提取连通域或投影方法对图像中的一行字符进行第一次切分;C、对于第一次切分后得到的字符按照预定规则进行拆分和/或合并;D、对于经过步骤C处理后得到的每个字符计算匹配分数,建立一个二维的字符匹配表。E、按照一行内所有字符加起来匹配分数最高的规则确定每个字符的切分点,进行第二次切分,得到最终切分结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:张雪玲
申请(专利权)人:北京文通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1