提供了一种用于切分具有不同字符宽度的文本行中的字符的方法和系统。该方法包括:第一切分步骤,根据基于投影的方法将所述文本行切分为第一字符集合;计算步骤,基于所述第一字符集合计算平均字符宽度;强制切分步骤,基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;设置步骤,针对所述第二字符集合中的不同字符设置不同的平均字符宽度;以及组合步骤,通过根据所设置的不同的平均字符宽度创建不同的切分模式并且选择最佳切分模式,对所述第二字符集合中的字符进行组合。
【技术实现步骤摘要】
本专利技术涉及光学字符识别,更具体地说,涉及一种用于切分具有不同字符宽度的文本行中的字符的方法和系统。
技术介绍
在光学字符识别(Optical Character Recognition,OCR)系统中,通常,如图3中的流程图所示执行OCR处理。首先,输入通过扫描仪或照相机或者通过其它装置获取的文档图像。该包括多个文本行的文档图像然后被分割成文本行图像。对于每个文本行图像,对该文本行中的字符执行字符切分。之后,基于字符切分的结果,执行字符识别以产生识别结果。通常,在字符切分步骤中,首先基于黑像素投影把文本行图像切分成字符。根据字符宽度、字符高度和行高度等的统计信息,计算平均字符宽度(average character width,ACW)。可选地,此时,可以执行根据连通域方法的字符切分。当切出字符的宽度大于平均字符宽度时,将根据平均字符宽度或者根据如在日本专利申请公报JP05-128307中公开的边界跟踪方法对其进行强制切分(force-split)。然后,通过根据平均字符宽度创建不同的切分模式(路径),把字符的片段(fragments)进行组合。最后,识别所有模式下的字符,并将不同切分模式下的最佳切分结果选择作为字符切分的结果。在该流程中,平均字符宽度是判断一个字符区域是包括一些实际字符还是只包括一个字符的部分或者多个字符的部分的非常重要的标准。在切分字符或者创建合理的切分模式的过程中,平均字符宽度也是重要的判断条件。然而,本专利技术的专利技术人发现,当文档图像中的文本行由具有彼此不同的宽度的字符构成时,看起来有时候一个均一的平均字符宽度无法适合于该文本行中的所有字符。如果平均字符宽度适合于“宽”字符,则一些连通的字符可能不会被正确切分,或者一些字符会被错误地组合为一个字符。“宽”的平均字符宽度还会导致更多的可能的切分模式,这涉及了更多的计算时间或复杂性。如果平均字符宽度仅仅适合于“窄”字符,则一些“宽”字符将被错误地切分成片段。这两种情况都将降低OCR精度。图4A和图4B中例示了说明现有技术中存在的缺陷的一些例子。在图4A中,文本行同时包括一些全宽字符和一些半宽字符(例如,字母、数字或者全宽字符的左或右偏旁)。当使用均一的平均字符宽度来切分字符时,在图4A中示出了字符切分的结果。在该现有技术的例子中,发生了一些字符切分错误,例如,日本汉字“特開”被错误地切分为片段。在图4B中,示出了使用现有技术的字符切分结果。即使对于相同的字体和字号,以日语作为例子,一些假名的宽度也不同于其它假名和/或日本汉字的宽度。例如,具有不同宽度的假名“ Λ 3 ”(在图4B的第二行中)被错误地切分。另外,由于在文本行中存在一些连通的字符,所以难以仅仅基于平均字符宽度找到最佳切分结果。例如,图4B中的假名^ ” (在第一行中)和“ &。”(在第三行中)是连通字符的例子,从而根据现有技术被错误地切分。因此,需要一种能够切分包括全宽字符和半宽字符或者包括具有不同字符宽度的假名和日本汉字的文本行中的字符从而提高OCR精度的技术。还需要一种能够切分具有连通域的字符的技术。
技术实现思路
考虑到前述的现有技术中存在的多个技术问题,提供了一种用于切分具有不同字符宽度的文本行中的字符的新的方法和系统。根据本专利技术的一个方面,提供了一种用于切分具有不同字符宽度的文本行中的字符的方法,包括以下步骤:第一切分步骤,根据基于投影的方法将所述文本行切分为第一字符集合;计算步骤,基于所述第一字符集合计算平均字符宽度;强制切分步骤,基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;设置步骤,针对所述第二字符集合中的不同字符设置不同的平均字符宽度;以及组合步骤,通过根据所设置的不同的平均字符宽度创建不同的切分模式并且选择最佳切分模式,对所述第二字符集合中的字符进行组合。 根据本专利技术的另一方面,提供了一种用于切分具有不同字符宽度的文本行中的字符的系统,包括:第一切分单元,被配置为根据基于投影的方法将所述文本行切分为第一字符集合;计算单元,被配置为基于所述第一字符集合计算平均字符宽度;强制切分单元,被配置为基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;设置单元,被配置为针对所述第二字符集合中的不同字符设置不同的平均字符宽度;以及组合单元,被配置为通过根据所设置的不同的平均字符宽度创建不同的切分模式并且选择最佳切分模式,对所述第二字符集合中的字符进行组合。与根据现有技术的方法的图4A和图4B中的错误切分结果相比,图20A和图20B示出了应用根据本专利技术的方法后的切分结果。从图20A中的切分结果中,可以清楚地看出,包括全宽字符(日本汉字)和半宽字符(字母和数字)的文本行中的字符被正确切分。从图20B中的切分结果中,可以清楚地看出,包括具有连通部分的字符(诸如假名“〃 ^ ”(在第一行中)和“ (在第三行中))的文本行中的字符也被正确切分。基于正确的字符切分结果,对于包括全宽字符和半宽字符的文本行或者包括具有不同字符宽度的假名和日本汉字的文本行或者包括具有连通部分的字符的文本行,光学字符识别的精度将大幅提闻。通过参照附图的以下说明,本专利技术的另外的特征和优点将变得明显。附图说明包含在说明书中并且构成说明书的一部分的附图例示了本专利技术的实施例,并且与说明一起用来解释本专利技术的原理。图1是例示了根据本专利技术的用于切分具有不同字符宽度的文本行中的字符的计算装置的布置的框图。图2是示出了根据本专利技术的一个实施例的用于切分具有不同字符宽度的文本行中的字符的系统的一般结构的功能框图。图3是示出了本专利技术在光学字符识别中的应用的流程图。图4A和图4B示出了根据现有技术的对于具有不同字符宽度的文本行中的字符的字符切分结果的例子。图5是示出了根据本专利技术的一个实施例的用于切分具有不同字符宽度的文本行中的字符的方法的流程图。图6是示出了根据本专利技术的一个实施例的字符切分方法的每个步骤的切分结果的表格。图7示出了需要强制切分处理的文本行的例子。图8示出了在强制切分处理中使用的切分组的例子。图9示出了需要添加新切分点的强制切分的例子。图10是示出了根据本专利技术的一个实施例的图5中的方法的步骤S200的处理的流程图。图11是示出了根据本专利技术的一个实施例的图5中的方法的步骤S300的处理的流程图。图12是示出了根据本专利技术的一个实施例的图5中的方法的步骤S400的处理的流程图。图13是基于平均字符宽度在一个切分组中寻找切分点的一种方法的流程图。图14示出了如何在切分组中设置搜索位置。图15是示出了动态确定的搜索点的搜索范围的表格。图16示出了步骤S400之后的强制切分结果。图17是示出了根据本专利技术的一个实施例的图5中的方法的步骤S500的处理的流程图。图18是示出了根据本专利技术的另一个实施例的图5中的方法的步骤S500的处理的流程图。图19示出了图17中的步骤S530的详细处理。图20A和图20B示出了在应用了根据本专利技术的方法后对于具有不同字符宽度的文本行中的字符的字符切分结果的例子。具体实施例方式在下面将参照附图详细说明本专利技术的实施例。在本说明书中,术语“左”和“右”表示当按照人正常阅读文档时的通常方式观看图像时的左手侧和右手侧本文档来自技高网...
【技术保护点】
一种用于切分具有不同字符宽度的文本行中的字符的方法,包括以下步骤:第一切分步骤,根据基于投影的方法将所述文本行切分为第一字符集合;计算步骤,基于所述第一字符集合计算平均字符宽度;强制切分步骤,基于计算的平均字符宽度,对所述第一字符集合中的宽字符进行强制切分,以获得第二字符集合;设置步骤,针对所述第二字符集合中的不同字符设置不同的平均字符宽度;以及组合步骤,通过根据所设置的不同的平均字符宽度创建不同的切分模式并且选择最佳切分模式,对所述第二字符集合中的字符进行组合。
【技术特征摘要】
【专利技术属性】
技术研发人员:罗兆海,李献,
申请(专利权)人:佳能株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。