字符切取方法、使用该方法的字符识别装置及程序制造方法及图纸

技术编号:10523354 阅读:166 留言:0更新日期:2014-10-08 20:03
一种有关从字符串的浓淡图像中切取字符串内的各个字符的方法及装置的发明专利技术,使执行以下步骤:第1步骤,变更投影对象位置并反复执行向沿着浓淡图像中的字符串的轴向的投影处理;第2步骤,从所生成的投影图案(P)中提取极大值和极小值,在极大值的变动范围和极小值的变动范围之间设定具有与这些值的变化对应的斜率的直线(M);以及第3步骤,设定切取对象范围并切取该范围的图像。在浓淡图像中的字符比背景暗的情况下,在第1步骤中对沿着字符串的线段中的最小浓度进行投影,在第3步骤中将投影图案(P)中的比直线(M)低的浓度的投影范围作为切取对象范围。在浓淡图像中的字符比背景亮的情况下,在第1步骤中对沿着字符串的线段中的最大浓度进行投影,在第3步骤中将投影图案(P)中的比直线(M)高的浓度的投影范围作为切取对象范围。

【技术实现步骤摘要】
【国外来华专利技术】字符切取方法、使用该方法的字符识别装置
本专利技术涉及基于图像处理的字符识别处理,尤其涉及用于从处理对象的图像中逐个字符地切取识别对象的字符的技术。
技术介绍
在字符识别处理中,通常从拍摄字符串而生成的浓淡图像中切取各个字符,对切取出的每个字符实施使用了各种字符模型的匹配处理(模型匹配),从而识别字符串的内容。在字符的切取处理中,将处理对象的图像的2值化数据或者浓淡数据向x轴方向、y轴方向分别进行投影,从在各轴生成的投影图案中提取与字符对应的部位,由此确定与各个字符对应的区域(以下称为“字符区域”)。作为有关字符识别处理的现有技术,在专利文献1中记载了这样的内容,将从通过投影处理而得到的浓度直方图中切取出的字符的宽度与阈值进行比较,在字符宽度大于阈值的情况下,视为有可能多个字符接触,并再次进行切取(参照第0024~0027段等。)。另外,还记载了这样的内容,在切取后的识别处理结果的可靠度较低的情况下、或核对对象的图像与表示字符的一部分的模型(汉字的偏旁的模型等)一致的情况下等,再次执行切取处理(参照第0037段等。)。另外,在专利文献2中记载了这样的内容,在切取字符后进行暂时匹配处理而计算匹配可靠度,根据满足匹配可靠度为规定的基准值以上等条件的候选字符来决定全角字符的标准字符长度,以匹配可靠度低于固定值的区域为对象执行基于标准字符长度的半角字符切取处理(参照第0061段、第0078~第0085段等)。现有技术文献专利文献专利文献1:日本公开专利公报1997-282417号公报专利文献2:日本公开专利公报2010-44485号公报
技术实现思路
专利技术要解决的问题在通常的字符切取处理中,采取将沿着投影方向的一条线段内的图像数据(2值或者多值)进行累计的方法。但是,由于印刷有识别对象的字符串的介质的样式和阴影等,背景部分的浓度的不均匀增大,导致背景部分的投影值与字符部分的投影值之差减小,进而切取的精度下降。另外,在处理对象的字符串的字符之间的间距和字符宽度不一致、或相邻的字符之间的间隙微小时,即使是在投影图案中,也存在与字符对应的部位与与背景部分对应的部位的差异不明确而导致字符的切取失败的情况。这样在切取字符的处理产生失败时,在以后的匹配处理中也产生错误识别,因而字符的识别精度下降。关于上述问题,在专利文献1、2中披露了这样的技术思想:在切取字符后进行识别处理,以识别的精度较差的部位为对象再次进行切取,但是在这种方法中,处理复杂且花费时间,因而不适合于被要求处理的高速化的用途。本专利技术的课题是着眼于上述问题,通过简单的处理高精度地切分字符串中的各个字符,并高速地进行稳定的切取处理。用于解决问题的手段为了解决上述问题,在基于本专利技术的字符切取方法中执行以下的第1步骤、第2步骤、第3步骤。在第1步骤中,关于将沿着横穿处理对象的浓淡图像中的字符串的方向的线段中的最大浓度或者最小浓度投影到沿着字符串的轴上的投影处理,在浓淡图像中的字符比背景暗的情况下,选择最小浓度使投影对象位置沿着字符串移动并反复进行投影处理,在浓淡图像中的字符比背景亮的情况下,选择最大浓度使投影对象位置沿着字符串移动并反复进行投影处理。在第2步骤中,从通过第1步骤而生成的投影图案中提取极大值和极小值,在极大值的变动范围和极小值的变动范围之间设定具有与这些值的变化对应的斜率的直线。在第3步骤中,当在第1步骤中对最大浓度进行了投影的情况下,将投影图案中的比直线高的浓度的投影范围作为切取对象范围,切取浓淡图像中的切取对象范围的图像,当在第1步骤中对最小浓度进行了投影的情况下,将投影图案中的比直线低的浓度的投影范围作为切取对象范围,切取浓淡图像中的切取对象范围的图像。根据上述的方法,例如在将字符比背景暗的状态的图像作为处理对象的情况下,在第1步骤的投影处理中,将沿着横穿字符串的方向的线段中的最小浓度投影到沿着字符串的轴上。使投影对象位置沿顺着字符串的轴移动并反复执行该处理,由此生成与字符对应的部位成为谷底、与字符之间的间隙对应的部位成为山脊的投影图案。将在该投影图案的极小值(字符部分)的变动范围和极大值(字符之间的间隙部分)的变动范围之间设定的直线作为切取范围的特定的基准,由此能够根据部位变更切取用的基准值。因此,即使是根据样式等在背景中产生浓淡不均的图像,也能够在相对于该浓度的偏差范围具有足够余量的位置设定直线。并且,即使是字符串的一部分由于阴影等的影响而变暗的情况下,也能够设定具有与浓度的变化对应的斜率的直线,因而无论在沿着字符串的哪个部位,都能够准确判别字符的切取的范围。在基于上述方法的第一方式中,在第1步骤中,对于与沿着字符串的轴垂直且通过投影对象位置的线段,针对以该线段内的一点为中心旋转规定的角度时的旋转范围中所包含的多条线段,分别提取该线段内的最大浓度及最小浓度中的与所述选择对应的浓度,在选择了最大浓度的情况下,将在各条线段中提取的值中的最小值投影于投影对象位置,在选择了最小浓度的情况下,将在各条线段中提取的值中的最大值投影于投影对象位置。在仅将横穿字符串的一条线段作为投影的对象时,在字符之间的间隔狭窄的字符串中,字符之间的间隙部分的相邻的字符的一部分在间隙内凸出,该凸出部分落在投影对象的线段上,有可能导致字符部分的浓度被投影。但是,根据上述的方式,在针对字符之间的间隙部分的投影处理中,能够对从所设定的多条线段中未承载字符的图像的线段提取出的浓度进行投影,因而能够提高字符的切取的精度。在基于第二方式的方法中,将在第2步骤中设定的直线与通过第1步骤而生成的投影图案一起显示,按照变更操作来变更直线相对于投影图案的高度或者斜率。根据该方法,用户自身能够确认投影图案与直线的关系,并将直线变更为适合于切分各极大值的组和各极小值的组的状态,因而能够提高字符的切取的精度。本专利技术的字符识别装置具备这样的功能:输入通过拍摄字符串而生成的浓淡图像作为识别对象,在切取该图像中的字符串内的各个字符后,将切取出的字符分别与预先登记的模型核对来识别各字符。另外,为了实施上述的字符切取方法,该字符识别装置具备:投影处理单元,其使投影对象位置沿着字符串移动并反复进行投影处理,在该投影处理中将沿着横穿识别对象浓淡图像中的字符串的方向的线段中的最大浓度或者最小浓度投影到沿着字符串的轴上;直线设定单元,其从通过投影处理而生成的投影图案中提取极大值和极小值,在极大值的变动范围和极小值的变动范围之间设定具有与这些值的变化对应的斜率的直线;以及切取处理单元,在投影处理单元对最大浓度进行了投影的情况下,将投影图案中的比直线高的浓度的投影范围作为切取对象范围,切取所述浓淡图像中的切取对象范围的图像,在投影处理单元对最小浓度进行了投影的情况下,将投影图案中的比直线低的浓度的投影范围作为切取对象范围,切取所述浓淡图像中的切取对象范围的图像。投影处理单元被设定成,在识别对象浓淡图像中的字符比背景暗的情况下选择最小浓度,在识别对象浓淡图像中的字符比背景亮的情况下选择最大浓度。上述的字符识别装置的一个实施方式的投影处理单元针对与沿着字符串的轴向垂直且通过投影对象位置的线段,设定以该线段内的一点为中心旋转规定的角度时的旋转范围中所包含的多条线段,按照这些线段分别提取线段内的最大浓度或者最小浓度,当在本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201280069152.html" title="字符切取方法、使用该方法的字符识别装置及程序原文来自X技术">字符切取方法、使用该方法的字符识别装置及程序</a>

【技术保护点】
一种字符切取方法,从拍摄字符串而生成的浓淡图像中切取所述字符串内的各个字符,以便进行识别,其特征在于,该字符切取方法包括以下步骤:第1步骤,关于将沿着横穿所述浓淡图像中的字符串的方向的线段中的最大浓度或者最小浓度投影到沿着所述字符串的轴上的投影处理,在浓淡图像中的字符比背景暗的情况下,选择最小浓度使投影对象位置沿着字符串移动并反复进行投影处理,在所述浓淡图像中的字符比背景亮的情况下,选择最大浓度使投影对象位置沿着字符串移动并反复进行投影处理;第2步骤,从通过所述第1步骤而生成的投影图案中提取极大值和极小值,在极大值的变动范围和极小值的变动范围之间设定具有与这些值的变化对应的斜率的直线;以及第3步骤,当在所述第1步骤中对最大浓度进行了投影的情况下,将所述投影图案中的比直线高的浓度的投影范围作为切取对象范围,切取所述浓度图像中的切取对象范围的图像,当在第1步骤中对最小浓度进行了投影的情况下,将所述投影图案中的比直线低的浓度的投影范围作为切取对象范围,切取所述浓度图像中的切取对象范围的图像。

【技术特征摘要】
【国外来华专利技术】2012.02.17 JP 2012-0328881.一种字符切取方法,从拍摄字符串而生成的浓淡图像中切取所述字符串内的各个字符,以便进行识别,其特征在于,该字符切取方法包括以下步骤:第1步骤,关于将沿着横穿所述浓淡图像中的字符串的方向的线段中的最大浓度或者最小浓度投影到沿着所述字符串的轴上的投影处理,在浓淡图像中的字符比背景暗的情况下,选择最小浓度使投影对象位置沿着字符串移动并反复进行投影处理,在所述浓淡图像中的字符比背景亮的情况下,选择最大浓度使投影对象位置沿着字符串移动并反复进行投影处理;第2步骤,从通过所述第1步骤而生成的投影图案中提取极大值和极小值,在极大值的变动范围和极小值的变动范围之间设定具有与这些值的变化对应的斜率的直线;以及第3步骤,当在所述第1步骤中对最大浓度进行了投影的情况下,将所述投影图案中的比直线高的浓度的投影范围作为切取对象范围,切取所述浓淡图像中的切取对象范围的图像,当在第1步骤中对最小浓度进行了投影的情况下,将所述投影图案中的比直线低的浓度的投影范围作为切取对象范围,切取所述浓淡图像中的切取对象范围的图像,在所述第1步骤中,对于与沿着所述字符串的轴垂直且通过投影对象位置的线段,针对以该线段内的一点为中心旋转规定的角度时的旋转范围中所包含的多条线段,分别提取该线段内的最大浓度及最小浓度中的与所述选择对应的浓度,在选择了最大浓度的情况下,将在各条线段中提取的值中的最小值投影于所述投影对象位置,在选择了最小浓度的情况下,将在各条线段中提取的值中的最大值投影于所述投影对象位置。2.根据权利要求1所述的字符切取方法,其特征在于,将在所述第2步骤中设定的直线与通过所述第1步骤而生成的投影图案一起显示,按照变更操作来变更直线相对于投影图案的高度或者斜率。3.一种字符识别装置,输入通过拍摄字符串而生成的浓淡图像作为识别对象,在切取该图像中的字符串内的各个字符后,将切取出的字符分别与预先登记的模型核对来识别各字...

【专利技术属性】
技术研发人员:藤枝紫朗
申请(专利权)人:欧姆龙株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1