一种印刷体斜体字符的识别方法技术

技术编号:2942131 阅读:356 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种印刷体斜体字符的识别方法。针对现有的斜体字符检测方法只能对单个待识别字符进行逐点判断,导致计算量较大,连续黑像素点的搜索算法复杂的问题而发明专利技术。本发明专利技术一种印刷体斜体字符的识别方法包括:将欲识别的图像二值化为黑白二值图像,并切分出单行的文字行;首先,获取图像单行字符在竖直方向及固定倾斜方向上的投影直方图;然后,对比竖直方向和固定倾斜方向的投影直方图,分析字符间距特征,确定斜体字区域;最后,对字符行的斜体字区域进行校正。本发明专利技术提高了对斜体字符的识别速度和识别率,降低了计算量,适用于各种需要对印刷体字符进行识别和校正的领域。

【技术实现步骤摘要】

本专利技术涉及计算机信息处理领域的光学字符识别技术,尤其涉及。
技术介绍
斜体字符检测技术是一种非常有用的图像处理技术。对黑白二值图像中的斜体字符进行检测,可以对斜体字符加以校正,使整个识别系统对斜体字符与正常字符采用统一的识别方法,降低识别系统的复杂度,有效的提高识别系统的识别速度;此外很多识别系统的字符特征库中仅包含正常字符的特征,此类识别系统依赖于使用提取字符的正常特征的稳定性识别该字符的正常体与斜体,其对斜体字符的识别率不够理想。此时,若向特征库中加入斜体字符特征将使特征库规模骤增,识别效率降低。对斜体字符检测校正后再进行识别,可以在保持特征库原有规模的基础上大大提高图像的识别率。现有技术中,检测斜体字符基本思路是通过分析字符中笔划的走向,对字符中的连续的黑像素进行逐点判断,确定两两像素之间的位置关系,进而求出字符中所有笔划与竖直方向的夹角,在这些夹角中找出竖笔划的倾斜角度,由此来确定整个字符的倾斜方向与倾斜角度。这种检测方法的关键在于像素点的搜索策略。使用合理的搜索方法进行逐点判断才能比较准确快速的确定笔划的倾斜角度。文献“中文斜体印刷字倾斜角度的检测方法”较好地使用了竖直笔划的倾斜角度确定了字符整体的倾斜角度,从而进行校正。还有很多文献涉及到斜体字符的识别,虽然没有明确的提出斜体字符的检测方法,但他们都提取比较稳定的字符特征,这些特征可以同时识别同一字符的正常体与斜体,如文献“鲁棒的多体印刷英文识别系统的实现”描述了这种斜体字符的识别方法。现有的斜体字符检测方法都需要对每个待识别字符进行逐点判断,其计算量较大,对于连续黑像素点的搜索算法复杂。当图像中字符较多,或者批量识别图像样张时,将大大的延长识别的时间,导致系统的整体识别速度下降。若不使用特定的检测方法,单纯依靠提取字符的某项特征对斜体字符进行识别,由于每种字符特征的稳定性有限,导致整个系统对斜体字符的识别率不高,难以达到实用的要求。
技术实现思路
针对现有技术中存在的缺陷和不足,本专利技术的目的是提供一种能够对多个连续的斜体字进行识别的印刷体斜体字符的识别方法。为达到上述目的,本技术采用以下技术方案。包括将欲识别的图像二值化为黑白二值图像,并切分出单行的文字行,步骤一,获取图像单行字符在竖直方向及固定倾斜方向上的投影直方图;步骤二,对比竖直方向和固定倾斜方向的投影直方图,分析字符间距特征,确定斜体字区域;步骤三,对字符行的斜体字区域进行校正;步骤四,将校正后的斜体字区域送入识别系统进行识别。在上述印刷体斜体字符的识别方法中,确定斜体字区域的方法为当倾斜方向投影直方图上的字符间距的个数大于竖直方向投影直方图的字符间距个数的1.5倍,则该文字行为斜体字符行。分析字符间距特征,确定斜体字符区域的原理为对于正常样张中的字符,字符间均存在明显的字间距。不考虑样张中污点及字符扭曲的干扰,那么对于正常体的字符行进行竖直方向的投影,理论上将获得一系列的孤峰,峰与峰之间将存在一定宽度的截断,即在该宽度内Y方向取值为0,此宽度即为两个字符间的字间距。在理想的竖直方向投影直方图上,表现为字符行中较为明显且规则的字符间距。再对以上文字行进行固定倾斜方向的投影,获得其固定倾斜投影直方图,可以发现在倾斜投影直方图上,孤峰的数量减少,峰与峰之间未被截断或截断宽度很小。这表明,正常体的字符在其竖直方向投影直方图上表现出了良好的字符间距特征,而在其固定倾斜方向投影直方图上的字符间距特征较差。相反,斜体字符行将在其固定倾斜投影的直方图上表现出更好的的字符间距特征。若文字行中既存在正常体字符又存在斜体字符,则该文字行中的正常体字符将在其竖直投影直方图的对应区域内表现出良好的字符间距特征,而在其固定倾斜投影直方图上的字符间距特性较差。相反,文字行中的斜体字符将在其固定倾斜投影直方图的对应区域表现出良好的字符间距特征。根据以上原理,我们对一个未知的文字行分别进行竖直及固定倾斜方向的投影,对比两个直方图的字符间距特征,确定斜体字区域,并对这些斜体字符进行倾斜校正,使其能与其他正常体字符一起进入识别系统被识别出,从而在不增大识别系统规模的基础上使其能够支持对斜体字符进行识别。当图像中字符较多,或者批量识别图像样张时,本专利技术大大缩短了识别时间,提高了系统的识别速度。附图说明图1为本专利技术印刷体斜体字符的识别方法的流程图;图2为待处理的图像样张;图3为待处理图像样张中的斜体字符;图4为检测校正后的斜体字符;图5为上述斜体字符在竖直方向的投影直方图;图6为上述斜体字符在固定倾斜方向的投影直方图;图7为使用本专利技术方法(左)和不使用本专利技术方法(右)对待处理图像样张的识别结果的效果对比。具体实施例方式下面结合附图和具体实施例对本专利技术作进一步详细说明。图1列出了本专利技术各步方法的流程示意图,包括以下步骤1、获取图像单行字符在竖直方向及固定倾斜方向上的投影直方图。分别对二值化后的黑白二值图像的文字行(图3)统计竖直方向的投影直方图H(x)(图5)以及固定倾斜方向的投影直方图S(x)(图6)。在计算文字行倾斜投影前,需要确定投影的倾斜角度。对于横排文字行,以水平线为基线,水平向右为正方向,则投影射线与水平正方向的夹角θ的正切值为1/3。该正切值为经验值,通过调查多种字体多种字号的不同内码的斜体汉字字符后而确定,该经验值为这些斜体汉字的倾斜角度正切值的平均值。对文字行进行竖直方向投影时,其直方图的宽度与文字行的宽度LWidth相同,即H(x)中,x∈;但进行倾斜投影时,其直方图宽度为LWidth+2*LHeight/tanθ,其中LHeight为文字行高度,θ为投影射线与水平方向的夹角,即S(x)中,x∈。这是由于倾斜投影使文字行在水平方向的投影宽度被拉伸造成的,拉伸导致的宽度增幅恰为2*LHeight/tanθ。2、对比不同方向的投影直方图,分析字符间距特征,确定斜体字符所在的区域。分析字符间距特征,确定斜体字符区域的原理为对于正常样张中的字符,字符间均存在明显的字间距。不考虑样张中污点及字符扭曲的干扰,那么对于正常体的字符行进行竖直方向的投影,理论上将获得一系列的孤峰,峰与峰之间将存在一定宽度的截断,即在该宽度内Y方向取值为0,此宽度即为两个字符间的字间距。在以上理想的竖直投影直方图上,将表现字符行中较为明显且规则的字符间距。再对以上文字行进行固定倾斜方向的投影,获得其固定倾斜投影直方图,可以发现在固定倾斜投影直方图上,孤峰的数量减少,峰与峰之间未被截断或截断宽度很小。这表明,正常体的字符在其竖直投影直方图上表现出了良好的字符间距特征,而在其固定倾斜投影直方图上的字符间距特征较差。相反,斜体字符行将在其固定倾斜投影的直方图上表现出更好的的字符间距特征。因此,根据以上原理,我们对一个未知的文字行分别进行竖直及固定倾斜方向的投影,对比两个直方图的字符间距特征,则可得到文字行倾斜与否的结论。另外,在样张中,斜体字符有时整行出现,有时仅作为文字行中连续的若干个字符出现。因此,在对比不同方向的投影直方图中,不能只注重文字行的整体投影特征,这样可能将文字行中的斜体区域的字符的特征抹煞掉,应当以一小段区域为单位,对比其不同方向的投影的字符间距特征,对于字符间距特征相同的连续的区域可以进行合并。依据以上原本文档来自技高网
...

【技术保护点】
一种印刷体斜体字符的识别方法,包括:将欲识别的图像二值化为黑白二值图像,并切分出单行的文字行,其特征在于,还包括以下步骤:步骤一,获取图像单行字符在竖直方向及固定倾斜方向上的投影直方图;步骤二,对比竖直方向和固定倾斜方向的投 影直方图,分析字符间距特征,确定斜体字区域;步骤三,对字符行的斜体字区域进行校正;步骤四,将校正后的斜体字区域送入识别系统进行识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:贺白康凯
申请(专利权)人:北大方正集团有限公司北京北大方正技术研究院有限公司北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1