一种基于模板匹配的字符识别方法技术

技术编号:7759552 阅读:421 留言:0更新日期:2012-09-14 02:03
一种基于模板匹配的字符识别方法,属于模式识别与图像处理技术领域,具体涉及图像匹配及识别,本方法可以对字符图像进行识别。目的是开发一种简单快速有效的字符识别方法,从而能够获取图像中的字符信息。本发明专利技术主要包含如下几个处理单元:图像尺度变换、图像二值化、图像归一化、模板匹配及字符判别。在整个处理过程中,对OTSU分割、图像缩放、上下文信息、模板匹配等方法进行了综合的应用。本发明专利技术可以(但不限于)应用于实时的车牌识别系统中的字符识别模块。

【技术实现步骤摘要】

本专利技术属于模式识别与图像处理
,具体涉及模板匹配识别,本方法用于对图像中的字符进行识别,从而将图像信息转化为文字信息。
技术介绍
字符识别是许多智能系统的关键组成部分。例如在车牌识别系统中,字符识别是最后一步。字符识别属于模式识别范畴,现有的模式识别在理论、方法与实践方法的成果,为字符识别提供了丰富的解决方法。 从统计模式识别的观点来看,字符的识别实际上一个模式分类的问题。国内外学者提出了许多不同的识别方案,大致可分为基于分类器的识别方法和基于模式/模板匹配的方法。从公开的论文来看,利用分类器进行识别的方法可以获得较好的识别结果。例如有 D. Llorens 等人提出的 “Car License Plates Extraction and Recognition Based onConnected Components Analysis and HMM Decoding”。但是分类器的方法需要大量的学习样本进行训练。同时,像ANN这样的分类算法存在收敛性和过学习的问题。模板匹配算法适用于没有旋转角的固定大小的单字符识别。通常采用的是对二值图像进行匹配。P. Comelli 等人在文献“Optical recognition of motor vehicle licenseplates. ”中提出了模板匹配在字符识别中的应用。从实时性、算法复杂性等角度考虑,模板匹配算法能够满足字符识别的任务。但是模板匹配也有其缺陷,即对同一类字符在不同图像中的尺度多变性以及光照多变性敏感,容易产生匹配偏差,因此,需要加入特殊处理手段。这也是在本专利技术中,着重解决的问题。
技术实现思路
针对现有技术存在的上述问题,本专利技术提出,该方法在传统的模板匹配算法基础上,加入多尺度和位移变换,以解决实际场景中存在的字符多样性问题。为了实现上述目标,本专利技术采用了如下技术手段,其特征在于,该方法包括下述步骤(I)获取待识别的单个字符图像;(2)首先获取待识别的字符图像中字符的原始尺度,并在原始尺度的基础上分别增加和减少F个像素作为两个新的尺度,分别以原始尺度和两个新的尺度在原始图像中截取包含字符的子图像,得到三个子图像;F的取值范围为I 3 ;(3)对步骤(2)得到的三个子图像进行二值化;(4)对步骤(3)中得到的二值化处理后的图像进行归一化,得到字符的三幅二值图像;(5)将步骤(4)中得到的归一化后的同一字符的三幅二值图像分别与模板库中的每一个标准模板字符图像进行模板匹配,得到相关系数值;(6)将步骤(5)中得到27个相关系数值按大小进行排序,选择最大的相关系数值对应的标准模板字符图像,以该标准模板字符图像所对应的字符类别作为待识别字符图像的字符类别,完成识别过程。在实际应用中,本专利技术具有如下有益效果I、本专利技术采用的模板匹配方法,通过计算待识别字符与标准模板字符图像之间的相关系数值来度量它们的相似程度。相对于利用分类器识别的方法,不需要采集大量的字符样本,同时对不同的字符有较好的适应性;2、本专利技术的字符识别方法中,采用多尺度和多位移的模板匹配,相对于传统的模板匹配,克服了字符的尺度和位置的多样性带来的匹配误差,对实际场景的复杂性较为鲁棒;3、本专利技术的字符识别方法中,采用了局部OTSU阈值分割,相对于传统的全局OTSU阈值分割,能够较完整地提取字符区域,从而可以得到更为准确的相关系数值;4、本专利技术的字符识别方法,由于采用了模板匹配的算法,因而实时性较好,能应用于对实时性要求较高的工程项目中。附图说明图I是本专利技术方法的流程示意图;图2是字符上下文尺度推断流程图;图3是局部OTSU分割子区域选取;图4是全局OTSU分割与局部OTSU分割结果对比;图5是本专利技术方法流程图。具体实施例方式如图I所示,本专利技术方法首先要构建模板库,其过程为根据待识别字符的类型,采集一批已知类别的字符图像,将它们二值化,并具有同样大小的尺度,作为标准模板字符图像,标准模板字符的字体与待识别字符的字体相同。如果待识别字符为印刷体,相应地,采集的字符也为标准的印刷体字符图像;如果待识别字符为手写体,则采集已知字符类别的手写体字符图像作为标准模板字符图像。标准模板字符图像构成模板库,模板库中标准模板字符图像个数由待识别字符本身可能包含的字符数决定,如待识别字符为英文字母,模板库为26个字母。模板库可以根据需要不断更新。本专利技术提供的基于模板匹配的字符识别方法,其过程为(I)获取待识别的字符图像输入一幅图像,提取出图像中的字符区域,得到若干个独立的单个字符图像。这里 约定下文中提到的字符是指字符区域,而字符图像指的是仅包含字符区域的图像。(2)图像尺度变换在实际场景中获取到的图像中的字符角度、距离以及所处的天气、光照条件存在差异。虽然可以通过尺度归一化将待识别字符大小变换到标准模板字符图像的大小,但是字符的笔画粗细却是不尽相同,因此用一个固定的尺度去获取不同的字符显然是不可靠的。故而引入多尺度匹配,即对同一幅字符图像,获得其多个尺度下的图像副本。首先获得待识别的字符图像中字符的原始尺度。如果识别单个字符,则字符的原始尺度等同于输入的字符图像的大小。如果识别一组连续排列的字符串中的每个字符(这种情况更为常见),则根据先验知识和字符间的上下文关系得到的一组字符尺度数值进行推断,得到一个最佳的“原始尺度”。具体的处理过程如下所述。 I)筛选可能的字符区域。对图像进行二值化,然后对二值图像进行标记,得到若干连通域。定义连通域的高度和宽度为该连通域的外接矩形的高度和宽度。如果连通域的高度与该字符图像的高度之差小于等于Clis1,宽度之差小于dis2,这里的Clis1的范围在(0,2]之间、Clis2的范围在(0,4]之间,满足以上条件的连通域才有可能是字符,则该连通域作为候选连通域。2)寻找最优高度和宽度统计所有候选的连通域的各个高度值出现的次数,然后按高度值的大小顺序,将每个连通域的高度值出现的次数和它前后相邻的高度值出现的次数进行累加,得到一组新的计数值,取计数值最大者所对应的连通域的高度作为最优高度。然后根据该最优高度值对应的连通域,确定最优宽度。举例说明从(I)中筛选出7个连续字符,高度分别为{15,16,17,19,21,22,22},则按上述处理统计高度累加值为{2,3,3,3,4,3},可以看出高度为21的累加次数为最大值4,因此21为最优高度;3)判断每个字符是否需要调整。对待识别的字符图像进行二值分割及标记,获取字符的连通域,将该连通域的面积最大的外接矩形的高度与上述最优高度进行比较,如果该连通域的面积最大的外接矩形的高度与上述最优高度相等,再将该连通域的面积最大的外接矩形的宽高比与上述最优宽高比进行比较,如果仍然相等,则将该连通域的面积最大的外接矩形的高度和宽度作为待识别的字符图像的高度和宽度,否则将待识别的字符图像的高度及宽度值调整为最优高度及最优宽度;最优宽高比是指最优宽度与最优高度之比。由于字符“ I”的外接矩形宽度比其他字符的宽度要短,因此字符“ I”不受该条件约束。上述流程如图2所示。当确定了“原始尺度”之后,在基础上分别增加和减少I到3个像素(经验值为I像素)作为两个新的尺度。以这三个尺度在原始图像中截取包含字符的子图像。(3)图像二值化由本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:王岳环唐为林桑农李驰朱秀峰宋萌萌江曼党小迪王军
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1