退化字符的识别方法和装置制造方法及图纸

技术编号:2924708 阅读:143 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种退化字符的识别方法,包括如下步骤:步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组;步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及步骤S4,根据上述两组识别距离确定最佳的候选字符代码。本发明专利技术能够大幅度提高对于退化字符图像的识别准确性。

【技术实现步骤摘要】

本专利技术涉及退化字符识别的方法和装置,尤其涉及针对大类别(或 者称为超多类)印刷体字符,例如中文,日文,韩文的字符识别方法和 装置。
技术介绍
字符识别的研究近年来取得重要进展,目前字符识别方法可以很好 地处理背景清晰的字符图像,但对于背景复杂图像质量低的退化字符并 未获得满意的识别方法。字符识别的难点和应用瓶颈主要存在于两个方面 一是复杂背景下 的字符识别,这就需要图像中文字自动检测和文字提取系统将文字从复 杂背景中检测提取出来;二是低质量图像的退化字符识别问题,字符图 像中存在的字迹模糊、笔画粘连、断裂、分辨率低等退化情况,因此需 要有效的解决方法。现有技术存在两种解决方法其一,基于笔画边缘特征的识别方法。该识别方法首先将欲识别字 符二值化,然后通过非线性算法将该字符归一化,最后提取该字符的笔 画特征并通过统计分类来识别字符。图4示出一种识别方法的统计分类的过程,基于笔画边缘特征的该 过程分为粗分类和再分类两步,在粗分类一再分类结构的识别方法中, 由于再分类的算法比较复杂,因此运算速度较慢,通过粗分类可以大大 縮小再分类算法的识别候选范围,因此达到提高该结构识别方法的识别 速度。该方法的具体算法参见F. Kimura, T. Wakabayashi, S. Tsuruoka, Y. Miyake , " Improvement of Handwritten Japanese Character Recognition Using Weighted Direction Code Histogram" : Pattern Recognition, v. 30, n. 8, pp. 1329-1337, 1997。其二,基于灰度字符图像上提取字符的图像纹理特征的识别方法。 该识别方法首先将欲识别的字符的背景移除并进行灰度归一化,然后通 过线性算法将该字符归一化,最后提取该字符的特征并统计分类来识别字符。图4同样可以作为基于图像纹理特征的识别方法的统计分类的过程 一例,该过程同样分为粗分类和再分类两步进行。该方f去的具体算?去参见Jun Sun , Yoshinobu Hotta , Yutaka Katsuyama, Satoshi Naoi, "Camara Based Degraded Text Recognition Using Grayscale Feature" : 8th International Conference on Document Analysis and Recognition (ICDAR2005) , August 2005, Seoul Korea, P. 182-186 以及 Wang X W, et al. A Grayscale Image Based Character Recognition Algorithm to Low Quality and Low Resolution Images . Document Recognition and Retrieval VIII, Electronic Imaging 2001 . San Jose: IS&T/SPIE, 2001。上述两种方法各有利弊,如图1所示,基于笔画边缘特征的识别方 法对由于字体变化等原因造成的字符笔画的形变具有很好的适应性,而 在灰度字符图像上提取字符的图像纹理特征的识别方法对由于各种噪音 造成的图像退化具有很好的适应性。基于笔画边缘特征的识别方法存在一定问题笔画边缘特征一般是 从二值图像中提取,因此如果二值图像效果不佳,则笔画边缘方向估计 不准,导致特征识别的效果下降。二值化的效果除了和算法有关外,其 与图像的退化程度也有很大关系。图像退化程度可以有很多种表示方式, 比如边缘模糊程度,分辨率等等。对于字符图像来说, 一个更直接的图 像退化指标就是字符图像的尺度。对于二值字符图像来说,图像的尺度 定义为二值化后的图像的外接矩形的长度和宽度。如图3所示,由于不 同大小的图像二值化后的结果不同,因此随着图像尺度的降低,字符笔 画点的丢失情况越来越严重。而所述字符笔画点丢失量达到一定程度, 则建立在笔画边缘特征基础上的识别引擎就无法得到正确的识别结果。灰度字符图像上提取整体纹理特征的识别方法同样存在问题由于 没有二值化的过程,笔画信息得到了最大程度的保留,因此该识别方法对于低尺度的图像具有良好的识别效果,但是,字符的整体纹理特征对于图2所示的由于字体不同所带来的笔画形变比较敏感,如果形变达到某种程度则灰度字符图像上提取整体纹理特征的识别引擎就无法得到正 确的识别结果。由此可见,上述两种方法具有的优势各不相同,也存在不同的问题。 为了结合上述两种方法的优势以得到性能更高的识别方法,已经提 出了针对不同特征选择上述两种方法之一来对退化字符进行识别的方法,具体可参见如下专利和论文,如1、 特开平11_66240 "文書認識方法e J:"文書認識装置",2、 特开200 — 82113 "文字認識装置fc、 J:"辞書作成方法扭J:"記録 媒体",3、 Yoshinobu Hotta, Jun Sun, Yutaka Katsuyama, Satoshi Naoi" Robust Chinese Character Recognition by Selection of Binary-Based and Grayscale-Based Classifier" : Document Analysis System 2006: 553 — 563,以及4、 4, 551, 851, W.Kochert, "Circuit Arrangement for Machine Character Recognition"。其中,如图5所示,文件1、 2、 3利用某种方法对退化的原因和程 度进行估计从而选择适合的识别方法,然后将该方法的识别结果作为最 终结果输出。该类方法具有两个缺点首先,实际应用中字符退化的原 因和程度是相当复杂的,而且对退化原因和程度的估计算法目前为止都 非常不可靠,因此根据该估计结果选择的识别方法也是不可靠的;其次, 即使退化原因和程度可被正确估计,也无法保证两种方法中的一个最为 适合,而另一个则完全不适,很多情况下,仅是一种方法较之另一方法 更为适合。因此,文件l、 2、 3存在缺陷而无法满足实际需求。如图5所示,文件4中所述的方法利用一个判别机制对输入字符进 行分组,然后根据分组的结果把输入字符输出到若干个子分类器进行识 别。每个子分类器只识别其中一组字符。该方法的缺点是对于退化字符 来说,第一个判别器无法实现有效的分组, 一旦分组错误将直接导致识 别错误。
技术实现思路
针对上述现有技术的缺陷,本专利技术的目的在于有效结合基于笔画边 缘特征的识别方法和在灰度字符图像上提取整体纹理特征的识别方法, 解决由于字体不同造成的字形退化和图像质量下降造成的图像退化导致 的识别率降低的现象,从而提高大类别字符识别中对退化字符的识别性能。为了达到上述专利技术目的,本专利技术提供一种退化字符的识别方法,一 种退化字符的识别方法,其中,包括如下步骤步骤S1,根据笔画边缘 特征和图像纹理特征,对欲本文档来自技高网
...

【技术保护点】
一种退化字符的识别方法,其特征在于,包括如下步骤: 步骤S1,根据笔画边缘特征和图像纹理特征,对欲识别的字符分别进行识别,得出基于笔画边缘特征和图像纹理特征两个候选字符代码组;以及 步骤S2,对所述的两个候选字符代码组中的候选字符代码进行合并,确定合并的候选字符代码组; 步骤S3,分别基于笔画边缘特征和图像纹理特征对该合并的候选字符代码组分别进行计算,以得出两组识别距离;以及 步骤S4,根据上述两组识别距离确定最佳的候选字符代码。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙俊黄开竹堀田悦伸藤本克仁直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1