字符识别装置和方法制造方法及图纸

技术编号:2924563 阅读:165 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种字符识别装置和方法。本发明专利技术的字符识别装置具有:特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;存储单元,用于存储所述训练单元的训练结果;以及识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。

【技术实现步骤摘要】

本专利技术涉及光学字符识别(Optical Character Recognition, OCR)技术,特别地,涉及快速、高精度地针对小类别的字符集(如"手写体数字识别",仅含10个数字'o', 'r,…,'9,;或"印刷体英文字符识别",仅含52个字母'a', 'z', 'A', ..., 'Z')进行识别的装置和方法。
技术介绍
在各种领域中广泛地运用到光学字符识别。所谓光学字符识别,是 指通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷 品的文字转化为图像信息,再利用字符识别技术将图像信息转化为计算 机可以使用的数据信息。在字符识别中,需要预先准备识别用的字典,然后通过模式识别确 定图像与字典中的哪个模式最为匹配,从而识别为相应的字符。以往,在字符识别领域中已经提出了多种模式识别方法,如模板匹 配法、弹性模板匹配法、k-近邻法、混合高斯模型法、神经元网络法和支 持向量机等。其中,支持向量机(Support Vector Machine, SVM)是一种 基于统计学习的方法(参见文献1),被认为是目前用来识别字符的最好 方法之一(参见文献2)。支持向量机有三个主要的特点。第一,它能够处理非线性分类问题。 支持向量机可以采用不同的核函数,如采用线性核时,得到线性分类器; 采用二次多项式核时,得到二次分类器;采用高斯核时,得到径向基分 类器。第二,它能够处理小样本下的高维数据。在字符识别中,可以用 归一化的灰度或二值图像作为输入向量。第三,它具有很好的推广性能。 支持向量机同时最小化训练误差并最大化分类间隔,使得分类器在保持 分类错误较小的前提下,分界面的复杂度尽可能小,泛化能力更强。然而,与传统的方法相比,如k-近邻法和神经元网络法,支持向量 机分类器的识别速度要慢得多。支持向量机分类器的处理时间与支持向 量的数目成正比,而支持向量的数目通常都很大,尤其是当字符的训练 样本数目很大,而有些字符类别的分布之间存在一些重叠的时候。对于实时性要求很强的应用,如文档扫描识别,光学字符识别不仅 要求很高的识别精度,同时也要求很高的识别速度。为了提高应用了支 持向量机分类器的光学字符识别装置的识别速度,提出了通过简化集(训 练样本集的一个子集)上的核函数项的线形组合式,来近似支持向量机 决策函数的方法(参照文献3和文献4)。然而,该方法是对支持向量机 训练结果的后处理,是对决策函数的一种近似,其代价是牺牲了支持向 量机分类器的部分分类性能。文南犬1: V. Vapnik, The Nature of Statistical Learning Theory, Springer Verlag, 1995;文献2: C. Cortes, V. Vapnik. Support vector networks. Machine Learning, 20 (1995) 273-297;文献3: C. J. C. Burges, Simplified Support Vector Decision Rules. International Conference on Machine Learning, ICML, Bari, Italy, 1996, 71-77;文献4: B. Sch6lkopf, S. Mika, et al., Input Space Versus Feature Space in Kernel Based Methods. IEEE Trans, on Neural Networks, 10 (1999) 1000-1017。
技术实现思路
本专利技术是针对上述现有技术的缺陷而提出的,其目的在于提供一种 快速、高精度的光学。 根据本专利技术,提供了以下的技术方案。 专利技术l. 一种模式识别方法,包括以下步骤特征向量提取步骤,从训练样本或待识别样本中提取该样本的特征 ^训练步骤,根据由所述特征向量提取步骤中得到的所述训练样本的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器;识别步骤,计算各个所述稀疏支持向量机分类器对于所述特征向量 提取步骤中得到的所述待识别样本的特征向量的输出,从而确定与所述 待识别样本对应的模式,其中,在所述训练步骤中,通过在所述稀疏支持向量机分类器的目 标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的支持向 量的数量。专利技术2.专利技术1的模式识别方法,其中所述的稀疏支持向量机分类器是两类的稀疏支持向量机分类器, 所述训练步骤进一步包括由多类的训练样本集构造两类的训练样^专利技术3.专利技术l的模式识别方法,其中所述训练步骤进一步包括对于每个所述稀疏支持向量机分类器拟合Sigmoid函数;所述识别步骤进一步包括通过所述Sigmoid函数,根据所述稀疏支 持向量机分类器的输出计算两类的识别后验概率;所述识别步骤进一步包括根据所述两类的识别后验概率计算多类的 识别后验概率;所述识别步骤根据所述多类的识别后验概率,确定与所述待识别样 本对应的模式。专利技术4.专利技术2的模式识别方法,其中在所述训练步骤中,把所述稀疏支持向量机分类器的决策函数设定 为训练样本的核项和偏差项的线性组合式,把展开系数设定为实数。 专利技术5.专利技术4的模式识别方法,其中在所述训练步骤中,通过迭代地执行以下处理来进行所述两类稀疏 支持向量机分类器的优化初始化迭代步数,系数向量和解向量; 搜索系数向量中的所有非零元素,计算对角矩阵; 重新计算正则化后的核矩阵;求解与所述稀疏支持向量机对应的二次规划问题,由解向量计算系 数向量;判断是否满足终止状态,若不满足,则返回所述搜索非零元素的处 理,若满足,则计算决策函数中的偏差项,输出决策函数。 专利技术6. —种字符识别装置,其包括特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量;训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器; 存储单元,用于存储所述训练单元的训练结果;以及 识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与 所述待识别字符图像对应的字符,其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数 中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的 支持向量的数量。专利技术7.专利技术6的字符识别装置,其中所述的稀疏支持向量机分类器是两类的稀疏支持向量机分类器, 所述训练单元进一步包括样本集生成单元,该样本集生成单元用于 由多类的训练样本集构造两类的训练样本集。 专利技术8.专利技术6的字符识别装置,其中所述训练单元进一步对于每个所述稀疏支持向量机分类器拟合 Sigmoid函数;所述识别单元进一步通过所述Sigmoid函数,根据所述稀疏支持向 量机分类器的输出计算两类的识别后验概率;所述识别单元进一步包括置信度单元,该置信度单元根据所述两类 的识别后验概率计算多类的识别后验概率;所述识别单元根据所述多类的识别后验概率,确定与所述待识别字 符图像对应的字符。专利技术9.专利技术7的字符识别装置,其中所述训练单元把所述稀疏支持向量机分类器的决策函数设定为训练 样本的核项和偏差项的线性组合本文档来自技高网
...

【技术保护点】
一种字符识别装置,其包括: 特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量; 训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器; 存储单元,用于存储所述训练单元的训练结果;以及 识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符, 其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。

【技术特征摘要】

【专利技术属性】
技术研发人员:郑大念黄开竹孙俊堀田悦伸藤本克仁直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利