【技术实现步骤摘要】
本专利技术涉及光学字符识别(Optical Character Recognition, OCR)技术,特别地,涉及快速、高精度地针对小类别的字符集(如"手写体数字识别",仅含10个数字'o', 'r,…,'9,;或"印刷体英文字符识别",仅含52个字母'a', 'z', 'A', ..., 'Z')进行识别的装置和方法。
技术介绍
在各种领域中广泛地运用到光学字符识别。所谓光学字符识别,是 指通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷 品的文字转化为图像信息,再利用字符识别技术将图像信息转化为计算 机可以使用的数据信息。在字符识别中,需要预先准备识别用的字典,然后通过模式识别确 定图像与字典中的哪个模式最为匹配,从而识别为相应的字符。以往,在字符识别领域中已经提出了多种模式识别方法,如模板匹 配法、弹性模板匹配法、k-近邻法、混合高斯模型法、神经元网络法和支 持向量机等。其中,支持向量机(Support Vector Machine, SVM)是一种 基于统计学习的方法(参见文献1),被认为是目前用来识别字符的最好 方法之一(参见文献2)。 ...
【技术保护点】
一种字符识别装置,其包括: 特征向量提取单元,其从训练字符图像或待识别字符图像中提取该字符图像的特征向量; 训练单元,其根据由所述特征向量提取单元输出的所述训练字符图像的特征向量构成的训练样本集进行学习,得到多个稀疏支持向量机分类器; 存储单元,用于存储所述训练单元的训练结果;以及 识别单元,其计算各个所述稀疏支持向量机分类器对于所述特征向量提取单元输出的所述待识别字符图像的特征向量的输出,从而确定与所述待识别字符图像对应的字符, 其中,所述训练单元通过在所述稀疏支持向量机分类器的目标函数中引入0范数正则项,减少所述稀疏支持向量机分类器的决策函数中的支持向量的数量。
【技术特征摘要】
【专利技术属性】
技术研发人员:郑大念,黄开竹,孙俊,堀田悦伸,藤本克仁,直井聪,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。