构建级联分类器的方法、识别对象的方法及装置制造方法及图纸

技术编号：4125550 阅读：353 留言：0更新日期：2012-04-11 18:40

公开了构建级联分类器的方法、识别对象的方法以及装置。该方法包括：基于第一级样本集来构建第一级节点分类器作为临时级联分类器，循环执行以下步骤：基于下级样本集来构建下级节点分类器，下级样本集是上级样本集中针对上级节点分类器的上级识别分数小于与上级节点分类器相对应的上级识别分数阈值与大于或等于０的识别分数阈值偏量之和的样本的集合；将下级节点分类器与临时级联分类器级联以构建新的临时级联分类器；比较增加该下级节点分类器前后的临时级联分类器的识别精度；如果增加下级节点分类器后识别精度不变或降低，则将删除下级节点分类器后的临时级联分类器确定为最终的级联分类器并终止循环，否则继续构建下一个下级节点分类器。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术总体上涉及模式识别领域，更具体地涉及级联分类器。
技术介绍
随着计算机技术的发展，图像处理技术也取得了很大的进步。目前，人们已经能够采用光学字符识别(OCR)技术将一个文档图像中的文字识别出来，避免了繁重的人工键盘录入的劳动。众所周知，字符语言类型识别技术有助于提高OCR的性能。现有的大部分字符语言类型识别技术的文本单位是整篇文档图像、文本行或词，这要求在文本单位内存在语言同一性的假设，因此在使用上具有一定的局限性。然而，实际中存在多语言混排文档，其中包括两种或两种以上的语言文字，各语言文字间混合排列，例如票据。如果采用上述字符语言类型识别技术对该混合文档进行识别，则可能产生不理想的识别结果。为此，在 Yefeng Zheng、Changsong Liu 禾口 Xiaoqing Ding 所著的"Single character type identification，，(SPIE Document Recognition andRetrieval IX 论文集，4670卷，第49-56页，2002年)一文中公开了一种采用Fisher分类器和支持向量机 (SVM)分类器来识别英文和中文字符的方法，其中，首先使用Fisher分类器计算Fisher分类置信度，然后再使用SVM分类器进一步提高识别准确度。上述现有技术中的分类器运算复杂度高，构建代价较高，运算速度较慢。
技术实现思路
有必要提供一种构建方法较简单，分类速度较快的分类器来识别单字符语言类型。本专利技术提出了构建一种级联分类器，该级联分类器可以用来识别单字符语言类型。根据...

【技术保护点】
一种构建级联分类器的方法，所述级联分类器包括一个或多个级，每一级包括一个节点分类器，所述方法包括：基于第一级样本集来构建第一级节点分类器作为临时级联分类器，循环执行以下步骤：基于下级样本集来构建下级节点分类器，所述下级样本集是上级样本集中针对上级节点分类器的上级识别分数小于与上级节点分类器相对应的上级识别分数阈值与识别分数阈值偏量之和的样本的集合，所述识别分数阈值偏量是大于或等于０的数，将构建的下级节点分类器与所述临时级联分类器级联以构建新的临时级联分类器，比较增加该下级节点分类器前后的临时级联分类器的识别精度；以及如果增加所述下级节点分类器后识别精度不变或降低，则将删除所述下级节点分类器后的所述临时级联分类器确定为最终的级联分类器并终止循环，否则继续构建下一个下级节点分类器。

【技术特征摘要】

【专利技术属性】
技术研发人员：朱远平，孙俊，皆川明洋，堀田悦伸，直井聪，于浩，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人