字典创建装置、识别装置及识别方法制造方法及图纸

技术编号：3901084 阅读：148 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及字典创建装置、识别装置及识别方法。所述字典创建装置将分别包括平均向量及协方差矩阵的概率分布登记在字典中。所述字典创建装置将具有相似的特征向量的字符类别的多个分布轮廓组织成一个典型分布轮廓，并将该典型分布轮廓与被组织的字符类别彼此关联地登记在字典中，而不将所有的字符类别的本征值及本征向量彼此关联地登记在字典中。

全部详细技术资料下载

【技术实现步骤摘要】

这里所讨论的实施例旨在提出一种。
技术介绍
近来，随着装有^W象头的移动终端(下文中的"拍照电话")的广泛使用，对由摄像头所拍摄的图像中的字符或字母进行识别或翻译、或者基于字符识别的输入结果来对信息进行检索的需求增加。为了满足这种需求，拍照电话中通常装有光学字符读取器(OCR)。同时，重要的是，带有OCR的移动终端应当具有《更携性。因此，与诸如个人计算机(PC)的固定终端不同的是，必须减小存储器的印刷电路板及中央处理单元(CPU)的尺寸以减小移动终端的尺寸。相应的是，在安装OCR时，硬件性能受到限制。因为这种限制，在用于移动终端的OCR中使用简单的字符识别系统。通常，在示例性字符识别系统中，存储每个字符的平均向量，并计算作为识别对象的所输入的字符的特征向量与存储在字符识别字典中的、每个字符的平均向量之间的距离。然后，将其平均向量与所输入的字符的特征向量的距离最小的字符视为识别结果(例如，参见日本特开平第05-46812 号公报)。然而，日本特开平第05-46812号公才艮中的字符识别系统固有的字符识别准确度有限。即，作为识别对象的所输入的字符的字体不一定是固定类型的字体之一。尽管能够以一定的准确度对预先学习过的字体进行识别，但是在输入未经学习的字体时，不能iiJ'j令人满意的字符识别准确度。为了实现高准确度的字符识别，除了字符的平均向量之外，还可以使用由协方差矩阵所定义的￡值及本征向量来进行字符识别。在这种情况下，需要其中存储有每个字符的^值及本征向量的字符识别字典。该字典的量变得非常大，因此该字典难以安装在移动终端中。尤其...

【技术保护点】
一种字典创建装置，包括：　特征量计算单元，其基于用于创建模式识别字典的训练数据来计算作为识别项的、每个类别的特征量；　分布轮廓计算单元，其基于由所述特征量计算单元所计算出的、每个类别的所述特征量来计算每个类别的所述特征量的组的分布轮廓；　距离计算单元，其基于由所述分布轮廓计算单元所计算出的、每个类别的所述特征量的所述组的所述分布轮廓来计算各自的类别的所述分布轮廓之间的距离；　聚类对象确定单元，其基于由所述距离计算单元所计算出的、各自的类别的所述分布轮廓之间的所述距离来确定作为聚类对象的分布轮廓；　典型分布轮廓确定单元，其确定代表由所述聚类对象确定单元所确定的所述聚类对象的所述分布轮廓的典型分布轮廓；　聚类单元，其将被所述聚类对象确定单元确定为所述聚类对象的所述分布轮廓聚类；　　关联单元，其将由所述典型分布轮廓确定单元所确定的所述典型分布轮廓与在所述聚类单元所进行的所述聚类之后作为元素被包含在所述典型分布轮廓中的类别相关联；以及　字典登记单元，其将被所述关联单元彼此关联起来的所述典型分布轮廓及所述类别登记在预定字典存储单元中。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员：堀田悦伸，藤本克仁，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人