字典创建装置、识别装置及识别方法制造方法及图纸

技术编号:3901084 阅读:148 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及字典创建装置、识别装置及识别方法。所述字典创建装置将分别包括平均向量及协方差矩阵的概率分布登记在字典中。所述字典创建装置将具有相似的特征向量的字符类别的多个分布轮廓组织成一个典型分布轮廓,并将该典型分布轮廓与被组织的字符类别彼此关联地登记在字典中,而不将所有的字符类别的本征值及本征向量彼此关联地登记在字典中。

【技术实现步骤摘要】

这里所讨论的实施例旨在提出一种。
技术介绍
近来,随着装有^W象头的移动终端(下文中的"拍照电话")的广泛 使用,对由摄像头所拍摄的图像中的字符或字母进行识别或翻译、或者基 于字符识别的输入结果来对信息进行检索的需求增加。为了满足这种需求,拍照电话中通常装有光学字符读取器(OCR)。同时,重要的是,带有OCR的移动终端应当具有《更携性。因此,与 诸如个人计算机(PC)的固定终端不同的是,必须减小存储器的印刷电 路板及中央处理单元(CPU)的尺寸以减小移动终端的尺寸。相应的是, 在安装OCR时,硬件性能受到限制。因为这种限制,在用于移动终端的OCR中使用简单的字符识别系统。 通常,在示例性字符识别系统中,存储每个字符的平均向量,并计算作为 识别对象的所输入的字符的特征向量与存储在字符识别字典中的、每个字 符的平均向量之间的距离。然后,将其平均向量与所输入的字符的特征向 量的距离最小的字符视为识别结果(例如,参见日本特开平第05-46812 号公报)。然而,日本特开平第05-46812号公才艮中的字符识别系统固有的字符 识别准确度有限。即,作为识别对象的所输入的字符的字体不一定是固定类型的字体之 一。尽管能够以一定的准确度对预先学习过的字体进行识别,但是在输入 未经学习的字体时,不能iiJ'j令人满意的字符识别准确度。为了实现高准确度的字符识别,除了字符的平均向量之外,还可以使 用由协方差矩阵所定义的 £值及本征向量来进行字符识别。在这种情况 下,需要其中存储有每个字符的^值及本征向量的字符识别字典。该字典的量变得非常大,因此该字典难以安装在移动终端中。尤其是,在字苻为汉字时,要被登记在字典中的字符的总数约为4000,因而将这么多字符的本征值及本征向量登记在用于移动终端的 OCR的字典中是不可行的。由于这个原因,在移动终端中装有字符识别装置时,如何在实现高准 确度的字符识别能力的同时减小字典的量成为问题。对于进行使用类别概 率分布的模式识别(例如,人脸图像识别)的情况以及进行作为模式识别 的字符识别的情况,这个问^l^艮普遍的。
技术实现思路
本专利技术的目的是至少部分地解决传统技术中的问题。根据实施例的一方面,字典创建装置包括特征量计算单元,其基于 用于创建模式识别字典的训练数据来计算作为识别项的、每个类别的特征 量;分布轮廓计算单元,其基于由所述特征量计算单元所计算出的、每个 类别的所述特征量来计算每个类别的所述特征量的组的分布轮廓;距离计算单元,其基于由所述分布轮廓计算单元所计算出的、每个类别的所述特 征量的所述组的所述分布轮廓来计算各自的类别的所述分布轮廓之间的距离;聚类对象确定单元,其基于由所^巨离计算单元所计算出的、各自 的类别的所述分布轮廓之间的所^JE巨离来确定作为聚类对象的分布轮廓; 典型分布轮廓确定单元,其确定代表由所述聚类对象确定单元所确定的所 述聚类对象的所述分布轮廓的典型分布轮廓;聚类单元,其将被所述聚类 对象确定单元确定为所述聚类对象的所述分布轮廓聚类;关联单元,其将单元所进行的所述聚类之后作为元素被包含在所述典型分布轮廓中的类 别相关联;以及字典躬5单元,其将被所述关联单元彼此关^来的所述 典型分布4^廓及所述类别躬己在预定字典存储单元中。将通过在权利请求书中具体地指出的元素及组合来实现并获得本发 明的目的及优点。应当理解,上文的概括说明及下文的详细说明都是示例性和解释性 的,而并非对所要求保护的本专利技术的限制。附图说明图1是用于解释由根据本专利技术笫一实施例的字典创建装置所进行的聚类的概念的示意图2是根据第一实施例的字典创建装置及字符识别装置的结构的功 能才匡图3是根据笫一实施例的字典创建处理过程的流程图4是用于解释关联单元的处理内容的示意图5是根据第一实施例的字符识别处理过程的流程图6是根据本专利技术第二实施例的字典创建装置及字符识别装置的结 构的功能框图7是用于解释与读取错误具有对应关系的字符类别的示意图; 图8是存储在读取m对应存储单元中的信息的结构示例;以及图9是根据本专利技术第三实施例的、执行字符识别程序的计算机的结构 的功能才匡图。具体实施例方式下面将参照附图来详细地解释根据本专利技术的字典创建装置、识别装 置、识别方法及识别程序的示例性实施例。在下列实施例中,将对创建字 符识别字典作为模式字典并使用所创建的字符识别字典来进行字符识别 的情况进行解释。下面解释根据本专利技术第一实施例的字典创建装置的概要。字典创建装置10(参见图2)创建用于模式识别的字符识别字典。具体地说,字典创 建装置10通过识别出在拍照电话(带有摄《象头的移动终端)中装有字符 识别字典的事实来创建该字典。在创建字符识别字典时,根据第一实施例的字典创建装置10通过仅 将其特征向量具有相似的分布轮廓的多个字符类别的典型分布轮廓登记 在字典中来进行聚类.即,优选的是,除了平均向量之外,还使用分布轮廓(#值及^£ 向量)来进行字符识别,以实现与作为识别对象的所输入的字符的字体无关的、稳定的字符识别能力。然而,如果将每个类别的;^iE值;M^向量登记在字典中,则字典的量会变得很大,因此字典变得不适合装在移动终 端中。相应的是,为了确保高水平的字符识别准确度,字典创建装置10将包括平均向量及协方差矩阵的概率分布登记在字典中。然而,字典创建装置10并不将所有的字符类别的^值及^向量彼此关联地登记在字典中,字符类别是指由相同的字符构成的类别,而与字体的类型无关。协方 差矩阵是指示特征向量的扩展的度量。即,字典创建装置10关注以下事实认为许多字符类别中的一些字 符类别的、由协方差矩阵所定义的分布轮廓相似。字典创建装置10将其 特征向量具有相似的分布轮廓的字符类别的多个分布轮廓组织成一个典 型分布轮廓。然后,字典创建装置10将该典型分布轮廓与被组织的字符 类别相关联,并将关^来的典型分布轮廓及字符类别登记到字典中。结果,尽管在传统技术中将与字符类別的数量相对应的、分布轮廓的 信息登记在字典中,但是在第一实施例中,仅将典型分布轮廓登记在字典 中。因此,能够减少要被存储在字典中的分布轮廓的绝对数量。下面将参照图1来解释该聚类过程。图1是用于解释由字典创建装置 10所进行的聚类的概念的示意图。图1是其中字符类别A至字符类别E 具有分布轮廓A至分布轮廓E、并通过将分布A至分布E中的每个分布 视为 一个聚类来进行聚类的示例。如图1中所描绘的,字典创建装置IO仅需关注字符类别A至字符类 别E的分布^"廓,因此,将这些分布的中心位置对准,而不考虑其平均 向量(参见图1中的(l))。然后,字典创建装置10针对所有的聚类中的每一对聚类(c卜io对) 来计算分布之间的距离,字典创建装置IO将分布轮廓之间的距离最短的 聚类合并,以确定代表这些聚类的分布轮廓的典型分布轮廓(参见图1 中的(2 ))。字典创建装置10用典型分布I^廓来替代^L合并的聚类的分布 轮廓(参见图l中的(3))。在图l中所描绘的示例中,分布A与分布C的对、分布C与分布E 的对以及分布E与分布A的对的分布轮廓之间的距离较短(这些对的相 似度较高)。因此,将分布A、分布C及分布E的聚类合并,并且例如选 择分布A作为这三个被合并的聚类的典型分布轮廓。然后,包括字符类 别A、字符类别本文档来自技高网
...

【技术保护点】
一种字典创建装置,包括: 特征量计算单元,其基于用于创建模式识别字典的训练数据来计算作为识别项的、每个类别的特征量; 分布轮廓计算单元,其基于由所述特征量计算单元所计算出的、每个类别的所述特征量来计算每个类别的所述特征量的组的分 布轮廓; 距离计算单元,其基于由所述分布轮廓计算单元所计算出的、每个类别的所述特征量的所述组的所述分布轮廓来计算各自的类别的所述分布轮廓之间的距离; 聚类对象确定单元,其基于由所述距离计算单元所计算出的、各自的类别的所述分布轮廓 之间的所述距离来确定作为聚类对象的分布轮廓; 典型分布轮廓确定单元,其确定代表由所述聚类对象确定单元所确定的所述聚类对象的所述分布轮廓的典型分布轮廓; 聚类单元,其将被所述聚类对象确定单元确定为所述聚类对象的所述分布轮廓聚类;   关联单元,其将由所述典型分布轮廓确定单元所确定的所述典型分布轮廓与在所述聚类单元所进行的所述聚类之后作为元素被包含在所述典型分布轮廓中的类别相关联;以及 字典登记单元,其将被所述关联单元彼此关联起来的所述典型分布轮廓及所述类别登 记在预定字典存储单元中。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:堀田悦伸藤本克仁
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1