基于字典模式来识别输入模式的模式识别设备制造技术

技术编号:5456380 阅读:230 留言:0更新日期:2012-04-11 18:40
一种模式识别设备(1)包括:对照矢量提取单元(823),产生包括指示输入模式特征的预定数目分量的输入对照矢量,每一分量指示1或0;和对照矢量匹配得分确定单元(824),基于从字典对照矢量累加缓冲器(813)读取的每一字典对照矢量和输入对照矢量的内积,来计算匹配得分。将输入对照矢量与字典特征矢量进行对照,为此,已计算大于预定阈值的匹配得分,并且从字典数据(811)中读取字典模式并输出,字典模式与基于对照结果确定为与输入对照矢量进行匹配的字典对照矢量相对应。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种对输入模式进行识别的模式识别设备,具体涉及 一种确定输入模式与多个不同字典模式中哪一个模式相匹配的模式识 别设备。
技术介绍
传统上,诸如光学字符读取器(縮写为OCR)的字符识别设备通 常基于模式匹配来获得字符识别。在模式匹配中,首先,从输入字符 图像中提取特征矢量。这里,从输入字符图像中提取的特征矢量被称 作输入特征矢量。然后,执行用于将输入特征矢量与预先注册在字典 数据中、与每一个字符相一致的标准特征矢量(以下称作字典特征矢 量)进行对照的处理。提供由对照处理确定为在模式上最相似的、与 字典特征矢量相对应的字符,作为识别结果和输出。这里,示出了与特征矢量关联的网状特征矢量。图17示出了为了 提取特征矢量从输入图像中以矩形剪切出的字符图像的示例。通过对 图17中的字符图像进行网状划分,将字符图像划分成多个区域。基于 经网状划分后的字符图像的每一区域中像素数目,对每一区域中的像 素数目进行诸如归一化等处理。产生矢量,该矢量包括指示在处理中 所计算出的每一区域中的像素数目的值,作为分量。因此,所产生的 矢量被称作网状特征矢量。图18示出了将图17中的矩形字符图像网状划分成8X8的64个区域的情况。图19示出了与每一区域一致的、由图18所示的网状划分图 像产生的网状特征矢量的每一个分量。图19示出了具有64个分量(8 X8)的网状特征矢量和由64个分量组成的特征矢量所限定的一个字 符。下面将参照图20,对模式识别中涉及的字典数据811进行描述。5图20中的字典数据811包括多种类型的字典注册字符CHi (i=l,2,3...,和n)、和与字典注册字符Chi相一致的字典特征矢量组VEi (i=l,2,3..., 和n)。字典特征矢量组VEi包括针对相应的字典注册字符CHi的m个字 典特征矢量VTj (j-l,2,3.,.,和m)。这里,字典注册字符CHi指示标识该字符的字符码。特征矢量VTi是指,通过学习针对相应的字典注册字符CHi的多种 字体的字符而为各种字体(诸如mincho、粗黑体(gothic)等字体) 统计产生的特征矢量。特征矢量VTi还可以指,通过学习斜体字符、 褪色字符(faded character)、模糊字符(blurred charracter)等而统计产生的特征矢量。假设字典数据基本针对任一字典注册字符CHi存储m个特征矢量 VTj。特别是,学习所有的字体来产生第一特征矢量VTl至第m特征矢 量VTm。第一特征矢量VTl指示对所有学习矢量取平均的计算结果。 第二特征矢量VT2指示与第一特征矢量VT1正交的矢量的计算结果。 类似地执行计算,直到特征矢量VTm为止,并且指示计算结果。传统上,在使用特征矢量VTj进行模式匹配的运算中,利用城市 街区距离(city block distance)、欧几里得距离、相似度等。上述度量 是通常用于模式识别的所有公知的度量。在模式识别中,假设未知矢 量和标准矢量,对标准矢量和未知矢量之间的距离或相似性进行计算, 并输出基于计算结果的、由最接近(最相似)字符码CHi指示的字符 码作为识别结果。在一示例中,由通过网状划分成图19所示的相等部分而产生的包 括64个分量的特征矢量分别限定用作匹配参考的输入字符和字典注册 字符,在该示例中,用于计算城市街区距离和相似度的等式分别如以 下等式(1)和(2)所示。<formula>formula see original document page 6</formula> …等式(1)<formula>formula see original document page 6</formula>…等式(2)X (矢量X包括64个分量,X1,X2,.,.,和X64)表示输入字符的特征矢量(下文中,被称作输入特征矢量),Y(矢量Y包括64个分量,Y1,Y2, ...和Y64)表示用作匹配参考的字典注册字符CHi的特征矢量。根据等 式(1)来计算城市街区距离D,根据等式(2)来计算简单相似度S。如上所述,基于从输入字符图像中提取的输入特征矢量和预先注 册的字典特征矢量之间的匹配处理,来执行模式匹配。由于该匹配处 理需要时间较长,传统上,已经提出了缩短该时间的方法。专利文献l (日本专利未审公开No.63-109592)公开了一种方法, 在针对每一种类型字符的阈值表中注册用于确定是否执行详细匹配的 阈值,在字典k和输入特征矢量之间的距离d超过阈值Thk的时刻停止 匹配。此外,根据传统技术,在匹配处理中,首先,提取到字典中第一 特征矢量的匹配距离小的头P个字符,并且为了进一步详细识别,针 对所提取的P个字符,执行与第二特征矢量至第Z特征矢量关联的匹 配。传统上,加速模式匹配的处理己在诸如OCR等字符识别设备中使 用,下面将参照图21对这种加速模式匹配的处理进行描述。在以下的 描述中,使用网状特征矢量来执行匹配。首先,将描述匹配处理的概要。在图21中,首先,计算输入字符 和所有字典注册字符之间的距离。即,计算从输入字符图像中提取的 输入特征矢量和在字典中注册的所有字符的字典特征矢量之间的距离 (例如,城市街区距离)。所计算的距离的较小值指示误差小,并且 输入字符模式类似于字典注册字符模式。在图21的示例中,通过对输入特征矢量的分量和字典特征矢量之 间的差值进行累加,根据等式(1)所示的用于计算城市街区距离的等 式来计算上述距离。当针对所有字典注册字符的相应距离的计算结束时,提取字典注 册字符序列中的头P个字典注册字符,所述字典注册字符序列按照所 计算的相应距离值的大小升序排列。此后,执行针对所提取的P个字 典注册字符的详细匹配。在详细匹配中,不仅对距字典的第一特征矢 量的距离执行运算,而且对距从第二特征矢量到第Z特征矢量的所有字典特征矢量的距离执行运算。下面将根据图21中的流程图提供详细描述。首先,OCR具有光学 读取单元、识别单元、以及存储单元。首先,光学读取单元读取写在 一张纸上的字符,并且输出代表读取结果的图像。识别单元接收从光 学读取单元输出的图像输入(步骤S101),并且从输入图像中剪切字符图像(步骤S102)。如专利文献2 (日本专利未审公开No,63-216188) 所示,以从输入图像中提取黑色像素并基于该提取结果来提取字符行 的方式,来剪切字符图像。此后,根据沿垂直于提取行的方向的直方 图来剪切字符图像。对输入字符图像进行网状划分,并且基于多个网状划分区域中的 每一区域中的像素数目,对输入字符图像进行诸如归一化的处理。基 于该处理结果,提取(产生)输入特征矢量(步骤S103)。然后,对指示匹配计数器的变量i的值进行初始化,S卩,设置为i^ (步骤S104)。这里,假设预先存储在OCR的存储器单元中的注册在 字典中的所有字符的数目为N。然后,以如下方式来执行将输入字符(剪切字符)与注册在字典 中的所有字符中的每一个字符进行模式匹配的处理。模式匹配处理是 指,计算输入字符的输入特征矢量与注册在字典中的字符的字典特征 矢量之间的距离。首先,在输入字符和注册字符之间的模式匹配中,进行结束确定 (步骤S105),即,确定对于预先注册在字典中的所本文档来自技高网...

【技术保护点】
一种模式识别设备,包括: 字典单元,存储多个字典模式; 字典对照矢量存储单元,按照与所述多个字典模式中的每一个字典模式相一致的方式,存储字典对照矢量,所述字典对照矢量由指示所述字典模式特征的指定数目的分量构成,每一分量指示1或0 ; 对照矢量产生单元,基于输入模式,产生由指示输入模式特征的所述指定数目的分量构成的输入对照矢量,每一分量指示1或0; 矢量匹配得分确定单元,基于从所述字典对照矢量存储单元读取的每一所述字典对照矢量和所述输入对照矢量的内积,计算 匹配得分;以及 对照单元,将所述输入对照矢量与经计算其匹配得分大于指定阈值的所述字典对照矢量进行对照,并且 所述模式识别设备执行所述输入模式和唯一的所述字典模式之间的模式匹配,所述唯一的所述字典模式与基于对照结果被确定为与所述输 入对照矢量相匹配的所述字典对照矢量相对应。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:桑田美奈子小山至幸
申请(专利权)人:夏普株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1