特征提取方法技术

技术编号:2936520 阅读:181 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种特征提取方法,其是为抑制因格网大小带来值的变化,而对在各被分割的格网区域提取的特征量进行适当的加权。其中,区域分割部在格网区域中分割输入图形,各区域的分割位置存储在分割位置存储部不同区域特征量提取部从格网区域提取特征向量,不同区域特征量加权部依据各格网区域的各边的长度、对角线的长度、及面积进行特征量的加权。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种在字符识别中适当地进行特征量加权的。将输入字符图形分成格网区域,提取每一格网区域的特征量,将这些特征量集中做为字符图形整体的特征量的字符识别方法是公知的。例如,计算作为特征量而包含在各格网区域内的黑象素的个数,或者对构成字符图形的轮廓的象素图形指定定向码,并使用根据计算包含在各格网区域内的各定向码的数目而做成的定向码直方图来识别字符。在用这样的特征量进行识别时,重要的是,在相同的字种之间,黑色素和定向码总是设置在同样的格网中,然而,特别是在手写字符时,由于图形的变形。有可能使被设置的格网区域不同。对此用图5来进行说明,图5(a)、图5(b)是对同是“井”字符图形,进行4×4的区域分割。在图形(a)和图形(b)中,不含黑象素的格网以及设置有竖2画,横2画的格网有很大不同。也就是说,尽管图形(a)和图形(b)是同一字,但它们的特征量却偏离很大,由此成为降低识别率的原因。作为解决这种问题的一种方法,可以利用“山田博三等的非线性归一化的改善”,昭和63年电子情报通信学会全国春季大会,D-439,P.1-182”以及特开平1-116892号公报中记载的非线性归一化。这种非线性归一化是将字符图形的稠密的地方展开,并将突出的线段缩小,由此进行图形整形。对图5的图形(a)和图形(b)进行非线性归一化后,分别被整形为图6(a)、(b)所示的那样,“井”字符图形设置在大致相同的格网上。因此,降低了特征量的偏离。然而,过去的非线性归一化方法是以局部性的不同倍率来改变图像的倍率,而使字符线的连接变的不自然,使轮廓混乱并出现杂波等,很多都使图形失去了平滑度。为了解决这种问题,需要进行函数值的插值和施行一些图象处理来弥补平滑度,由此,也导致出现处理时间变长和增大计算装置这样的问题。例如,在特开平3-286390号公报中所述字符的非线性归一化方法中,提出了平滑的非线性变换的方案,但为此必须求出如花键函数那样的插值函数。另一方面,不用进行图形的整形,而是根据字符图形变动格网区域的分割位置,也能够抑制特征量的偏离。图7(a)、图7(b)中,在图形密集处缩小格网的宽度,并在稀疏处扩大格网的宽度而进行分割,其结果,1个图形被设置在大致相同的格网上。作为一带有这种变动的区域分割方式的一个例子,提出特开昭63-14291号公报及特开昭63-16394号公报中所述的方法。用这种方法,首先,提取字符图形的特征(例如指定定向码等),然后,在子区域中分割字符指定图形。并均等地分配特征量。在这里,子区域与格网区域相比被分割成数目更多更细小。图4(a)是进行4×4区域分割的例子,为了均等地分配特征量,在子区域段可以得到对应字符图形局部的疏密的分割。在上述专利技术中,根据特定的规则,通过在各个格网区域中,分配1个以上的子区域,并通过在特定相邻的格网区域中分配1个以上共同的子区域。将子区域汇集中在比其更少的格网区域里。例如,可以从图4(a)的子区域集中于(b)中所示3×3的格网区域。由此,通过在适当的位置上对应字符图形进行区域分割,并且通过在相邻的格网间带有相当于子区域的宽度重叠,而将带有变形和脱位的图形设置在适当的格网上。但是,用上述变动分割位置的方法,由于一般各个格网区域的大小不同,所以各格网区域中提取的特征量的值域将产生偏离。做为特征量的例子,考虑包含在各个格网区域内的黑象素的数目,其可取值是从零到各格网的面积(即包含在格网中的全部象素的数目)。因此,关于2种图形,在比较一定的格网时,既使都是全部被黑色素占据的情况,如果格网的大小不同,则特征量的值也将不相同。相反,尽管2种图形规定的格网的大小不同,若任一个格网都含有相同数目的黑色素则认为他们具有相同的特征量值。这样出现的问题是,一旦特征量的值受格网大小的影响,将会在同一字间,特征量的值也产生大的偏离,其结果,导致降低识别率,变动区域分割的效果并未充分地发挥。本专利技术的目的是提供一种,在进行相互大小不同的区域分割的中,对于由各自的格网区域提取的特征量,为了抑制随格网大小的值的变动,而进行适当的加权。为达到上述目的,本专利技术采取的技术方案如下本专利技术具有以下优良的效果如以上的说明,根据本专利技术,既使分割的格网区域的大小不同时,由于适当地进行特征量的加权,在匹配部可以正确估算特征量的值。特别是因为可以抑制相同字符间特征量的偏离。所以能够降低错误识别。并且,由于不需用以不同局部的倍率来改变图形的倍率,而是用特征量加权这种简单的计算就可得到相等于变倍的效果,因此可以省去非线性归一化程序,并可以不需用进行字符图形整形的时间和装置。以下,参照附图对本专利技术的实施例做具体说明。附图说明图1是表示本专利技术实施例的构成框图。图2是区域分割的流程图。图3是表示区域分割的实例。图4(a)表示子区域的例子,(b)表示将子区域集中于格网区域的实例。图5(a)、图5(b)表示4×4区域中被分割字符图形的实例。图6(a)、图6(b)表示经整形的字符图形的实例。图7(a)、图7(b)表示对应字符图形变化区域的分割位置的实例。图8(a)-图8(d)表示4个方向的定向码。图9(a)、图9(b)表示“木”字的图形。图10表示黑象素数的分布。图11表示轮廓象素数的分布。图12表示笔画数的分布。以下,以附图来说明本专利技术的一个实施例。图1表示本专利技术实施例的构成。字符图形输入部101由扫描器等构成,读取图像并将字符图形以数字图像输入。前处理部102除去输入字符图形的杂波,进行必要的归一化等前处理。接着, 特征提取部(103-107)提取输入字符图形的特征量。在制作辞库时,图形辞库制作部108,用提取的输入字符图形的特征量,将代表各类字的特征量记录到图形辞库109中。在进行字符识别时,匹配部110进行输入图形的特征量和图形辞库109的匹配,将候选字符群或放弃码等送到识别结果输出部111。针对特征提取部进行详细说明,区域分割部103,先根据一定的规则(例如,前面提到的公报中揭示的方法),在格网区域中分割输入图形。这时,各区域的分割位置存储到分割位置存储部107。接着,不同区域特征向量提取部104,从被分割的各格网区域提取特征向量。不同区域特征向量加权部105,依据用存储的分割位置求得的各格网区域的各边长度、对角线长度或面积,对各格网的特征向量或者特征向量的各成分进行加权。特征向量汇集部106,将各格网区域的特征向量当作输入字符图形整体的特征量汇集,并送到辞库制作部108或者匹配部110。实施例1图8(a)表示在水平方向,定向码=1的各状态,图8(b)表示在垂直方向,定向码=2,的各状态,图8(c)表示在右上斜方定向码=3的各状态,图8(d)表示在右下斜方定向码=4的各状态。作为特征向量,将字符图形的轮廓线在水平方向、垂直方向、右上斜、右下斜4个方向量化的定向码,在在各格网区域内分码计算所述定向码的定向码直方图为例。首先,扫描字符图形,注目象素是白象素,而且,当与其上下左右相邻的4个象素是图8中所示的任一种状态时,对此注目象素,根据图8(a)-图8(d)指定1-4个的码(图中的黑色表示黑象素)。例如,注目象素为白色,当其左右的象素和其上方的象素为白色、注目象素的下方的象素为黑象素时(图8的301状态),指定为码1。以下进行图形的区本文档来自技高网...

【技术保护点】
一种特征提取方法,根据一定的规则将输入字符图形分割成多角形的格网区域,将由被分割的各格网区域提取出的特征向量汇集后,做为所述输入字符图形的特征向量,其特征在于:根据构成上述被分割的各格网区域的边或对角线的长度,进行特征向量的加权。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:内山幸央
申请(专利权)人:株式会社理光
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1