特征提取方法技术

技术编号：2936520 阅读：181 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种特征提取方法，其是为抑制因格网大小带来值的变化，而对在各被分割的格网区域提取的特征量进行适当的加权。其中，区域分割部在格网区域中分割输入图形，各区域的分割位置存储在分割位置存储部不同区域特征量提取部从格网区域提取特征向量，不同区域特征量加权部依据各格网区域的各边的长度、对角线的长度、及面积进行特征量的加权。（*该技术在2015年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种在字符识别中适当地进行特征量加权的。将输入字符图形分成格网区域，提取每一格网区域的特征量，将这些特征量集中做为字符图形整体的特征量的字符识别方法是公知的。例如，计算作为特征量而包含在各格网区域内的黑象素的个数，或者对构成字符图形的轮廓的象素图形指定定向码，并使用根据计算包含在各格网区域内的各定向码的数目而做成的定向码直方图来识别字符。在用这样的特征量进行识别时，重要的是，在相同的字种之间，黑色素和定向码总是设置在同样的格网中，然而，特别是在手写字符时，由于图形的变形。有可能使被设置的格网区域不同。对此用图5来进行说明，图5(a)、图5(b)是对同是“井”字符图形，进行4×4的区域分割。在图形(a)和图形(b)中，不含黑象素的格网以及设置有竖2画，横2画的格网有很大不同。也就是说，尽管图形(a)和图形(b)是同一字，但它们的特征量却偏离很大，由此成为降低识别率的原因。作为解决这种问题的一种方法，可以利用“山田博三等的非线性归一化的改善”，昭和63年电子情报通信学会全国春季大会，D-439，P.1-182”以及特开平1-116892号公报中记载的非线性归一化。这种非线性归一化是将字符图形的稠密的地方展开，并将突出的线段缩小，由此进行图形整形。对图5的图形(a)和图形(b)进行非线性归一化后，分别被整形为图6(a)、(b)所示的那样，“井”字符图形设置在大致相同的格网上。因此，降低了特征量的偏离。然而，过去的非线性归一化方法是以局部性的不同倍率来改变图像的倍率，而使字符线的连接变的不自然，使轮廓混乱并出现杂波等，很多都使图形失去了平滑度。...

【技术保护点】
一种特征提取方法，根据一定的规则将输入字符图形分割成多角形的格网区域，将由被分割的各格网区域提取出的特征向量汇集后，做为所述输入字符图形的特征向量，其特征在于：根据构成上述被分割的各格网区域的边或对角线的长度，进行特征向量的加权。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：内山幸央，
申请(专利权)人：株式会社理光，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人