残缺印刷体数字字符的识别方法技术

技术编号:2932377 阅读:375 留言:0更新日期:2012-04-11 18:40
一种残缺印刷体数字字符的识别方法,用于图像识别领域。方法如下:先将整个字符轮廓分解为上、下、左和右四个局部轮廓,并用图像边框到字符轮廓的轮廓像素点的位置坐标集合表示轮廓,分别对上、左和右的轮廓轮廓像素点的位置坐标进行一次离散微分,根据一次离散微分分析轮廓曲线的趋势变化,从剩余的上、左和右轮廓中提取集元结构特征,此外,利用左右轮廓统计字符的宽度,利用上下轮廓统计字符高度,统计字符的高宽比和在0.5H范围内统计笔画数目,字符的轮廓结构特征和统计特征相结合,为数字字符建立模型后,采用结构语句识别方法残缺数字字符。该方法能够实现底部残缺和完整数字字符的正确识别,提高了实际应用中数字字符识别的正确率。

【技术实现步骤摘要】

本专利技术涉及的是一种文字识别方法,特别是一种。用于图像识别领域。
技术介绍
近年来文字识别技术广泛运用于各个工程领域,文字识别的研究业取得了巨大的成就,印刷体的文字识别正确率高达99%。但是,实际应用中存在着部分残缺的字符,残缺字符和完整字符混合在一起,给文字识别造成了困难。经文献检索发现,Pasquale Foggia等人在《Image and Vision Computing》(1999,17(9),701-711.)(《图像与视觉计算机》)上发表的“Combining statisticaland structural approaches for handwritten character description”(“统计与结构方法相结合的手写体字符描述”),该文中所提出的方法,先先从手写体字符中提取结构基元,然后用统计的方法对结构基元进行特征描述,最后采用神经网络进行手写体识别。该文涉及的技术主要存在以下缺陷和不足(1)算法仅适用于手写体的文字识别,虽然能有效克服手写体的字符变形,但对于残缺字符的变形无能为力;(2)残缺字符的笔画丢失会减少字符原有的结构基元;(3)残缺字符的笔画丢失同时还会改变字符原本的结构基元,使得用统计方法对基元特征进行描述的时候发生畸变;(4)神经网络的识别方法必须事先确定输入特征向量的维数,但残缺字符的残缺程度不同会影响特征向量的维数。
技术实现思路
本专利技术的目的在于克服现有文字识别技术中的不足,提供一种,使其能够对残缺的印刷体数字字符进行准确的识别。本专利技术是通过以下技术方案实现的,本专利技术方法如下先将整个字符轮廓分解为上、下、左和右四个局部轮廓,并用图像边框到字符轮廓的轮廓像素点的位置坐标集合表示轮廓。分别对上、左和右的轮廓轮廓像素点的位置坐标进行一次离散微分,根据一次离散微分分析轮廓曲线的趋势变化,定义5个结构集元,包括竖直(V)、左斜(L)、右斜(R)、圆弧(C)和突变(P),并从剩余的上、左和右轮廓中提取集元结构特征。此外,利用左右轮廓统计字符的宽度(W),利用上下轮廓统计字符高度(H),最后在0.5H范围内统计笔画数目。字符的轮廓结构特征和统计特征相结合,为数字字符建立模型后,采用结构语句识别方法残缺数字字符。虽然底部残缺的数字字符由于丢失了底部的重要笔画,使得字符失去了许多特征,同时也使得部分特征变得不稳定,给文字识别造成了很大的困难。但是当字符的残缺部分不超过原有字符的0.5H时,人眼依然能够准确地识别出来。这说明残缺的字符依然保留有足够的残余特征。提取这些残留的稳定特征,采用合理的识别策略既能实现底部残缺数字字符的识别。以下对本专利技术方法作进一步的说明,方法步骤如下(1)字符轮廓分解将字符的整体轮廓分解为顶部、底部、左侧和右侧四个方向的轮廓特征来描述。使得底部轮廓的缺损时,不至于影响到顶部特征,而且也可以从左右两侧的轮廓特征中提取部分有价值的信息。左侧轮廓(LP(k),k=1,2,…M)定义为字符最左侧边界像素点的水平方向坐标值。LP(i)=min{x|P(x,y)∈C,y=i}i=1,2…M(1)式中P(x,y)表示图像中坐标为(x,y)的像素点,C表示字符像素点的集合。同理,右侧轮廓(RP(k),k=1,2,…M)定义为字符最右侧边界像素点的水平方向坐标值。RP(i)=max{x|P(x,y)∈C,y=i}i=1,2…M(2)相应地,顶部轮廓(TP(k),k=1,2,…N)定义为字符最高边界像素点的垂直方向坐标值。底部轮廓(BP(k),k=1,2,…N)定义为字符最低边界像素点的垂直方向坐标值。TP(j)=min{y|P(x,y)∈C,x=j}j=1,2…N(3) BP(j)=max{y|P(x,y)∈C,x=j}j=1,2…N(4)(2)轮廓一阶离散微分为了描述轮廓的变化特征,定义四个方向轮廓的一阶微分LPD=LP(i+1)-LP(i)RPD=RP(i+1)-RP(i)(5)TPD=TP(j+1)-TP(j)BPD=BP(j+1)-BP(j)式中i=1,2,…M-1,j=1,2,…N-1。(3)各轮廓上的结构集元特征提取根据字符轮廓的变化趋势定义构成字符轮廓的基本基元。基本基元共有5个分别为竖直(V)、左斜(L)、右斜(R)、圆弧(C)和突变(P)。定义上述基本基元(a)竖直定义假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数,若SR=0,SL=0,则为结构V。(b)左斜定义假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数,若SR=0,SL大阈值LT,则为结构L。(c)右斜定义假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数,若SL=0,SR大阈值RT,则为结构R。(d)圆弧定义假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数,若SR大于阈值RT,SL大阈值LT,则为结构C。(e)突变连续的字符轮廓,其一阶微分值的变化量比较小,而当字符轮廓发生突变时,其一阶微分值相对较大。因此,定义当轮廓的一阶微分值超过阈值PT时则字符轮廓有突变,即为结构P。结构P将字符轮廓分成几条连续的曲线,各条曲线各自独立地提取结构特征。根据上述定义,考虑到字符轮廓上存在的干扰像素点,采用阈值技术检测集元假设PD(k)表示某侧轮廓的一阶微分,k=1,2,…K,SL,SV和SR分别为检测到的PD(k)大于零,等于零和小于零的个数,PT、RT和LT为正整数,则若|PD(k)|>=PT,则在k处检测到结构突变(P);检测到突变结构P的有效范围在x∈,y∈,其中ST表示字符笔划的宽度。这主要是为了避免干扰严重情况下,轮廓边缘光滑处理不够理想时,可能检测到的假突变基元。若SL<LT,SR<RT,则检测到结构为竖直(V);若SL>LT,SR<RT,则检测到结构为左斜(L);若SL<LT,SR>RT,则检测到结构为右斜(R);若SL>LT,SR>RT,则检测到结构为圆弧(C)。左右两侧轮廓上检测到的集元按照从上到下的顺序保存在各自的向量组LS和RS中;顶部检测到集元按从左到右的顺序保存在另一个向量组TS中。顶部轮廓上,TS(i)表示顶部轮廓结构集元的向量组的第i个结构集元,Tn表示顶部轮廓共有的集元数目;左侧轮廓上,LS(i)表示左侧轮廓结构集元的向量组的第i个结构集元,Ln表示左侧轮廓共有的集元数目;右侧轮廓上,RS(i)表示右侧轮廓结构集元的向量组的第i个结构集元,Rn表示右侧轮廓共有的集元数目。(4)轮廓的统计特征采用上述的结构基元还不足以准确识别残缺和完整的数字,引入与结构特征具有较强互不性的轮廓统计特征。(a)字符高度与最大字符宽度Wmax之比字符的最大宽度为Wmax=maxk{RP(k)-LP(k)}---(6)]]>单个字符的高度为h=maxl{TP(l)-BP(l)}---(7)]]> 实际应用中,残缺字符与完整字符混合在一起,而且数量相对较少。因此,虽然底部残缺致使残缺字符的高度无法准确估计,但是在同一文字区域内,字符大小的固定的,其高度接近相等,可以采用单个字符高度的中值滤波估计字符高度,H=med{h1,h2,…hm)(8)m是文字区域内本文档来自技高网...

【技术保护点】
一种残缺印刷体数字字符的识别方法,其特征在于,将整个字符轮廓分解为上、下、左和右四个局部轮廓,并用图像边框到字符轮廓的轮廓像素点的位置坐标集合表示轮廓,分别对上、左和右的轮廓像素点的位置坐标进行一次离散微分,根据一次离散微分分析轮廓曲线的趋势变化,定义5个结构集元,包括竖直V、左斜L、右斜R、圆弧C和突变P,并从剩余的上、左和右轮廓中提取集元结构特征,此外,利用左右轮廓统计字符的宽度W,利用上下轮廓统计字符高度H,最后在0.5H范围内统计笔画数目,字符的轮廓结构特征和统计特征相结合,为数字字符建立模型后,采用结构语句识别方法残缺数字字符。

【技术特征摘要】

【专利技术属性】
技术研发人员:胡小锋叶庆泰徐榕
申请(专利权)人:上海交通大学
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1