一种相似字符识别方法及纸币冠字码识别方法技术

技术编号:13793181 阅读:47 留言:0更新日期:2016-10-06 06:00
本发明专利技术公开了一种相似字符辨别方法及纸币冠字码识别方法,并具体公开了一种对第五套人民币面值为100元纸币的冠字识别方法,该方法分别针对容易混淆的相似字符B与8,O与Q,7、J与T,2与Z,6、G与E,C与G,E与F,O与D进行分析,并运用于纸币冠字码识别中解决算法精度问题,提高了冠字码的识别率,使得冠字码识别率达到99.9%或以上。

【技术实现步骤摘要】

本专利技术涉及相似字符识别方法领域,特别涉及一种相似字符识别方法及将该方法利用到纸币冠字码识别方法。
技术介绍
数字字符识别广泛地应用于车牌号码识别、人民币冠字码识别等领域,在对数字与字符进行识别时,B与8,O与Q,7、J与T,2与Z,6、G与E,C与G,E与F,O与D字符被称为相似字符,容易引起混淆,但目前在进行字符识别时却没有引起足够的重视,导致目前不论是车牌号码实时识别还是金融机构对纸币冠字码进行自动识别时,精度不高。目前,纸币上都有一个唯一的冠字号码,它可以作为纸币的“身份证”,用于区别于其它纸币。冠字号码图像具有举证之用,对解决金融机构与客户之间因为假币产生的纠纷是非常有利的,冠字码识别技术是一种科技含量很高的技术,冠字码识别技术涉及许多科研领域,包括CIS图像传感器与图像采集技术,DSP数据处理技术,数字图像处理技术,模式识别技术等。近年来国外如美国、日本、英国、德国已经研制出各自的纸币冠字码识别模块且已经在市场上应用,国内也开始对纸币冠字码识别技术进行研究,并取得了不少研究成果,冠字码识别技术已经在国内研发的ATM机,点钞机,验钞机,清分机等金融机具上应用。对于纸币冠字码识别技术,科研机构、企业关心的是算法的性能,性能主要包括两方面,一方面是算法的效率,即算法运行的总时间:速度,一方面是算法的精度,即算法的识别率。目前国内外有些纸币冠字码识别方法在纸币边缘检测,纸币面值面向,冠字码定位切割及冠字码识别算法的效率比较低,导致算法时间耗很长,而不得不采用性能更高的硬件作为处理平台,增加了硬件成本。算法精度方面,国内的冠字码识别算法一般采用神经网络,但没有对神经网络识别结果进一步处理,导致算法识别率偏低且难以稳定。总之,国内外一些冠字码算法性能不高,有待于改进。目前,冠字码识别主要包括以下步骤:首先需要获取冠字码中每个字符的图像,然后,形成每个字符的特征矢量,最后利用BP神经网络进行识别获得各个冠字码字符,组成字符串完成冠字码识别。但是这样的冠识别方法的识别精度不高。
技术实现思路
本专利技术针对目前冠字码识别方法中没有考虑到相似字符的影响而识别精度不能有效地提高的不足,提供一种相似字符识别方法及及采用该相似字符识别方法进行的纸币冠字码识别的方法。本专利技术的技术方案是:一种相似字符分辨方法,该方法将待分辨的相似字符图像尺寸归一化形成标准二值字符,相似字符B与8的分辨方法包括:计算出待分辨的归一化标准二值字符左边黑竖线长度len;计算待分辨的归一化标准二值字符左上顶点4个单位45°三角区域与左下顶点4个单位135°三角区域的白点个数count;如果len小于21或count大于等于12则该待分辨字符为8,否则为B;相似字符O、0与Q的分辨方法包括:检测待分辨的归一化标准二值字符的第12行至18行,先求每行闭环内白色像素的起点与白素像素第一结束点作为长度leni,其中j=12、13、…18为行号;计算Subj=Lenj-Lenj+1判断,Subi的最大值是否大于等于3,若Subi的最大值是大于等于3,则待分辨的字符是Q,否则为O或0;相似字符7,J与T的分辨方法包括:从左至右扫描待分辨的归一化标准二值字符的第3行至第7行,当扫描到黑色像素时,记下所在的列col,求col的最大值colmax,记录col取最大
值时所在的行rowj,当colmax大于等于7时,再扫描从右至左扫描rowj行,当扫描到黑色像素时停止,并记白色像素的长度lenw,当lenw小于等于4时,识别成7;当colmax小于等于7时,扫描待识别字符的特征矢量所有像素,记下黑色像素最多的一列coli,再从14行到24行扫描待识别字符的特征矢量,记下有黑色像素的第一列col1,当coli减col1大于等于4时,识别成J,否则为T;相似字符2与Z的分辨方法包括以下步骤:从第10行至第1行扫描待分辨的归一化标准二值字符,每行从左至右扫描前5列,累加黑色像素,如果累加黑色像素值大于等于两个点就停止;并记录所在的行rowj,如果rowj大于等于6时,识别成2,否则识别成Z;相似字符6,E,G的识别方法包括以下步骤:扫描待分辨的归一化标准二值字符的第5列至第10列,从每一列的中间开始从上往下记录和从下往上记录,记录遇到黑点之前白点的个数之和counti,如果counti的最大值大于等于11则为G,否则为E或6。然后识别E与6,识别方法如下:扫描第16行至20行,每1行从16列从右至左累加白点个数ACCi,如果遇到黑点则停止累加,求ACCi的最大值ACCmax,如果ACCmax小于等于7则识别成6,否则为E;相似字符E与F的分辨方法统计待分辨的归一化标准二值字符第21行到24行,第7列到16列矩形区域内黑色像素点的个数之和,如果大于等于4则识别成E,否则识别成F。本专利技术从相似字符的具体情况出发,分别加以辨别,识别率提高。本专利技术还提供了一种纸币冠字码识别方法,包括以下步骤:步骤A、获取冠字码中每个字符的图像;步骤B、获取每个字符的全像素特征矢量形成归一化标准二值字符;本步骤中,对每个字符进行二值化、滤波、尺寸归一化处理,形成归一化标准二
值字符,然后形成全像素特征矢量。这个步骤与目前冠字码识别或者车牌识别等字符识别没有多少区别。步骤C、利用BP神经网络进行识别获得各个冠字码字符;步骤D、按顺序组成冠字码;其特征在于:如果步骤C中获得的冠字码字符是B或者8时还包括:步骤C11、计算出待分辨的归一化标准二值字符左边黑竖线长度len;步骤C12、计算待分辨的归一化标准二值字符左上顶点4个单位45°三角区域与左下顶点4个单位135°三角区域的白点个数count;步骤C13、如果len小于21或count大于等于12则该待分辨字符为8,否则为B;如果步骤C中获得的冠字码字符是O、0与Q时还包括:步骤C21、检测待分辨的归一化标准二值字符的第12行至18行,先求每行闭环内白色像素的起点与白素像素第一结束点作为长度leni,其中j=12、13、…18为行号;步骤C22、计算Subj=Lenj-Lenj+1步骤C23、判断,Subi的最大值是否大于等于3,若Subi的最大值是大于等于3,则待分辨的字符是Q,否则为O或0;如果步骤C中获得的冠字码字符是7,J与T时还包括:步骤C31、从左至右扫描待分辨的归一化标准二值字符的第3行至第7行,当扫描到黑色像素时,记下所在的列col,求col的最大值colmax,记录col取最大值时所在的行rowj,当colmax大于等于7时,再扫描从右至左扫描rowj行,当扫描到黑色像素时停止,并记白色像素的长度lenw,当lenw小于等于4时,识别成7;步骤C32、当colmax小于等于7时,扫描待识别字符的特征矢量所有像素,
记下黑色像素最多的一列coli,再从14行到24行扫描待识别字符的特征矢量,记下有黑色像素的第一列col1,当coli减col1大于等于4时,识别成J,否则为T;如果步骤C中获得的冠字码字符是2与Z时还包括:步骤C41、从第10行至第1行扫描待分辨的归一化标准二值字符,每行从左至右扫描前5列,累加黑色像素,如果累加黑色像素值大于等于两个点就停止;并记录所在的行rowj,如果rowj本文档来自技高网
...

【技术保护点】
一种相似字符分辨方法,该方法将待分辨的相似字符的图像归一化后形成归一化标准二值字符,所述的相似字符包括B与8,O与Q,7、J与T,2与Z,6、G与E,C与G,E与F,O与D;其特征在于:相似字符B与8的分辨方法包括:计算出待分辨的归一化标准二值字符左边黑竖线长度len;计算待分辨的归一化标准二值字符左上顶点4个单位45°三角区域与左下顶点4个单位135°三角区域的白点个数count;如果len小于21或count大于等于12则该待分辨字符为8,否则为B;相似字符O、0与Q的分辨方法包括:检测待分辨的归一化标准二值字符的第12行至18行,先求每行闭环内白色像素的起点与白素像素第一结束点作为长度leni,其中j=12、13、…18为行号;计算Subj=Lenj‑Lenj+1判断,Subi的最大值是否大于等于3,若Subi的最大值是大于等于3,则待分辨的字符是Q,否则为O或0;相似字符7,J与T的分辨方法包括:从左至右扫描待分辨的归一化标准二值字符的第3行至第7行,当扫描到黑色像素时,记下所在的列col,求col的最大值colmax,记录col取最大值时所在的行rowj,当colmax大于等于7时,再扫描从右至左扫描rowj行,当扫描到黑色像素时停止,并记白色像素的长度lenw,当lenw小于等于4时,识别成7;当colmax小于等于7时,按列扫描待识别字符所有像素,记下黑色像素最多的一列coli,再从14行到24行按列扫描待识别字符,记下有黑色像素的第一列col1,当coli减col1大于等于4时,识别成J,否则为T;相似字符2与Z的分辨方法包括以下步骤:从第10行至第1行扫描待分辨的归一化标准二值字符,每行从左至右扫描前5列,累加黑色像素,如果累加黑色像素值大于等于两个点就停止;并记录所在的行rowj,如果rowj大于等于6时,识别成2,否则识别成Z;相似字符6,E,G的识别方法包括以下步骤:扫描待分辨的归一化标准二值字符的第5列至第10列,从每一列的中间开始从上往下记录和从下往上记录,记录遇到黑点之前白点的个数之和counti,如果counti的最大值大于等于11则为G,否则为E或6。然后识别E与6,识别方法如下:扫描第16行至20行,每1行从16列从右至左累加白点个数ACCi,如果遇到黑点则停止累加,求ACCi的最大值ACCmax,如果ACCmax小于等于7则识别成6,否则为E;相似字符E与F的分辨方法统计待分辨的归一化标准二值字符第21行到24行,第7列到16列矩形区域内黑色像素点的个数之和,如果大于等于4则识别成E,否则识别成F。...

【技术特征摘要】
1.一种相似字符分辨方法,该方法将待分辨的相似字符的图像归一化后形成归一化标准二值字符,所述的相似字符包括B与8,O与Q,7、J与T,2与Z,6、G与E,C与G,E与F,O与D;其特征在于:相似字符B与8的分辨方法包括:计算出待分辨的归一化标准二值字符左边黑竖线长度len;计算待分辨的归一化标准二值字符左上顶点4个单位45°三角区域与左下顶点4个单位135°三角区域的白点个数count;如果len小于21或count大于等于12则该待分辨字符为8,否则为B;相似字符O、0与Q的分辨方法包括:检测待分辨的归一化标准二值字符的第12行至18行,先求每行闭环内白色像素的起点与白素像素第一结束点作为长度leni,其中j=12、13、…18为行号;计算Subj=Lenj-Lenj+1判断,Subi的最大值是否大于等于3,若Subi的最大值是大于等于3,则待分辨的字符是Q,否则为O或0;相似字符7,J与T的分辨方法包括:从左至右扫描待分辨的归一化标准二值字符的第3行至第7行,当扫描到黑色像素时,记下所在的列col,求col的最大值colmax,记录col取最大值时所在的行rowj,当colmax大于等于7时,再扫描从右至左扫描rowj行,当扫描到黑色像素时停止,并记白色像素的长度lenw,当lenw小于等于4时,识别成7;当colmax小于等于7时,按列扫描待识别字符所有像素,记下黑色像素最多的一列coli,再从14行到24行按列扫描待识别字符,记下有黑色像素的第一列col1,当coli减col1大于等于4时,识别成J,否则为T;相似字符2与Z的分辨方法包括以下步骤:从第10行至第1行扫描待分辨的归一化标准二值字符,每行从左至右扫描前5列,累加黑色像素,如果累加黑色像素值大于等于两个点就停止;并记录所在的行rowj,如果rowj大于等于6时,识别成2,否则识别成Z;相似字符6,E,G的识别方法包括以下步骤:扫描待分辨的归一化标准二值字符的第5列至第10列,从每一列的中间开始从上往下记录和从下往上记录,记录遇到黑点之前白点的个数之和counti,如果counti的最大值大于等于11则为G,否则为E或6。然后识别E与6,识别方法如下:扫描第16行至20行,每1行从16列从右至左累加白点个数ACCi,如果遇到黑点则停止累加,求ACCi的最大值ACCmax,如果ACCmax小于等于7则识别成6,否则为E;相似字符E与F的分辨方法统计待分辨的归一化标准二值字符第21行到24行,第7列到16列矩形区域内黑色像素点的个数之和,如果大于等于4则识别成E,否则识别成F。2.一种纸币冠字码识别方法,包括以下步骤:步骤A、获取冠字码中每个字符的图像;步骤B、获取每个字符的归一化标准二值字符并形成全像素特征矢量;步骤C、全像素特征矢量加入到BP神经网络进行识别获得各个冠字码字符;步骤D、按顺序组成冠字码;其特征在于:如果步骤C中获得的冠字码字符是B或者8时还包括:步骤C11、计算出待分辨的归一化标准二值字符左边黑竖线长度len;步骤C12、计算待分辨的归一化标准二值字符左上顶点4个单位45°三角区域与左下顶点4个单位135°三角区域的白点个数count;步骤C13、如果len小于21或count大于等于12则该待分辨字符为8,
\t否则为B;如果步骤C中获得的冠字码字符是O、0与Q时还包括:步骤C21、检测待分辨的归一化标准二值字符的第12行至18行,先求每行闭环内白色像素的起点与白素像素第一结束点作为长度leni,其中j=12、13、…18为行号;步骤C22、计算Subj=Lenj-Lenj+1步骤C23、判断,Subi的最大值是否大于等于3,若Subi的最大值是大于等于3,则待分辨的字符是Q,否则为O或0;如果步骤C中获得的冠字码字符是7,J与T时还包括:步骤C31、从左至右扫描待分辨的归一化标准二值字符的第3行至第7行,当扫描到黑色像素时,记下所在的列col,求col的最大值colmax,记录col取最大值时所在的行rowj,当colmax大于等于7时,再扫描从右至左扫描rowj行,当扫描到黑色像素时停止,并记白色像素的长度lenw,当lenw小于等于4时,识别成7;步骤C32、当colmax小于等于7时,扫描待识别字符的特征矢量所有像素,记下黑色像素最多的一列coli,再从14行到24行扫描待识别字符的特征矢量,记下有黑色像素的第一列col1,当coli减col1大于等于4时,识别成J,否则为T;如果步骤C中获得的冠字码字符是2与Z时还包括:步骤C41、从第10行至第1行扫描待分辨的归一化标准二值字符,每行从左至右扫描前5列,累加黑色像素,如果累加黑色像素值大于等于两个点就停止;并记录所在的行rowj,如果rowj大于等于6时,识别成2,否则识别成Z;如果步骤C中获得的冠字码字符是6,E与G时还包括:步骤C51、扫描待分辨的归一化标准二值字符的第5列至第10列,从每
\t一列的中间开始从上往下记录和从下往上记录,记录遇到黑点之前白点的个数之和counti,如果counti的最大值大于等于11则为G,否则为E或6。然后识别E与6,识别方法如下:扫描第16行至20行,每1行从16列从右至左累加白点个数ACCi,如果遇到黑点则停止累加,求ACCi的最大值ACCmax,如果ACCmax小于等于7则识别成6,否则为E;如果步骤C中获得的冠字码字符是E与F时还包括:步骤C61、统计待分辨的归一化标准二值字符第21行到24行,第7列到16列矩形区域内黑色像素点的个数之和,如果大于等于4则识别成E,否则识别成F。3.根据权利要求2所述的纸币冠字码识别方法,其特征在于:所述的步骤A中包括:步骤A1、对纸币进行边缘检测,找到CIS采集图像的纸币四边边缘与纸币的四个顶点;步骤A2、对纸币进行倾斜校正预处理;步骤A3、识别纸币的面向朝向;步骤A4、识别纸币的面值;步骤A5、对冠字码图像进行精确定位与切割。4.根据权利要求3所述的纸币冠字码识别方法,其特征在于:所述的步骤A1包括以下步骤:步骤A101、对待测纸币进行图像采集,得到包含背景的原始图像f(x,y);步骤A102、根据原始图像f(x,y),获取原始图像f(x,y)中实际纸币图像的多个边缘点坐标;步骤A103、根据多个边缘点坐标,利用最小二乘法拟合得到实际纸币图像的4条边缘直线方程;步骤A104、根据4条边缘直线方程,边缘直线方程两两直线相交,计算得出是个顶点坐标。5.根据权利要求4所述的纸币冠字码识别方法,其特征在于:所述的步骤A2中,将纸币图像f(x,y)拷贝到以横坐标为a纵坐标为b的一块空间开辟的目标内存空间中,包括以下步骤:步骤A201、根据纸币上部与左部的直线方程,分别计算出从纸币竖直倾斜偏移量△y与纸币的水平倾斜偏移量△x;△y值等于纸币上部直线方程x坐标对应的y值减去纸币左上顶点坐标y0,△x是纸币左部直线方程y坐标对应的x值减去纸币左上顶点坐标x0;步骤A202、将要填充的图像目的坐标的横坐标a,纵坐标b加上纸币左上顶点横坐标x0,坐标y0,再加上该点对应的纸币横向倾斜偏移量△xb,纵向倾斜偏移量△ya,即x1=a+x0+△xb,y1=b+y0+△ya;把横坐标x1,纵坐标y下原图像像素取出来填到新的目的内存里。6.根据权利要求5所述的纸币冠字码识别方法,其特征在于:所述的步骤A3中,按第五套人民币的特点确定朝向,包括以下步骤:步骤A301、先在水印区域与纸币左右对称的另一区域进行取矩形块累加像素累加比较,确定了水印在左边还是右边;判断纸币的朝向;步骤A302、找到像素累加最大的那一边,用上部的国徽区域图像或多民族文字图像与纸币上下对称的另一区域取矩形块累加像素进行比较,根据像素累加比大小,确定了纸币是正立或倒立。7.根据权利要求6所述的纸币冠字码识别方法,其特征在于:所述的步骤A4中,包括以下步骤:步骤A401、纸币数字特征区域图像切割;步骤A402、特征区域图像的二值化;步骤A403、对二值化后的图像做竖直投影,得到投影曲线;步骤A404、选择一个标准模板在投影曲线上滑动匹配,每滑动一个像素值,采用以下公式计算投影曲线与模板的匹配相关值: s m = Σ i = 0 N - 1 ( f p ( i ) - f p ‾ ) ( f t ( i ) - f t ‾ ) Σ ...

【专利技术属性】
技术研发人员:夏爱华郭礼虎
申请(专利权)人:新达通科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1