基于模糊分类器识别模糊图像中数字的方法技术

技术编号:9382086 阅读:261 留言:0更新日期:2013-11-28 00:28
本发明专利技术的特征:提供一种基于模糊分类器的离线数字识别方法,适用于识别质量降级图像中的数字,该方法从前景色象素的分布特征以及数字外形特征判别每个图像包含的字符是各个数字的真值程度,并能容忍图像少量的倾斜,再通过综合评判识别出图像中包含的数字,识别准确度较高;而且本发明专利技术能够基于少量训练样本的特征取值分布自动设定模糊分类器需要的参数,且多特征判别和自动设定参数使本发明专利技术具有较好的通用性;本发明专利技术有效解决了已有针对模糊图像的数字识别方法存在的准确度有待提高且需要大量训练样本的问题。

【技术实现步骤摘要】

【技术保护点】
一种针对模糊图像基于模糊分类器的离线数字识别方法,包括两部分内容:构建模糊分类器和对未知数字的模糊图像进行数字识别,步骤I.构建模糊分类器,包括特征选择和确定分类器所需的参数,具体步骤如下:步骤(1)首先对数字0~9分别选择若干相对规范的灰度图像作为训练样本,对每个已知数字的图像按照下列步骤计算特征:步骤(11)对灰度图像自适应二值化:找到出现频次最高的两个灰度值c1和c2,且确保c1与c2有一定的间隔;将所有灰度值接近c1的象素设为背景色1,其他的设为前景色0,得到单色图像;步骤(12)去除斑块:由于原始图像是模糊的,将经二值化后的单色图像中前景色象素数少于一定阈值的子图作为斑块去除,即将斑块设为背景色;步骤(13)切除边缘,使所有前景色象素在剩余的矩阵图像内,且通过增加边缘的方式确保图像不小于6行6列;步骤(14)计算所有特征:将图像分成3×3格子,每一格前景色象素数分别除以本行、本列、所有前景色象素数得到3个特征,9个格子得到27个特征m1~m27,另外计算特征m28和m29,它们定义为:m28=前景色高度/前景色宽度,m29=3×3格子中第一行格子的前景色象素数/所有前景色象素数;步骤(2)特征选择:利用logistic回归进行特征选择,将特征m1~m29作为自变量,将图像中的数字作为响应变量,将所有训练样本的m1~m27和样本表示的数字作为数据,认为有p小于0.05的特征回归系数极大似然估计具有统计意义,选择对应的特征;步骤(3)使用步骤(2)选择的特征,构建基于真值程度度量的分类器,真值程度函数中的参数按照下列步骤确定:步骤(31)将所有被选择特征的权重设为1,否则设为0;m28的类型为1,其余特征的类型为2;步骤(32)设置计算hT1?28(m28(x))必须的4个参数,设置计算每个hTi?k(mk(x)),i≠1且k≠28必须的2个参数,方法为:对于每个数字的每个特征,分别将所有训练样本的该特征值按照从小到大的顺序排列,令p0,p1,p2分别为列表的20th,50th,80th百分位数,p3=min(p2?p1,p1?p0);对于数字1的m28,设置距离比率函数的αT,εT,αF,εF分别为p1,p3,p1*0.4,p3*0.4;对于其他数字已被选择的特征,设置距离比率函数的αT,εT为p1,p3;步骤II.对未知数字的模糊图像的识别包括如下步骤:步骤(1)按照步骤I中步骤(11)~步骤(14)计算图像的特征;步骤(2)执行基本的离线识别过程,包括:步骤(21)按式(3)计算10个真值程度;如果gnT?M?1=LIMIT1or(truth11>=LIMIT3and?truth11?truth12>=LIMIT2)),其中LIMIT1,LIMIT2,LIMIT3为自定义阈值,则设置d1=d11,d2=d12,否则:步骤(41)先二值化原始图像,再将单色图像左转一定度数,然后执行步骤I.中步骤(12)~步骤(14)计算图像的特征;步骤(42)执行步骤(2),然后设置d21,d22,truth21和truth22分别为步骤(2)得到的4个值;步骤(43)如果(truth21>=LIMIT1or(truth21>=LIMIT3and?truth21?truth22>=LIMIT2)),则设置d1=d21,d2=d22,否则:将原始图像二值化,右转一定度数,计算图像的特征,执行步骤(2),然后设置d31,d32,truth31和truth32分别为步骤(2)得到的4个值,设置d1=di1,d2=di2,其中truthi1是truth11,truth21,和truth31的最大值;步骤(5)判断d1,d2分别为图像中最可能和第二可能的数字。...

【技术特征摘要】

【专利技术属性】
技术研发人员:成卫青洪龙杨庚唐旋
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1