基于多特征融合的实时手写体数字识别方法技术

技术编号:10347814 阅读:189 留言:0更新日期:2014-08-22 12:30
本发明专利技术公开了一种基于多特征融合的实时手写体数字识别方法。首先对手写体数字图像数据库中的图像,进行预处理,包括黑白二值化、截取数字部分、图像调整、归一化、细化;再对预处理后的图像进行结构特征和统计特征的提取并融合,得到特征向量集;进而利用反向传播神经网络进行训练学习。该基于多特征融合的实时手写体数字识别方法既保留了结构特征和统计特征中的鉴别信息,又在一定程度上消除了冗余信息,使每个手写体数字类别的特性更加明显,更易于区分,得到了较好的识别结果。

【技术实现步骤摘要】

本专利技术涉及手写体数字识别
,特别是涉及一种。
技术介绍
手写体数字识别是一个传统和典型的模式识别问题,是光学字符识别(OpticalCharacter Recognition)的一个重要组成部分,在实际生活中有着广泛的应用。因为手写体数字图像缺少了笔画的动态信息,并且书写的风格各异,因此在识别过程中有很大的难度,误识率也较高。但是,手写体数字识别在一些特殊的场合有着不可替代的作用,比如邮政信件分拣中的邮政编码识别,银行支票中的手写体数字识别等。由于手写体数字识别经常涉及会计、金融领域,其严格性是不言而喻的,所以对识别系统的可靠性和识别率要求很高,构成了手写体数字识别面临的主要困难。因此,手写体数字识别的研究有着重要的现实意义,也更具挑战性。手写体数字的类别虽然仅仅只有10种,但是手写体数字的识别是相当困难的。许多测试的结果显示手写体数字的识别率远远低于印刷体的汉字,甚至还没有联机的手写体汉字的识别率高。造成这种情况的原因有:数字笔画简单,差别相对较小,再加上手写体的书写不规范,使得数字特征的提取存在很大的困难,进而识别起来就会有很大的误识率和拒识率。目前,虽然手写体数字的识别已经研究了很长时间,并且取得了很大的突破和进展,但是手写体数字的识别仍然存在两个重要的问题。一是识别的精度还需要进一步的提高。二是大批量数据处理对系统速度又有相当高的要求,因此识别的速度也需要进一步的提高。现在社会已经跨入信息社会,数字识别的信息量会越来越大,因此,必须保证在高精度的前提下,努力去提高数字识别的速度。而手写体数字识别的精确率,与特征提取及融合密切相关。在过去的几十年中,人们提出了很多方法来获取手写体数字的关键特征,主要分为两大类:全局分析和结构分析。对前者,可使用模板匹配、像素密度、矩、特征点、数学变换等技术。这类的特征常常和统计分类方法一起使用。对于后者,多半需要从字符的轮廓或骨架上提取字符形状的基本特征,包括:圈、端点、节点、弧、突起、凹陷、笔画等等。这些结构特征往往与句法分类使用。对于手写体数字识别,难以实现高精度的有效识别。因此,对手写体数字识别的研究正向着更为成熟、复杂、综合的方向发展,尤其是在多特征的提取以及优化融合这些问题的研究上。
技术实现思路
本专利技术的目的在于提供一种,该方法能较好地分析结构特征与统计特征,既保留结构特征和统计特征中的鉴别信息,又在一定程度上消除冗余信息,使每个手写体数字类别的特性更加明显,更易于区分,进一步提高了手写体数字的识别率。为实现上述目的,本专利技术采用的技术方案包括以下步骤:一种,包括如下步骤:第一步、手写体数字图像的预处理(I)对手写体数字图像I,转化成256灰度级的位图格式,并进行黑白二值化处理,得到二值图像,用I1表示;(2)截取二值图像I1中的手写体数字部分,使手写体数字居于正中间,得到数字居中图像I2 ;(3)计算数字居中图像I2的宽度W与长度H的比例W/H,以及白色像素点数量W_Num与总像素点数量S_Num的比例W_Num/S_Num,如果W/H低于阈值R1,则对图像的宽度W做出调整,如果W_Num/S_Num低于阈值民,则对图像I2做膨胀运算,用I3表示调整形状后的图像;(4)将调整形状后的图像I3缩放到NXN个像素点,并再次二值化,得到归一化图像,再对归一化图像做细化处理并消除小分支,得到预处理图像I4 ;第二步、手写体数字图像的结构特征和统计特征提取(2)在结构特征上,提取过程如下:分别计算预处理图像I4在竖直方向的三个位置处的白色像素点的个数,得到3个特征值;分别计算预处理图像I4在水平方向的三个位置处的白色像素点的个数,得到3个特征值;分别计算预处理图像I4在左对角线和右对角线处的白色像素点的个数,得到2个特征值;分别计算预处理图像I4的端点数和四叉点数,得到2个特征值;将上述特征值组合成维度为1X10的结构特征向量T1 ;(2)在统计特征上,提取过程如下:将预处理图像I4平均分成8区域,统计每个区域的白色像素点数量,得到8个特征值 P11P2,--,P8;将预处理图像I4平均分成4区域,统计每个区域的白色像素点数量,得到4个特征值 P9, Pio, Pu, Pl2 ;将预处理图像I4纵向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值p13,P14 ;将预处理图像I4横向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值P15, P16 ;将预处理图像I4横向平均分成3区域,统计中间区域的白色像素点数量,得到I个特征值P17 ;统计整个预处理图像I4的白色像素点数量,得到I个特征值P18 ; 将特征值P1, P2,…,P18组成维度为I X 18的统计特征向量T2 ;第三步、手写体数字图像的结构特征和统计特征融合(I)根据第一步,对手写体数字图像数据库中所有的K幅图像做预处理再根据第二步,对每幅预处理后的图像提取结构特征和统计特征,得到维度为KXlO的结构特征向量集S和维度为KX 18的统计特征向量集T ;(2)对结构特征向量集S做归一化处理;(3)对统计特征向量集T做归一化处理;(4)将归一化后的结构特征向量集S和统计特征向量集T,按行拼接并转置后得到维度为28XK的融合特征向量集S_T ;第四步、基于反向传播神经网络的识别模型(I)设置反向传播神经网络的参数,包括学习速率,动量因子,最大训练次数,以及性能目标值;(2)用维度为4的向量表示手写体数字类别,设置融合特征向量集S_T的每个特征向量对应的手写体数字类别向量,随机选择融合特征向量集s_T的一部分作为训练样本集,余下的部分作为测试样本集,对反向传播神经网络进行多次训练和测试,并保存检验结果最好的反向传播神经网络;第五步、新手写体数字图像的识别将用户输入的待识别的手写体数字图像,按照第一步至第三步的方法进行处理,得到维度为28X1的融合特征向量,将其输入到第四步中的反向传播神经网络进行识别,得到4X1的输出向量,将该输出向量转置并四舍五入,得到维度为4的向量即为该待识别的手写体数字的识别结果。进一步的,第一步(I)所述的对手写体数字图像I进行黑白二值化处理的方法,每个像素点的二值化由以下公式处理得到:本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201410262086.html" title="基于多特征融合的实时手写体数字识别方法原文来自X技术">基于多特征融合的实时手写体数字识别方法</a>

【技术保护点】
一种基于多特征融合的实时手写体数字识别方法,其特征在于包括如下步骤:第一步、手写体数字图像的预处理(1)对手写体数字图像I,转化成256灰度级的位图格式,并进行黑白二值化处理,得到二值图像,用I1表示;(2)截取二值图像I1中的手写体数字部分,使手写体数字居于正中间,得到数字居中图像I2;(3)计算数字居中图像I2的宽度W与长度H的比例W/H,以及白色像素点数量W_Num与总像素点数量S_Num的比例W_Num/S_Num,如果W/H低于阈值R1,则对图像的宽度W做出调整,如果W_Num/S_Num低于阈值R2,则对图像I2做膨胀运算,用I3表示调整形状后的图像;(4)将调整形状后的图像I3缩放到N×N个像素点,并再次二值化,得到归一化图像,再对归一化图像做细化处理并消除小分支,得到预处理图像I4;第二步、手写体数字图像的结构特征和统计特征提取(1)在结构特征上,提取过程如下:分别计算预处理图像I4在竖直方向的三个位置处的白色像素点的个数,得到3个特征值;分别计算预处理图像I4在水平方向的三个位置处的白色像素点的个数,得到3个特征值;分别计算预处理图像I4在左对角线和右对角线处的白色像素点的个数,得到2个特征值;分别计算预处理图像I4的端点数和四叉点数,得到2个特征值;将上述特征值组合成维度为1×10的结构特征向量T1;(2)在统计特征上,提取过程如下:将预处理图像I4平均分成8区域,统计每个区域的白色像素点数量,得到8个特征值P1,P2,…,P8;将预处理图像I4平均分成4区域,统计每个区域的白色像素点数量,得到4个特征值P9,P10,P11,P12;将预处理图像I4纵向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值P13,P14;将预处理图像I4横向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值P15,P16;将预处理图像I4横向平均分成3区域,统计中间区域的白色像素点数量,得到1个特征值P17;统计整个预处理图像I4的白色像素点数量,得到1个特征值P18;将特征值P1,P2,…,P18组成维度为1×18的统计特征向量T2;第三步、手写体数字图像的结构特征和统计特征融合(1)根据第一步,对手写体数字图像数据库中所有的K幅图像做预处理再根据第二步,对每幅预处理后的图像提取结构特征和统计特征,得到维度为K×10的结构特征向量集S和维度为K×18的统计特征向量集T;(2)对结构特征向量集S做归一化处理;(3)对统计特征向量集T做归一化处理;(4)将归一化后的结构特征向量集S和统计特征向量集T,按行拼接并转置后得到维度为28×K的融合特征向量集S_T;第四步、基于反向传播神经网络的识别模型(1)设置反向传播神经网络的参数,包括学习速率,动量因子,最大训练次数,以及性能目标值;(2)用维度为4的向量表示手写体数字类别,设置融合特征向量集S_T的每个特征向量对应的手写体数字类别向量,随机选择融合特征向量集S_T的一部分作为训练样本集,余下的部分作为测试样本集,对反向传播神经网络进行多次训练和测试,并保存检验结果最好的反向传播神经网络;第五步、新手写体数字图像的识别将用户输入的待识别的手写体数字图像,按照第一步至第三步的方法进行处理,得到维度为28×1的融合特征向量,将其输入到第四步中的反向传播神经网络进行识别,得到4×1的输出向量,将该输出向量转置并四舍五入,得到维度为4的向量即为该待识别的手写体数字的识别结果。...

【技术特征摘要】
1.一种基于多特征融合的实时手写体数字识别方法,其特征在于包括如下步骤: 第一步、手写体数字图像的预处理 (1)对手写体数字图像I,转化成256灰度级的位图格式,并进行黑白二值化处理,得到二值图像,用I1表示; (2)截取二值图像I1中的手写体数字部分,使手写体数字居于正中间,得到数字居中图像I2 ; (3)计算数字居中图像I2的宽度W与长度H的比例W/H,以及白色像素点数量W_Num与总像素点数量S_Num的比例W_Num/S_Num,如果W/H低于阈值R1,则对图像的宽度W做出调整,如果W_Num/S_Num低于阈值民,则对图像I2做膨胀运算,用13表示调整形状后的图像; (4)将调整形状后的图像I3缩放到NXN个像素点,并再次二值化,得到归一化图像,再对归一化图像做细化处理并消除小分支,得到预处理图像I4 ; 第二步、手写体数字图像的结构特征和统计特征提取 (1)在结构特征上,提取过程如下: 分别计算预处理图像I4在竖直方向的三个位置处的白色像素点的个数,得到3个特征值; 分别计算预处理图像I 4在水平方向的三个位置处的白色像素点的个数,得到3个特征值; 分别计算预处理图像I4在左对角线和右对角线处的白色像素点的个数,得到2个特征值; 分别计算预处理图像I4的端点数和四叉点数,得到2个特征值; 将上述特征值组合成维度为IX 10的结构特征向量T1 ; (2)在统计特征上,提取过程如下: 将预处理图像I4平均分成8区域,统计每个区域的白色像素点数量,得到8个特征值Pi,P2....,P8 ; 将预处理图像I4平均分成4区域,统计每个区域的白色像素点数量,得到4个特征值?9> PlO) Pll) ?12 ; 将预处理图像I4纵向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值 P13,P14 ; 将预处理图像I4横向平均分成2区域,统计每个区域的白色像素点数量,得到2个特征值 P15,Pie; 将预处理图像I4横向平均分成3区域,统计中间区域的白色像素点数量,得到I个特征值P17 ; 统计整个预处理图像I4的白色像素点数量,得到I个特征值P18 ; 将特征值P1, P2,…,P18组成维度为IX 18的统计特征向量T2 ; 第三步、手写体数字图像的结构特征和统计特征融合 (1)根据第一步,对手写体数字图像数据库中所有的K幅图像做预处理再根据第二步,对每幅预处理后的图像提取结构特征和统计特征,得到维度为KXlO的结构特征向量集S和维度为KX 18...

【专利技术属性】
技术研发人员:张鸿马彩云
申请(专利权)人:武汉科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术