基于多特征融合的实时手写体数字识别方法技术

技术编号：10347814 阅读：213 留言：0更新日期：2014-08-22 12:30

本发明专利技术公开了一种基于多特征融合的实时手写体数字识别方法。首先对手写体数字图像数据库中的图像，进行预处理，包括黑白二值化、截取数字部分、图像调整、归一化、细化；再对预处理后的图像进行结构特征和统计特征的提取并融合，得到特征向量集；进而利用反向传播神经网络进行训练学习。该基于多特征融合的实时手写体数字识别方法既保留了结构特征和统计特征中的鉴别信息,又在一定程度上消除了冗余信息，使每个手写体数字类别的特性更加明显，更易于区分，得到了较好的识别结果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及手写体数字识别
，特别是涉及一种。
技术介绍
手写体数字识别是一个传统和典型的模式识别问题，是光学字符识别(OpticalCharacter Recognition)的一个重要组成部分,在实际生活中有着广泛的应用。因为手写体数字图像缺少了笔画的动态信息，并且书写的风格各异，因此在识别过程中有很大的难度，误识率也较高。但是，手写体数字识别在一些特殊的场合有着不可替代的作用，比如邮政信件分拣中的邮政编码识别，银行支票中的手写体数字识别等。由于手写体数字识别经常涉及会计、金融领域，其严格性是不言而喻的，所以对识别系统的可靠性和识别率要求很高，构成了手写体数字识别面临的主要困难。因此，手写体数字识别的研究有着重要的现实意义，也更具挑战性。手写体数字的类别虽然仅仅只有10种，但是手写体数字的识别是相当困难的。许多测试的结果显示手写体数字的识别率远远低于印刷体的汉字，甚至还没有联机的手写体汉字的识别率高。造成这种情况的原因有:数字笔画简单，差别相对较小，再加上手写体的书写不规范，使得数字特征的提取存在很大的困难，进而识别起来就会有很大的误识率和拒识率。目前，虽然手写体数字的识别已经研究了很长时间，并且取得了很大的突破和进展，但是手写体数字的识别仍然存在两个重要的问题。一是识别的精度还需要进一步的提高。二是大批量数据处理对系统速度又有相当高的要求，因此识别的速度也需要进一步的提高。现在社会已经跨入信息社会，数字识别的信息量会越来越大，因此，必须保证在高精度的前提下，努力去提高数字识别的速度。而手写体数字识别的精确率，与特征提取及融合密切...
<a href="http://www.xjishu.com/zhuanli/55/201410262086.html" title="基于多特征融合的实时手写体数字识别方法原文来自X技术">基于多特征融合的实时手写体数字识别方法</a>

【技术保护点】
一种基于多特征融合的实时手写体数字识别方法，其特征在于包括如下步骤：第一步、手写体数字图像的预处理(1)对手写体数字图像I，转化成256灰度级的位图格式，并进行黑白二值化处理，得到二值图像，用I1表示；(2)截取二值图像I1中的手写体数字部分，使手写体数字居于正中间，得到数字居中图像I2；(3)计算数字居中图像I2的宽度W与长度H的比例W/H，以及白色像素点数量W_Num与总像素点数量S_Num的比例W_Num/S_Num,如果W/H低于阈值R1，则对图像的宽度W做出调整，如果W_Num/S_Num低于阈值R2，则对图像I2做膨胀运算，用I3表示调整形状后的图像；(4)将调整形状后的图像I3缩放到N×N个像素点，并再次二值化，得到归一化图像，再对归一化图像做细化处理并消除小分支，得到预处理图像I4；第二步、手写体数字图像的结构特征和统计特征提取(1)在结构特征上，提取过程如下：分别计算预处理图像I4在竖直方向的三个位置处的白色像素点的个数，得到3个特征值；分别计算预处理图像I4在水平方向的三个位置处的白色像素点的个数，得到3个特征值；分别计算预处理图像I4在左对角线和右对角线处的白色像...

【技术特征摘要】
1.一种基于多特征融合的实时手写体数字识别方法，其特征在于包括如下步骤: 第一步、手写体数字图像的预处理 (1)对手写体数字图像I，转化成256灰度级的位图格式，并进行黑白二值化处理，得到二值图像，用I1表示； (2)截取二值图像I1中的手写体数字部分，使手写体数字居于正中间，得到数字居中图像I2 ; (3)计算数字居中图像I2的宽度W与长度H的比例W/H，以及白色像素点数量W_Num与总像素点数量S_Num的比例W_Num/S_Num，如果W/H低于阈值R1,则对图像的宽度W做出调整，如果W_Num/S_Num低于阈值民，则对图像I2做膨胀运算，用13表示调整形状后的图像； (4)将调整形状后的图像I3缩放到NXN个像素点，并再次二值化，得到归一化图像，再对归一化图像做细化处理并消除小分支，得到预处理图像I4 ; 第二步、手写体数字图像的结构特征和统计特征提取 (1)在结构特征上，提取过程如下: 分别计算预处理图像I4在竖直方向的三个位置处的白色像素点的个数，得到3个特征值；分别计算预处理图像I 4在水平方向的三个位置处的白色像素点的个数，得到3个特征值；分别计算预处理图像I4在左对角线和右对角线处的白色像素点的个数，得到2个特征值；分别计算预处理图像I4的端点数和四叉点数，得到2个特征值；将上述特征值组合成维度为IX 10的结构特征向量T1 ； (2)在统计特征上，提取过程如下: 将预处理图像I4平均分成8区域，统计每个区域的白色像素点数量，得到8个特征值Pi,P2....,P8 ；将预处理图像I4平均分成4区域，统计每个区域的白色像素点数量，得到4个特征值?9> PlO) Pll) ?12 ; 将预处理图像I4纵向平均分成2区域，统计每个区域的白色像素点数量，得到2个特征值 P13，P14 ; 将预处理图像I4横向平均分成2区域，统计每个区域的白色像素点数量，得到2个特征值 P15，Pie；将预处理图像I4横向平均分成3区域，统计中间区域的白色像素点数量，得到I个特征值P17 ; 统计整个预处理图像I4的白色像素点数量，得到I个特征值P18 ；将特征值P1, P2,…，P18组成维度为IX 18的统计特征向量T2 ；第三步、手写体数字图像的结构特征和统计特征融合 (1)根据第一步，对手写体数字图像数据库中所有的K幅图像做预处理再根据第二步，对每幅预处理后的图像提取结构特征和统计特征，得到维度为KXlO的结构特征向量集S和维度为KX 18...

【专利技术属性】
技术研发人员：张鸿，马彩云，
申请(专利权)人：武汉科技大学，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人