基于混合特征提取的手写数字识别方法技术

技术编号:16038712 阅读:38 留言:0更新日期:2017-08-19 20:34
本发明专利技术提供一种基于混合特征提取的手写数字识别方法,首先采用温度阵列手写数字输入终端进行手写数字信息的采集,并通过预处理去掉首尾的无效帧;然后根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取静态特征;得到包括静态特征和动态特征的混合特征向量,归一化处理后,进行特征选择,得到反映手写数字本质特征的特征向量;将这些特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。本发明专利技术不仅能够有效抑制环境噪声对识别结果的影响,同时对不同人、不同手写笔顺的手写数字识别能够达到较高的正确识别率。

【技术实现步骤摘要】
基于混合特征提取的手写数字识别方法
本专利技术涉及一种基于混合特征提取的手写数字识别方法。
技术介绍
随着智能手机、平板电脑等手持设备的广泛应用,手写输入作为一种更便捷的人机交互方式,越来越得到人们的青睐,联机手写识别技术得到了快速发展。而手写数字缺乏上下文联系,给识别带来了更大的困难。对手写数字进行识别,首先要对从手写输入装置获取的手写数字信息进行预处理,然后再进行特征提取,最后进行特征分类。其中特征提取和分类是最重要的环节,而特征提取的好坏决定了识别正确率的高低。目前常用的特征提取算法有如下几种:统计特征提取和结构特征提取(1.DasN,ReddyJM,SarkarR,etal.Astatistical-topologicalfeaturecombinationforrecognitionofhandwrittennumerals[J].AppliedSoftComputing,2012,12(8):2486-2495.2.BabuUR,ChinthaAK,VenkateswarluY.HandwrittenDigitRecognitionUsingStructural,StatisticalFeaturesandK-nearestNeighborClassifier[J].InternationalJournalofInformationEngineeringandElectronicBusiness(IJIEEB),2014,6(1):62.);统计特征对图像细节和噪声不敏感,但是对一些精细结构不能有效提取;结构特征能把握数字固有的笔画结构,但是对数字结构的变动较为敏感,对于不同的手写字形不能给出较满意的分离效果。静态特征提取和动态特征提取(3.Hafsa,W.,Kherallah,M.,BenJemaa,M.,BenAmara,EN.,2004.Ahybridapproachofneuralnetworks/hiddenmarkovmodelforon-linerecognitionoftheArabicdigits[C]//IEEEInternat.Conf.onSCS’04.Mounastir,Tunisie,pp.137–141.4.Kherallah,M.,HaddadL.,AlimiM.A.,MiticheA.On-lineHandwrittenDigitRecognitionBasedonTrajectoryandVelocityModeling[J].PatternRecognitionLetters,2008,29:580-594.);静态特征对数字笔划书写先后顺序不敏感,但容易受到局部噪声的影响;动态特征对噪声和数字的细小变形不敏感,但书写顺序的不同会造成误识别。局部特征提取和全局特征提取(5.DixonRS,DolfingJG,MeierU,etal.IntegratingStroke-distributionInformationintoSpatialFeatureExtractionforAutomaticHandwritingRecognition:U.S.Patent20,140,363,082[P].2014-12-11.6.NibaranDas,RamSarkar,SubhadipBasu,etal.Ageneticalgorithmbasedregionsamplingforselectionoflocalfeaturesinhandwrittendigitrecognitionapplication[J].AppliedSoftComputing.2012,12(5):1592-16067.MinoruMori;SeiichiUchida;HitoshiSakano.GlobalFeatureforOnlineCharacterRecognition[J].PatternRecognitionLetters2014,35,142-148.)等。局部特征能够把握数字局部笔划、形状等的特点,但易受到噪声的干扰;全局特征考虑了手写数字的非马尔可夫特征,并且对局部噪声不敏感,但书写顺序、书写习惯的不同会影响全局特征的正确提取。传统的特征提取算法一般是提取手写数字的某类特征,一旦对某个数字的某类特征提取失败,将会得到错误的分类结果。
技术实现思路
本专利技术的目的是提供一种基于混合特征提取的手写数字识别方法,对一种温度阵列手写数字输入终端数据进行采集和识别,从而实现在线手写数字识别的方法,能够有效抑制环境噪声对在线识别产生的影响,同时避免了不同手写者、不同手写比划顺序等造成的误识别或拒识别,解决现有技术中存在的上述问题。本专利技术的技术解决方案是:一种基于混合特征提取的手写数字识别方法,包括以下步骤,S1、手写数字信息获取,对温度阵列手写数字输入终端进行手写数字信息的数据采集、预处理,随着手写数字的书写,采用温度阵列手写数字输入终端采集到的数据帧的值的分布随之变化,判断落笔时刻和起笔时刻,消除无效数据帧;S2、手写数字混合特征提取,根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取反映手写数字结构、比划特征等的静态特征;由此得到包括静态特征和动态特征的混合特征向量;S3、手写数字特征选择,对步骤S2得到的动态特征和静态特征进行分析,对特征向量归一化处理后,采用主分量分析法进行特征选择,选择能反映手写数字本质特征的主分量,构成手写数字的特征向量;S4、手写数字识别,将步骤S3得到手写数字的特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。进一步地,步骤S1中,基于温度阵列手写数字输入终端的手写数字信息的获取与预处理,具体步骤如下:S11、计算机通过串口采集温度阵列输入终端的手写输入数据帧,并根据数据帧中温度的变化特征,去掉落笔前和起笔后的无效帧;S12、当一个数字书写完成后,将得到的多帧数据进行去噪处理,然后加权平均,得到一个手写数字的静态数据帧。进一步地,步骤S2中,动态特征提取步骤如下:首先,建立手写数字动态特征库,并给出每个特征的定义;其次,建立手写数字动态特征识别规则库;再次,用测试样本集对识别规则库进行测试,根据测试结果对特征和规则进行调整,直到满意的测试结果为止;最后,根据测试结果得出最优的动态特征。进一步地,步骤S2中,提取了手写数字的六个动态特征,分别为:特征一:起笔点与落笔点之间的距离;特征二:起笔点到落笔点的矢量方向;特征三:每个笔划矢量角度的代数和;特征四:相邻两笔划矢量的夹角;特征五:相邻两笔划矢量夹角绝对值的最大值;特征六:所有笔划矢量旋转方向的变化次数。进一步地,步骤S2中,采用粗网格特征提取方法提取手写数字的温度分布特征,即静态特征,首先对一个数字的多帧数据进行求和平均,然后把平均数据帧中的矩阵分成几个局部小区域,把每个小区域上的点阵密度作为描述特征,即统计每个小区域中图像像素所占百分比作为特征数据。进一步地,步骤S3进行手写数字特征选择,具体为:假设xi为第i个输入样本,用列向量表示,输入样本为X=(x1,x2,…,xN)本文档来自技高网
...
基于混合特征提取的手写数字识别方法

【技术保护点】
一种基于混合特征提取的手写数字识别方法,其特征在于:包括以下步骤,S1、手写数字信息获取,对温度阵列手写数字输入终端进行手写数字信息的采集、预处理,随着手写数字的书写,通过温度阵列手写数字输入终端采集到的数据帧的值的分布随之变化,判断落笔时刻和起笔时刻,消除无效数据帧;S2、手写数字混合特征提取,根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取反映手写数字结构、比划特征的静态特征;由此得到包括静态特征和动态特征的混合特征向量;S3、手写数字特征选择,对步骤S2得到的动态特征和静态特征进行分析,对混合特征向量归一化处理后,采用主分量分析法进行特征选择,选择能反映手写数字本质特征的主分量,构成手写数字的特征向量。S4、手写数字识别,将步骤S3得到手写数字的特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。

【技术特征摘要】
1.一种基于混合特征提取的手写数字识别方法,其特征在于:包括以下步骤,S1、手写数字信息获取,对温度阵列手写数字输入终端进行手写数字信息的采集、预处理,随着手写数字的书写,通过温度阵列手写数字输入终端采集到的数据帧的值的分布随之变化,判断落笔时刻和起笔时刻,消除无效数据帧;S2、手写数字混合特征提取,根据温度变化信息,对手指尖运动轨迹进行跟踪检测,在获得跟踪轨迹的基础上,提取手写数字的动态特征;同时对采集到的一个数字的多帧数据进行平均求和后,提取反映手写数字结构、比划特征的静态特征;由此得到包括静态特征和动态特征的混合特征向量;S3、手写数字特征选择,对步骤S2得到的动态特征和静态特征进行分析,对混合特征向量归一化处理后,采用主分量分析法进行特征选择,选择能反映手写数字本质特征的主分量,构成手写数字的特征向量。S4、手写数字识别,将步骤S3得到手写数字的特征向量用于支持向量机SVM分类器的训练或分类,实现对手写数字的识别。2.如权利要求1所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S1中,基于温度阵列手写数字输入终端的手写数字信息的获取与预处理,具体步骤如下:S11、计算机通过串口采集温度阵列手写数字输入终端的手写输入数据帧,并根据数据帧中温度的变化特征,去掉落笔前和起笔后的无效帧;S12、当一个数字书写完成后,将得到的多帧数据进行去噪处理,然后加权平均,得到一个手写数字的静态数据帧。3.如权利要求1所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S2中,动态特征提取步骤如下:首先,建立手写数字动态特征库,并给出每个特征的定义;其次,建立手写数字动态特征识别规则库;再次,用测试样本集对识别规则库进行测试,根据测试结果对特征和规则进行调整,直到测试样本正确识别率达到98%为止;最后,根据测试结果得出最优的动态特征。4.如权利要求3所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S2中,提取手写数字的六个动态特征,分别为:特征一:起笔点与落笔点之间的距离;特征二:起笔点到落笔点的矢量方向;特征三:每个笔划矢量角度的代数和;特征四:相邻两笔划矢量的夹角;特征五:相邻两笔划矢量夹角绝对值的最大值;特征六:所有笔划矢量旋转方向的变化次数。5.如权利要求1-4任一项所述的基于混合特征提取的手写数字识别方法,其特征在于:步骤S2中,采用粗网格特征提取方法提取手写数字的温度分布特征,即静态特征,首先对一个数字的多帧数据...

【专利技术属性】
技术研发人员:王蕾
申请(专利权)人:南京工程学院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1