一种基于改进距离核主成分分析的手写体数字识别方法技术

技术编号:8683115 阅读:343 留言:0更新日期:2013-05-09 03:05
本发明专利技术涉及一种基于改进距离核主成分分析的手写体数字识别方法,属于模式识别与人工智能领域。本发明专利技术的特征在于,采用MNIST数据库作为实验对象,首先对样本进行二值化预处理,将处理后的样本数据利用距离核映射的核特征空间,在核特征空间利用K均值聚类将训练样本集分为N类子集,然后在核空间中计算核矩阵的特征向量得到变换矩阵,利用变换矩阵进行特征提取,将提取的特征数据集放入支持向量机建立训练模型,最后利用模型预测测试样本的识别率。本发明专利技术可以很好的提高手写体数字识别率高,减少运行时间,并且可以解决大样本的计算代价巨大的问题。

【技术实现步骤摘要】

本专利技术涉及字符识别
,尤其涉及一种基于改进的距离核主成分分析的手写体数字识别方法,属于模式识别领域。
技术介绍
手写体数字识别具有非常广泛的应用,如银行,邮局,税务等。虽然人们在文字识别的研究中已取得很多成就,但距真正意义上的应用还有一定的距离。数字识别的关键在于特征提取,选取的特征要具有可分辨性、可靠性、独立性。目前,数字特征提取的方法有很多,主要可以分为统计特征方法和结构特征方法。主成分分析(Principal Component Analysis, PCA)是模式识别领域中一种经典的特征抽取方法,但是在非线性数据分布情况下该方法不够理想,由于真实的数字图像中存在着光照、旋转等非线性变化,主成分分析作为一种线性方法不能很好的描述这些非线性特征。B.SckilkopI'提出将核方法推广到核空间的核主成分分析(KPCA)方法可以很好的解决非线性问题并且KPCA在人脸识别等方面取得了非常好的成果。但对于大样本的手写体数字来说,由于KPCA计算过程中的复杂性而面临巨大的计算代价,这就限制了它的实用性。基于此,有必要改进KPCA,并可以将其应用在实际的手写体数字识别系统中。为了本文档来自技高网...

【技术保护点】
一种基于改进距离核主成分分析的手写体数字识别方法,其特征在于:具体方法在计算机中是按以下步骤实现的:步骤(1),将手写体数字样本以特征向量的形式输入计算机,首先将MNIST手写体数字数据库进行解压,分解为单个图像的形式,其中包括:60000个训练样本和20000个测试样本,设定:从中选择至少20000个训练样本L组成训练样本数据集合,用{L}表示,每副图像表示为:xl,l=1,2,…,l…,L,其中,每副图像的大小为28×28个像素点,L个训练样本图像共有L×784个像素点,L个训练样本内样本数据的协方差矩阵R为:R=1LΣl=1LxlxlT---(1)步骤(2),选择距离核函数K...

【技术特征摘要】
1.一种基于改进距离核主成分分析的手写体数字识别方法,其特征在于:具体方法在计算机中是按以下步骤实现的: 步骤(1),将手写体数字样本以特征向量的形式输入计算机,首先将MNIST手写体数字数据库进行解压,分解为单个图像的形式,其中包括:60000个训练样本和20000...

【专利技术属性】
技术研发人员:于乃功焦盼娜林佳阮晓钢李勇许锋王琳陈焕朝徐丽
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1