基于多特征融合和深度学习网络提取的手写数字识别方法技术

技术编号：15691472 阅读：93 留言：0更新日期：2017-06-24 04:42

本发明专利技术公开了基于多特征融合和深度学习网络提取的手写数字识别方法。该方法包括：读入手写数字的图像数据，对数据进行向量化预处理；对处理后的数据采用主成分分析（PCA）技术和方向梯度直方图（HOG）技术进行多特征融合，构造浅层复合特征；对多特征融合后的数据采用深度栈式稀疏自编码（SAE）的模型进行二次特征提取，构造深度学习网络，对浅层复合特征进行高层、深度学习和加工；采用Softmax分类器测试分类效果。本发明专利技术采用多特征融合的方法，融合PCA技术和HOG技术，构造出浅层复合特征，再采用SAE模型进行二次特征提取，构造深度学习网络，得到更简洁高效的特征样本，最后Softmax分类器测试分类效果，能将手写数字的识别准确率提高至99.2%。

Handwritten numeral recognition method based on multi feature fusion and depth learning network extraction

The invention discloses a handwritten numeral recognition method based on multiple feature fusion and depth learning network extraction. The method includes: reading handwritten digital image data preprocessing, vector data; using principal component analysis of the processed data (PCA) technology and the direction of the gradient histogram (HOG) technology for multi feature fusion, composite structure characteristics of shallow; the multi feature fusion data using sparse encoding from stack depth (SAE) the model of feature extraction for two times, to construct deep learning network, high-level, deep learning and processing of the composite characteristics of shallow layer; a Softmax classifier is used to test the effect of classification. The invention adopts the method of multi feature fusion, the fusion of PCA technology and HOG technology, constructs the composite characteristics of shallow layer, and then using the SAE model for the two feature extraction, construction of deep learning network, get more concise and efficient feature samples, finally Softmax classifier to test the effect of classification, recognition of handwritten digit accuracy can be increased to 99.2%.

全部详细技术资料下载

【技术实现步骤摘要】
基于多特征融合和深度学习网络提取的手写数字识别方法
本专利技术涉及手写数字识别
，具体涉及基于多特征融合和深度学习网络提取的手写数字识别方法。
技术介绍
手写数字识别在学科上属于模式识别和人工智能的范畴，是光学字符识别技术的一个分支，主要研究如何利用电子计算机自动辨认手写的阿拉伯数字。随着经济的飞速发展，逐渐信息化的社会在各个方面都要与数字打交道，一个准确率高的手写数字的识别方法在此时就显得尤为重要。虽然手写数字的类别只有10种，且其识别已经研究了很长时间，并取得很大的进展，但是如今的手写数字的识别精度还有需进一步提高。
技术实现思路
本专利技术针对现有技术的不足，提供基于多特征融合和深度学习网络提取的手写数字识别方法，具体技术方案如下。基于多特征融合和深度学习网络提取的手写数字识别方法，其包括如下步骤：步骤1：读入手写数字的图像数据，对数据进行向量化预处理；步骤2：对上一步骤的输出数据采用主成分分析(PCA)技术和方向梯度直方图(HOG)技术进行多特征融合，构造浅层复合特征；步骤3：对多特征融合后的数据采用深度栈式稀疏自编码(SAE)的模型进行二次特征提取，构造深度学习网络，对浅层复合特征进行高层、深度学习和加工；步骤4：采用Softmax分类器分类并将分类结果进行显示，该过程即实现了对手写数字的识别。进一步地，所述主成分分析的实现过程具体如下：(1)为使原数据A的均方误差最小，向量的均值应为零，即数据应以原点作为中心，因此现将原数据A以平均值为中心移到原点得到数据X：(2)协方差用于衡量两个变量的总体误差，而方差是两个变量相同的特殊情况下的协方差，计...
基于多特征融合和深度学习网络提取的手写数字识别方法

【技术保护点】
基于多特征融合和深度学习网络提取的手写数字识别方法，其特征在于包括如下步骤：步骤1：读入手写数字的图像数据，对数据进行向量化预处理；步骤2：对上一步骤的输出数据采用主成分分析(PCA)技术和方向梯度直方图(HOG)技术进行多特征融合，构造浅层复合特征；步骤3：对多特征融合后的数据采用深度栈式稀疏自编码(SAE)的模型进行二次特征提取，构造深度学习网络，对浅层复合特征进行高层、深度学习和加工；步骤4：采用Softmax分类器分类并将分类结果进行显示，该过程即实现了对手写数字的识别。

【技术特征摘要】
1.基于多特征融合和深度学习网络提取的手写数字识别方法，其特征在于包括如下步骤：步骤1：读入手写数字的图像数据，对数据进行向量化预处理；步骤2：对上一步骤的输出数据采用主成分分析(PCA)技术和方向梯度直方图(HOG)技术进行多特征融合，构造浅层复合特征；步骤3：对多特征融合后的数据采用深度栈式稀疏自编码(SAE)的模型进行二次特征提取，构造深度学习网络，对浅层复合特征进行高层、深度学习和加工；步骤4：采用Softmax分类器分类并将分类结果进行显示，该过程即实现了对手写数字的识别。2.根据权利要求1所述的基于多特征融合和深度学习网络提取的手写数字识别方法，其特征在于所述主成分分析的实现过程具体如下：(1)为使原数据A的均方误差最小，向量的均值应为零，即数据应以原点作为中心，因此现将原数据A以平均值为中心移到原点得到数据X：(2)协方差用于衡量两个变量的总体误差，而方差是两个变量相同的特殊情况下的协方差，计算X的协方差无偏估计矩阵Y：由于两个变量相同，此Y也是方差无偏估计矩阵，n为手写数字图像的像素个数；(3)计算协方差矩阵Y的特征值D和单位正交特征向量V，再让特征值D由大到小进行排序；(4)对应特征值的排序将特征向量排序后，即可得到变换矩阵v，令X乘以变化矩阵v即可得到已排序的投影数据Z，其中，第一个对应的就是第一主成分，第二个对应的就是次主成分，以此类推；(5)λi是协方差矩阵，也是方差矩阵的第i个主元的特征值；计算第i个主元的方差贡献率：而R个主元的累计方差贡献率为：求得累计方差贡献率超过99％的主成分数目R，然后在已排序的投影数据Z中取前R维，并将结果记为矩阵B。3.根据权利要求1所述的基于多特征融合和深度学习网络提取的手写数字识别方法，其特征在于所述方向梯度直方图(HOG)技术的实现过程具体如下：(1)将图像灰度化；(2)采用Gamma校正法对输入图像进行颜色空间的归一化，调节图像的对比度，降低图像局部的阴影和光照变化所造成的影响，同时抑制噪音的干扰；(3)将图像划分为单...

【专利技术属性】
技术研发人员：李乡儒，
申请(专利权)人：华南师范大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人