基于计算机输入下的稀疏自编码的脱机手写体识别方法技术

技术编号：11875808 阅读：145 留言：0更新日期：2015-08-13 02:34

本发明专利技术属于模式识别领域，公开了一种基于计算机输入下的稀疏自编码的手写体识别方法，该方法包括：选取手写体图像库，并分为训练集和测试集两个子数据集；采用稀疏自编码来构建深度神经网络，并获得特征；使用ZCA白化数据进行预处理和可视化得到更好的特征，到此训练好稀疏自编码深度神经网络；将每张图像分成小块，取其中一个小块学习到特征，依次与剩下的小块进行卷积运算并提取训练集图像的各个特征；采用PSO算法快速得到多分类支持向量机参数；将测试集数据输入到多分类支持向量机中，得到分类结果，并得到该测试集识别的正确率。本发明专利技术的手写体识别方法，对数据的泛化能力比较好，并且手写体识别率较高。

全部详细技术资料下载

【技术实现步骤摘要】
【专利说明】本专利技术涉及模式识别、光学字符识别技术、深度学习领域，特别是涉及一种计算机输入下的稀疏自编码的脱机手写体识别方法。
技术介绍
手写体字符识别是光学字符识别技术（OpticalCharacterRecognition，简称 OCR)的一个分支，它研宄的对象是：如何使计算机自动辨认人手写在纸张上的字符。在整个OCR领域中，最为困难的就是脱机手写字符的识别。数字识别就是通过计算机用数学技术方法来研宄模式的自动处理和识别。随着计算机技术的发展，人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿，计算机自动识别输入己成为必须研宄的课题，字符识别是智能计算机接口的一个重要组成部分，所以在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。本申请提出一种，能够提高数据集的泛化能力以及手写体识别率。
技术实现思路
有鉴于此，本申请提供一种基于计算机输入下的稀疏自编码的脱机手写体识别方法，识别算法一方面训练过程均是采用无监督的特征学习，对数据集的泛化能力较好；另一方面，没采用传统视觉特征，对图像识别的干扰小，识别率较高。为达到上述目的，本专利技术提供如下技术方案： -种，其特征在于包括以下步骤：步骤一：选取手写体库，并将图像训练集和测试集两个子数据集；步骤二：采用稀疏自编码来构建深度神经网络，并获得学习到的特征；步骤三：使用ZCA白化对训练集样本数据进行预处理和可视化，得到含有丰富边缘的特征，到此得到训练好的深度神经网络；步骤四，将每张图像分成小块，取其中一个小块学习到特征，依次与剩下的...

【技术保护点】
基于计算机输入下的稀疏自编码的脱机手写体识别方法，其特征在于，该方法包括以下步骤：步骤一：选取手写体图像库，并将图像训练集和测试集两个子数据集；步骤二：采用稀疏自编码来构建深度神经网络，并获得学习到的特征；步骤三：使用ZCA白化对训练集样本数据进行预处理和可视化，得到含有丰富边缘的特征，得到训练好的深度神经网络；步骤四，将每张大图像分割成小块学习特征，并用前面学习到的特征参数对剩下的小块依次进行卷积运算并提取训练集图像的各个特征；步骤五，采用PSO算法快速得到多分类支持向量机参数；步骤六，将测试集数据输入到多分类支持向量机中，得到识别结果，并得到该测试集手写体识别的正确率。

【技术特征摘要】

【专利技术属性】
技术研发人员：张可，柴毅，袁媛，邱焕敏，王一鸣，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆;85

全部详细技术资料下载我是这个专利的主人