一种基于鲁棒度量的手写体识别方法与系统技术方案

技术编号：12223072 阅读：73 留言：0更新日期：2015-10-22 01:13

本发明专利技术公开了一种基于鲁棒度量的手写体识别方法与系统，通过对手写体训练样本进行相似性学习，构造加权相似图，在紧凑局部类内散度和分离局部类间散度的同时保持所有训练样本的局部特性。为了提升手写体描述的鲁棒性，提出将1-范数度量应用于半监督特征学习模型，设计出性能鲁棒的手写体识别方法与系统，输出一个可用于样本内和样本外手写体图像特征提取的投影矩阵P。样本外图像的归纳通过将测试样本向投影矩阵P进行投影，进而将提取的特征输入高效的标签传播分类器进行归类，取对应类别软标签中概率的最大值的位置，用于判定测试样本的类别，得到最准确的字符识别结果。同时，通过建立比率模型，减少了模型参数，且投影矩阵P满足正交特性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉和图像识别
，特别是涉及一种基于鲁棒度量的手写体体识别方法与系统。
技术介绍
如今是一个信息爆炸的时代，在我们日常生活中存在大量的、有价值的多媒体高维信息。离线手写体识别即是对其中某种高维信息进行特征提取并利用的一个实例。它通过计算机将纸质图像电子化，得到计算机存储的字符图像，之后通过一系列机器学习的方法提取图像特征、分类等操作最终识别字符。一旦得出高效准确识别字符的方法，可应用到办公自动化、机器翻译等领域，即可带来巨大的社会和经济效益。但是由于有效地抽取手写体图像特征的过程具有一定难度，导致到目前为止，离线手写体（本专利技术中简称手写体）字符识别距离实用要求还有一定距离。目前的大部分研宄工作都集中在处理手写体图像特征提取问题，且也已取得一定的成果。但是从真实世界中采集的手写体图像通常存在包含噪声、异类数据或数据缺失等问题，手写体图像存在因书写习惯等原因造成的不规范笔划等问题，因此需要更鲁棒的算法来进行特征提取。近年来，一些基于1-范数的鲁棒模型被提出，例如基于1-范数的主成分分析算法 (PCA-L1)、基于1-范数的判别性局部保持投影算法（DLPP-L1)等。这些鲁棒算法提出的思想是：传统的基于2-范数距离度量的算法对于数据中的噪声或异类数据比较敏感，而基于 1-范数的距离度量则能克服这个缺点，提升模型的鲁棒性。这些算法确实使得结果更加鲁棒，但由于目前只存在无监督与全监督的算法，无法充分利用有标签数据和无标签数据信息，因此结果的准确度还有很大的提升空间。另外，算法中的一些经验参数也非...

【技术保护点】
一种基于鲁棒度量的手写体识别方法，其特征在于，基于有标签数据的判别性与所有样本局部保持的1‑范数投影的思想，该方法包括：对手写体训练样本进行相似性学习，构造加权相似图，在紧凑局部类内散度和分离局部类间散度的同时保持所有训练样本的局部特性；构建基于1‑范数度量的鲁棒半监督手写体字符图像特征学习模型，所述模型优化输出一个可用于样本内和样本外图像特征提取的投影矩阵P；同时，通过建立比率模型，减少模型参数，且优化输出的投影矩阵P满足正交特性；利用所述投影矩阵P对手写体测试样本进行特征提取，样本外图像的归纳主要通过将所述测试样本向投影矩阵P进行映射；利用标签传播分类器，对降维后的测试样本特征完成测试，输出所述测试样本的类别软标签，取对应所述类别软标签中概率的最大值的位置，用于判定所述测试样本的类别，得到字符识别结果；其中，所述类别软标签中的数值代表所述测试样本属于各个类别的概率。

【技术特征摘要】

【专利技术属性】
技术研发人员：张召，汪笑宇，张莉，李凡长，
申请(专利权)人：苏州大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人