一种文字识别方法技术

技术编号：8366906 阅读：222 留言：0更新日期：2013-02-28 05:52

本发明专利技术公开一种文字识别方法，采用文字识别引擎对采集的文字进行识别，文字识别引擎是基于核判别局部块配准算法的文字相似字识别算法，核判别局部块配准算法的文字相似字识别算法是在再生希尔伯特空间中采用判别局部块配准算法进行降维。本发明专利技术提出文字识别方法，通过证明其效果等效于先用核主成分分析法降维，再用判别局部块配准算法进行降维，以提高实践过程中算法的速度。利用本发明专利技术提出的核判别局部块配准算法进行手写汉字相似字的识别，其识别率高于其他有代表性的判别分析提取算法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于模式识别与人工智能
中的文字识别方向，特别是涉及。
技术介绍
文字识别是当今备受关注的一个课题，它是模式识别的一个重要分支，也是人工智能和模式识别研究中的一个重要方向。汉字的种类繁多、笔画复杂、相似字多，而且不同人的手写汉字风格迥异，因此手写汉字识别，尤其是手写汉字的相似字识别，一直是文字识别中的一个难点和关注点。在实际应用中，一般的手写汉字识别系统里为了提高识别率通常都要对手写汉字提取高维的特征向量，以获得更多有助于识别的字体特征信息。但是由于特征向量的维数很高，而且识别中的涉及的字体数目较多，为了运算降低存储量、加快识别的运算速度以及提高识别的正确率，一般都对高维空间的特征向量进行降维映射。目前用于汉字识别比较流行的数据降维算法是线性判别分析法(Linear Discriminate Analysis, LDA)。但是,考虑到汉字类别数众多(如GBl有3755个汉字)，采用LDA降维后直接分类，并不能达到很好的识别效果。因此，流行的做法用层级分类的方案。传统的两级LDA选择方案的实现首先是直接用LDA降维，然后进行粗分类得出首选字及其候...

【技术保护点】
一种文字识别方法，采用文字识别引擎对采集的文字进行识别，其特征在于所述文字识别引擎是基于核判别局部块配准算法的文字相似字识别算法，核判别局部块配准算法的文字相似字识别算法是在再生希尔伯特空间中采用判别局部块配准算法进行降维。

【技术特征摘要】

【专利技术属性】
技术研发人员：金连文，陶大鹏，黎小凤，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人