【技术实现步骤摘要】
本专利技术属于模式识别与人工智能
中的文字识别方向,特别是涉及。
技术介绍
文字识别是当今备受关注的一个课题,它是模式识别的一个重要分支,也是人工智能和模式识别研究中的一个重要方向。汉字的种类繁多、笔画复杂、相似字多,而且不同人的手写汉字风格迥异,因此手写汉字识别,尤其是手写汉字的相似字识别,一直是文字识别中的一个难点和关注点。在实际应用中,一般的手写汉字识别系统里为了提高识别率通常都要对手写汉字 提取高维的特征向量,以获得更多有助于识别的字体特征信息。但是由于特征向量的维数很高,而且识别中的涉及的字体数目较多,为了运算降低存储量、加快识别的运算速度以及提高识别的正确率,一般都对高维空间的特征向量进行降维映射。目前用于汉字识别比较流行的数据降维算法是线性判别分析法(Linear Discriminate Analysis, LDA)。但是,考虑到汉字类别数众多(如GBl有3755个汉字),采用LDA降维后直接分类,并不能达到很好的识别效果。因此,流行的做法用层级分类的方案。传统的两级LDA选择方案的实现首先是直接用LDA降维,然后进行粗分类得出首选字及其候 ...
【技术保护点】
一种文字识别方法,采用文字识别引擎对采集的文字进行识别,其特征在于所述文字识别引擎是基于核判别局部块配准算法的文字相似字识别算法,核判别局部块配准算法的文字相似字识别算法是在再生希尔伯特空间中采用判别局部块配准算法进行降维。
【技术特征摘要】
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。