一种手写维吾尔文单词识别方法技术

技术编号：12027853 阅读：102 留言：0更新日期：2015-09-10 12:49

本发明专利技术涉及手写维吾尔文单词识别方法，该方法首先对手写维文单词预处理，接着分别提取了维文单词的笔画结构特征和梯度特征，笔画结构特征是直接在时间坐标序列上提取的，而梯度特征是把预处理后手写维吾尔文单词的时间坐标序列映射为二维图像，在二维的图像中提取的，然后将两者特征进行串行融合，最后采用欧式距离分类器进行分类识别，得到识别结果。本发明专利技术提取了两种维文单词特征，并将串行融合，相比提取单一的特征，提高了识别率。本算法具有算法性能好、实时性强、可靠性高、识别率高等优点，主要应用于移动终端上实现手写维文识别，为维文的信息化处理提供了一种新的方法，开辟了新的应用途径。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于模式识别中的文字识别
，主要涉及手写体识别领域，特别是涉及手写维吾尔文单词识别方法，用于在移动终端上实现维吾尔文单词的手写输入。
技术介绍
维吾尔文是我国一种重要的少数民族语言，是新疆地区维吾尔族用来交流和工作的主要文字之一，属于阿尔泰语系突厥语族西匈语支，是一种粘连型拼音文字。根据 GB12050-89国家标准，现代维吾尔文由32个字母组成，包括8个元音字母，24个辅音字母。维吾尔文字母形体由于独写或在词首、词中、词尾位置不同，每个字母有前连式、后连式、双连式、单立式等2~8种书写形式，演化成124个字符。此外，还有两个复合字符，一个后连前缀符和一个隔音符号，总共有128个维吾尔文单字符。维吾尔文单词是由维吾尔文单字符组成的，一个维吾尔文单词少则有3~4个单字符组成，多则有十几个单字符组成。维吾尔文单词在书写时采用自右向左、自上向下的手写方式，沿着一条水平线即基线相连书写。研宄维吾尔文单词的处理和识别有益于新疆少数民族地区的文化交流、信息交流和科技经济的发展。在市场上，维吾尔文印刷体文字识别系统已经广泛的应用于维吾尔文信息处理的各个领域，但是，对维吾尔文手写单词识别的研宄仍处于探索阶段。相比单字符识别，单词识别具有以下的优势：（1)更自然连贯的手写输入：人们在书写文字时，大部分都是以词为单位出现在脑海中，如果将一个单词中的字符逐个书写逐个识别，很容易影响思维的连贯性，因此，单词的输入相对于单个字符的逐个输入更显得自然和人性化；（2)更快速的手写输入和识别：直接对单词进行手写识别，可以不用间断的...

【技术保护点】
一种手写维吾尔文单词识别方法，其特征在于包括如下处理过程：步骤1、对采集到的手写维文单词进行预处理；步骤2、将步骤1预处理后的维文单词图像从对象空间映射到特征空间，得到维文单词图像的笔画结构特征；步骤3、将预处理后的维文单词的时间坐标序列映射为二维图像，得到维文单词图像的梯度特征；步骤4、将步骤2得到的笔画结构特征和步骤3的得到的梯度特征进行融合，得到维文单词图像的特征向量；步骤5、根据训练样本预先得到的特征向量库，使用欧氏距离分类器对步骤4得到维文单词的特征向量在特征向量库中进行分类识别，得到分类识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：卢朝阳，李静，瞿萌，许亚美，李克，帕提古丽·艾麦尔尼亚孜，郝珍珍，
申请(专利权)人：西安电子科技大学宁波信息技术研究院，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人