【技术实现步骤摘要】
本专利技术涉及模式识别
,尤其涉及一种手写满文字母识别方法及装置。
技术介绍
满语作为一种古老的语言之一,是一种极具代表的少数民族文字,研究少数民族文字识别方法是保护和传承少数民族文化遗产的重要技术手段,具有重要的社会价值和历史意义。目前汉字的手写识别已满足实用化需求,英文和数字的脱机手写识别产品也已经很成熟,但圈点满文的手写文字识别仍是一块空白的领域,尚待研究。授权公告号CN205451106U的技术专利公开了一种手写满文字母采集系统,即基于该专利,可以实现对手写满文字母采集工作,依此建立满文字母库,获得满文字母数据样本,得到训练样本。传统的文字识别方法提取的特征通常为单一特征,但对于满文字母,因其文字的特殊性,仅提取单一特征不具备一定的噪声抗干扰能力。因此,当噪声干扰较大时,会导致满文字母的识别率较低。
技术实现思路
为克服现有技术中存在的问题,本专利技术公开一种手写满文字母识别方法及装置。根据本公开实施例的第一方面,提供一种手写满文字母识别方法,包括:对待识别的满文字母图像进行预处理;分别采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取 ...
【技术保护点】
一种手写满文字母识别装置,其特征在于,包括:第一提取模块,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值;第一降维模块,被配置为采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;第一分类模块,被配置为采用K‑近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。
【技术特征摘要】
1.一种手写满文字母识别装置,其特征在于,包括:第一提取模块,被配置为采用方向特征提取方法和粗网络特征提取方法对待识别的满文字母图像提取特征,得到满文字母特征值;第一降维模块,被配置为采用LDA线性判决分析的方法对所述满文字母特征值进行降维,得到降维后的满文字母特征值;第一分类模块,被配置为采用K-近邻方法对所述降维后的满文字母特征值进行分类处理,得到所述待识别的满文字母图像对应的满文字母。2.如权利要求1所述的手写满文字母识别装置,其特征在于,所述第一提取模块包括:方向特征提取子模块,被配置为对待识别的满文字母图像进行8方向特征提取,或者对待识别的满文字母图像样本进行8方向特征提取,得到满文字母的方向特征值。粗网络特征提取子模块,被配置为对待识别的满文字母图像进行粗网络特征提取,或者对待识别的满文字母图像样本进行粗网络特征提取,得到满文字母的网格特征值。3.如权利要求1所述的手写满文字母识别装置,其特征在于,所述第一分类模块包括:距离计算单元,被配置为计算当前待识别元组与测试元组的距离。比较选择单元,被配置为比较所得距离与优先级队列中的最大距离,得到最终的优先级队列,等待遍历结束后选择优先级队列中K个元组的多数类,将其作为测试元组的类别。4.如权利要求1所述的手写满文字母识别装置,其特征在于,所述装置还包括:第一预处理模块,被配置为对待识别的满文字母图像进行预处理,所述预处理,包括对满文字母图像进行字符大小的线性归一化、加虚拟笔划、字符的非线性归一化、笔划上的点的重采样、笔划上的点的平滑中的一种以上。5.如权利要求1所述的手写满文字母识别装置,其特征在于,所述装置还包括:训练模块,被配置为对满文字母数据样本进行模型训练,以得到降维矩阵与k-近邻方法中k值。6.如权利要求5所述的手写满文字母识别装置,其特征在于,所述训练模块包括:第一处理子模块,被配置为LDA降维矩阵计算,得到线性空间中最佳投影向量;第二处理子模块,被配置为设定不同的K值反复训练,调整K-近邻的参数值。7.如权利要求6所述的手写满文字母识别装置,其特征在于,所述第一处理子模块包括:第二预处理模块,被配置为对所述待识别的满文字母图像样本进行预处理。第二提取模块,被配置为...
【专利技术属性】
技术研发人员:许爽,丁纪峰,李敏,王帆,郑蕊蕊,刘晴,
申请(专利权)人:大连民族大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。