【技术实现步骤摘要】
本专利技术涉及手写识别
,特别是涉及一种基于最大熵的文字识别方法和识 别装置。
技术介绍
手写识别(Handwriting Recognize),是指将在手写设备上书写时产生的轨迹信 息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程, 是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等移动信息工具的普及, 手写识别技术也进入了规模应用时代。手写识别能够使用户按照最自然、最方便的输入方 式进行文字输入,易学易用,可取代键盘或者鼠标。在手写识别中,需要处理不同人不同的书写笔顺和连笔书写的问题。每个识别引 擎在识别时的侧重点不同,有的识别引擎对连笔书写(笔顺正确)的字符能有很高识别率, 但对笔顺错误的字符就不能正确识别;有的识别引擎对字符笔顺不敏感,笔顺是否错误并 不影响识别正确率,但对是否正楷书写比较敏感,连笔书写字符的识别效果会差一些,在笔 顺错误时反而能够给出较好的结果。现有技术对手写字符的识别中,一般采用多个识别引擎共同决策,根据各个识别 结果进行综合考虑、综合判断,最终给出识别结果。由于用户在汉字输入时多数情况下是 ...
【技术保护点】
一种基于最大熵的文字识别方法,其特征在于,包括:A1,将训练样本输入到各个识别引擎中进行特征提取,获得特性信息;A2,依据所述特征信息构建最大熵训练模型;A3,针对用户输入的手写轨迹,逐个选取单一识别引擎进行识别,将识别得到的特征信息输入到最大熵训练模型中,由最大熵训练模型输出判定结果;其中,当单一识别引擎对应的判定结果满足预置判定值时,停止下一识别引擎的识别,将当前识别引擎对应的识别结果输出;当单个识别引擎对应的判定结果均不满足预置判定值时,对多个识别引擎的识别结果共同决策进行输出。
【技术特征摘要】
【专利技术属性】
技术研发人员:李健,张连毅,武卫东,
申请(专利权)人:北京捷通华声语音技术有限公司,
类型:发明
国别省市:11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。