一种基于最大熵的文字识别方法和识别装置制造方法及图纸

技术编号:4041750 阅读:275 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种基于最大熵的文字识别方法和识别装置,所述方法包括:将训练样本输入到各个识别引擎中进行特征提取,获得特性信息;针对用户输入的手写轨迹,逐个选取单一识别引擎进行识别,将识别得到的特征信息输入到最大熵训练模型中,由最大熵训练模型输出判定结果;其中,当单一识别引擎对应的判定结果满足预置判定值时,停止下一识别引擎的识别,将当前识别引擎对应的识别结果输出;当单个识别引擎对应的判定结果均不满足预置判定值时,对多个识别引擎的识别结果共同决策进行输出。通过本发明专利技术,在保证识别结果正确的前提下,提高了识别效率。

【技术实现步骤摘要】

本专利技术涉及手写识别
,特别是涉及一种基于最大熵的文字识别方法和识 别装置。
技术介绍
手写识别(Handwriting Recognize),是指将在手写设备上书写时产生的轨迹信 息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程, 是人机交互最自然、最方便的手段之一。随着智能手机、掌上电脑等移动信息工具的普及, 手写识别技术也进入了规模应用时代。手写识别能够使用户按照最自然、最方便的输入方 式进行文字输入,易学易用,可取代键盘或者鼠标。在手写识别中,需要处理不同人不同的书写笔顺和连笔书写的问题。每个识别引 擎在识别时的侧重点不同,有的识别引擎对连笔书写(笔顺正确)的字符能有很高识别率, 但对笔顺错误的字符就不能正确识别;有的识别引擎对字符笔顺不敏感,笔顺是否错误并 不影响识别正确率,但对是否正楷书写比较敏感,连笔书写字符的识别效果会差一些,在笔 顺错误时反而能够给出较好的结果。现有技术对手写字符的识别中,一般采用多个识别引擎共同决策,根据各个识别 结果进行综合考虑、综合判断,最终给出识别结果。由于用户在汉字输入时多数情况下是笔 顺正确的,此方法本文档来自技高网...

【技术保护点】
一种基于最大熵的文字识别方法,其特征在于,包括:A1,将训练样本输入到各个识别引擎中进行特征提取,获得特性信息;A2,依据所述特征信息构建最大熵训练模型;A3,针对用户输入的手写轨迹,逐个选取单一识别引擎进行识别,将识别得到的特征信息输入到最大熵训练模型中,由最大熵训练模型输出判定结果;其中,当单一识别引擎对应的判定结果满足预置判定值时,停止下一识别引擎的识别,将当前识别引擎对应的识别结果输出;当单个识别引擎对应的判定结果均不满足预置判定值时,对多个识别引擎的识别结果共同决策进行输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:李健张连毅武卫东
申请(专利权)人:北京捷通华声语音技术有限公司
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1