当前位置: 首页 > 专利查询>微软公司专利>正文

利用判定树减少手写体识别器差错制造技术

技术编号:2935910 阅读:258 留言:0更新日期:2012-04-11 18:40
一种用于识别输入到计算机系统中的手迹的方法与机构。提供了一级识别器(44)用于将手迹转换成编码点,开发与训练诸如二叉CART树等二级识别器(52)来区分在一级识别器上生成某些编码点的手迹。各二级识别器与各选择的编码点关联。在接收到手迹时,将该手迹提供给一级识别器(44),一个对应的编码点。如果该编码点对应于二级识别器之一,便将该手迹传递给该二级识别器,并从该二级识别器返回一个编码点。如果为否,便返回一级识别器所提供的编码点。本发明专利技术设置一个自动化进程用于训练CART树及通过丢弃并不改进一级识别器的识别精度的CART树(70)来优化识别机构。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及输入用户信息到计算机系统中,更具体地涉及识别用户输入的手写字符。手写体识别技术中的最大问题之一为减小差错率。一种频发的差错类型来自当用户电子地输入紧密地与在计算机试图将手迹(即一组编码点)与之匹配的集合中的两个或更多可能字符的手写字符(称作手迹)匹配时。导致最多差错的字符通常是除了人能辨别但现代识别器不能辨别的单个差别之外互相相同的字符。例如,某些日文符号除了单个的细微差别之外基本上互相相同。问题出现在大多数手写体识别系统采用基于神经网络、隐式马尔科夫(Markov)模型(HMM)或K个最近邻点(KNN)方法的识别器。这些系统在根据它们的总体外观区别字符的任务上完成得合理地好,但当两个字符除了单个差别以外相同时,它们经常失败。虽然已试图手工编码识别器来辨别特别麻烦的识别对,但存在着许多容易互相混淆的字符组。这使得编码过程非常费力及烦琐。此外,编码的结果取决于一或多人关于为了区别字符要测试什么的最佳猜测。这不一定是最好的,因为对于用什么来区分两个(或更多)接近的字符最好存在着许多可能性。其实,最好的这种系统并不实质性降低差错率。最后,每一次改变识别器时,该识别器混淆的字符集也改变,要求重复大部分费力的编码过程。已试图将基于判定树,尤其是分类与回归树(Classificationand Regression Trees-CART),的另一类识别系统用于手写体识别。这些类型的系统已遭到拒绝,因为它们不能从大量字符中作出可靠的判定。作为示例,对于采用日文字符集的系统,支持6650个不同的字符。如能理解的,研制出能接收6550个字符中任何一个及重复地与正确地从适当的分支向下测试该字符直到找到单一的正确结果为止会是极为困难与烦重的任务。相应地,本专利技术的总的目的为提供用于降低手写体识别中的差错率的改进的方法与机构。为了达到这一目的,相关的目的为提供以高成功率区别通常混淆的字符的方法与机构。另一目的为提供能用样本数据加以自动训练的上述种类的方法与系统。又另一目的为提供快速、可靠、成本、高效、灵活与可扩展的上述种类的方法与机构。简要地说,本专利技术提供用于识别输入到计算机系统中的手迹的方法与机构。提供了一级识别器将手迹转换成编码点,及研制与训练了二级识别器(诸如CART树)来区分生成选择的编码点的手迹。各个这种二级识别器是与各个选择的编码点关联的。在接收到手迹时,将手迹提供给一级识别器,从而接收与之对应的编码点。作出关于该编码点是否对应于具有与之关联的二级识别器的所选择的编码点之一的判定。如果没有,便返回一级识别器提供的编码点。如果有,便将手迹传递给二级识别器并从二级识别器返回编码点。从下面结合附图所作的详细描述中,其它目的与优点将是显而易见的,附图中附图说明图1为可包含本专利技术的计算机系统的框图;图2为表示按照本专利技术的一个方面训练一级手写体识别器的功能部件的框图;图3为表示用于将一级识别器所识别的手迹分类到基于编码点的文件中以开发按照本专利技术的二级识别系统的功能部件的框图;图4表示图3中的一级识别器所归类的示范性文件的内容;图5为归类手迹所采取的总的步骤的流程图;图6为表示从图3的文件生成二级识别系统的功能部件的框图;图7-9包括构造与训练二级识别系统所采取的总的步骤的流程图;图10为表示优化本专利技术的识别机制的功能部件的框图;图11-13包括表示优化本专利技术的识别机制所采取的总的步骤的流程图;图14为表示利用本专利技术的识别机制来识别手迹的功能部件的框图;以及图15为表示在利用本专利技术的识别机制来识别手迹时所采用的总的步骤的流程图。翻到附图并首先参见图1,其中示出了可包含本专利技术的总体指示为20的计算机系统。计算机系统20包括可操作地连接到存储器24上的处理器22,存储器包括随机存取存储器(RAM)26及诸如硬盘驱动器、光盘驱动器之类的非易失性存储器28。能够理解,非易失性存储器能结合RAM使用,通过众所周知的交换技术提供相对地大的虚拟存储量。处理器22还通过I/O电路32连接到一个或多个输入设备30上,诸如键盘及诸如鼠标器、笔触输入板、触摸设备或其它取得电子墨水的装置等指点设备。系统20还包括连接在I/O电路32上的至少一个本地输出设备34,用于诸如通过图形用户接口将信息传递给系统20的用户。操作系统加载在存储器24中。按照本专利技术的一个方面,并如下面更详细地描述的,将经常使识别器混淆的那些手迹提供给二级识别进程。为了达到这一目的,对于各输入手迹,传统的(一级)识别器输出一个编码点。不是直接返回该编码点,而是首先检验该编码点来判定它是否对应于一个混淆集合,即表示经常互相混淆的手迹的两个(或多个)编码点之一。如果返回的编码点并不属于一个混淆集合,该机构便返回被一级识别器原先返回的编码点。然而,如果该编码点表示一个混淆集,便将该手迹给予特别为区分该特定混淆集开发的二级识别器。二级识别器利用比一级识别器所执行的更定向的测试来分析手迹,并根据测试结果返回两个(或多个)编码点之一。注意这种经常混淆的手迹不限于两个的集合,而经常与两个或更多的其它手迹混淆。在替代实施例中,能训练一级识别器来识别表示表面相似的编码点(或编码点子集)的形状类。当提供手迹时,一级识别器从而返回至少一个形状类索引。然后二级识别器从形状类索引中确定手迹表示哪一个编码点。注意形状类索引是更一般的概念,即一个编码点是形状类索引的特定类型。然而,为了简单起见,本专利技术将相对于返回编码点的一级识别器加以描述,除非另有说明。从而,应指出本专利技术具有两个不同的方面。第一方面涉及利用取自若干(最好是诸如数千的大量)用户的手写体样本数据来开发本专利技术的改进的识别机制。第二方面涉及采用按照本专利技术的第一方面开发的识别机制将手迹转换成编码点。第一方面,识别机制的开发通常是在相对强大的计算机系统上的开发环境中进行的,该计算机系统可通过网络连接之类连接到样本数据的大型数据库上。第二方面,识别机制的使用通常是在手持式(掌上)计算设备之类上执行的。这一设备最好在加载在存储器24中的Windows CE操作系统下运行,并包含用于输入手写字符(手迹)的触敏液晶显示屏。其它较佳的系统包含基于图形输入板的在Windows95或Windows NT操作系统下运行的桌面个人计算机。参照图2-4回到识别机制的开发上,构造/训练进程42利用样本字符的第一训练集合40来开发与训练一级识别器44(图3)。训练集合是包含与它们的实际、正确编码点(即标识用户想要写的字符的编码点)结合存储的手迹的文件。一级识别器44最好是采用最近邻(nearest neighbor KNN)方法的那种。这些识别器与它们的构造及训练是已知的,从而此后不作详细描述,除外说明识别器44将手迹与训练过的识别器数据46(诸如终点信息)进行匹配来输出编码点。同时指出识别器44实际上可根据输入其中的手迹返回替换编码点的表(按概率排列的),然而为了简单起见,本专利技术将参照单一的返回的编码点描述,除非另有说明。注意一级识别器也能具有返回任何类型的形状索引的形式,用形状码来训练一级识别器。如熟悉本技术的人员所能理解的,这一技术对于返回离散提议的任何识别器或模式匹配技术工作得一样好。按照本专利技术的一个方面及如图3中开头最好地示出的,利用一本文档来自技高网...

【技术保护点】
一种识别输入到计算机系统中的手迹的方法,包括下述步骤: 提供用于将手迹转换成编码点的一级识别器; 训练多个二级识别器来辨别在提供给一级识别器时生成选择的编码点的手迹,并将一个二级识别器与各选择的编码点关联; 接收手迹; 将该手迹提供给一级识别器并接收与之对应的编码点; 判定该编码点是否对应于具有与之关联的二级识别器的选择的编码点,如果是,将该手迹传递给该二级识别器并从该二级识别器返回一个编码点。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:GN胡尔伦德尔JR本内特PM哈鲁普特佐克
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1