辨认图制造技术

技术编号:2927259 阅读:188 留言:0更新日期:2012-04-11 18:40
用来确定手写图形的至少一个候选辨认结果的一种方法包括,在所述手写图形中选择可能的分割点用来分割并辨认所述手写图形。所述方法还包括,将手写图形片断与模板进行比较。所述比较返回候选片断,该候选片断构成了所述手写图形片断的可能的辨认结果。所述方法还包括,形成候选片断序列的表示,所述表示包括对应着分割点的数据块,其中,数据块包括对与随后分割点对应的数据块的所引。所述索引包括候选片断的信息。所述方法还包括,将所述候选片断序列的表示与字典进行比较,找到对应着所述字典中允许的符号序列的候选片断序列,以及将这些允许的符号序列中的至少一个符号序列返回,作为所述手写图形的候选辨认结果。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及到手写图形的辨认,其中该手写图形包含一条或多条曲 线,并表示多个符号。本专利技术特别涉及到确定所述手写图形的候选辨认 结果。专利技术背景今天,手写正在变成越来越普及的输入数据到数据处理单元,特别是到手机和个人数字助理(Personal Digital Assistant, PDAs)中的方法。 为了处理所输入的数据,必须辨认和解释笔迹。大多数辨认笔迹的现有 方法要求将要输入的字符被一个一个地写,并被一个一个地认。这种方 法的一个例子在US 4,731,857中给出,但是最有名的是由Palm, Inc.制造 的Graffiti ,为了加速数据的输入,希望允许使用草书.然而,草书笔迹的辨认 比单独字符的辨认要复杂得多。草书笔迹辨认中复杂性的增加是源于连 起来的字符的分割问题,即源于手写图形中从一个字符到另一个字符的 过渡的识别问题。因此,草书笔迹辨认中的误差可以以两个层次出现, 这使得清晰的顺序辨认系统的构造大大地复杂化了 。辨认草书笔迹的方法通常受到这样的问题的困扰,即在相邻字符之 间有许多可能的分割方法,这构成了手写图形的可能分割的组合方式的 剧增。所以,目前大多数的商用系统使用复杂的统计系统,采用神经网络 和隐马尔可夫模型,同时带有集成的字典。这种系统的例子见P.Neskovic and L.Cooper, "Neural network-based context driven recognition of on-line cursive script (基于神经网络的在线草书手迹的情景导向辨认方 法)",Seventh International Workshop on Frontiers in HandwritingRecognition Proceedings, p. 352-362, September 2000和M.Schenkel and I.Guyon, "On-line cursive script recognition using time delay networks and hidden markov models"(使用延时网络和隐马尔可夫模型的在线草 书手迹的辨认方法),Machine Vision and Applications, Vol. 8, pages 215-223,1995。这些系统的一个主要缺点是,它们非常大而且要求有很大 的训练集。此外,它们高度依赖于所用的字典。通常可以^使用字典通过评估手写图形不同的辨认结果是正确的的可 能性来改善辨认结果。因此,手写图形的辨认结果可以与字典进行比较, 字典中不存在的结果就被去掉。这就提高了将正确的辨认结果呈示给用 户的可能性。在D.Y. Chen, J. Mao and K.M. Mohiuddin, "An efficient algorithm for matching a lexicon with a segmentation graph"(将分割图 与词典进行匹配的有效算法),Proceedings of the Fifth International Conference on Document Analysis' and Recognition, pages 543-546, 1999 的文章中,发表了一种将字典与候选分割进行比较的方法。然而,当字 典的大小增加时,这种方法变得比较慢。另一种方法发表在S. Lucas, "Efficient best-first dictionary search given graph-based input (基于图进 行输入时的有效的最佳优先字典搜索),,,15th International Conference on Pattern Recognition, vol. 1, pages 434-437, 2000。这种方法给出了 一个更 加有效的办法去检索存在于字典中的最佳辨认结果,通过计算路径代数 可以实现这种字典检索,这似乎要求首先建立手写图形的分割.在WO 02/37933中,发表了 一种使用字典进行手写单词辨认的方法。 这种方法产生一个解释图,该图包含顶点和边,顶点表示分割点,边表 示分割点之间的片断的解释。在分割点上执行搜索过程,以便构造所述 图,从而确定单词的辨认。所迷搜索过程这样进行,回顾前面的分割点 来确定是否在图中放置边/片断。因此,在每个顶点处,可以存储若干单 词级的猜测。此外,为了修整猜测名单,可以与字典进行匹配。对于每 个被允许的字符集,搜索过程在每个分割点处需要确定在图中放置一条 对应着字符集的ii/片断是否可行。这要求进行很多计算以便执行搜索过禾呈,因jt匕,该方法较'漫。 本专利技术的总结本专利技术的一个目标是,提供一种用于辨认草书笔迹的改善了的方法。 本专利技术的另 一个目标是,提供一种不需要广泛学习并且不需要很大的处 理能力的方法。本专利技术还有一个目标是,以快捷方式使用字典,用来提高手写笔迹的辨i^。上述目标中至少一些可以由权利要求书中的独立项所述的方法、装 置和计算机程序产品来实现。在从属权利要求中阐明了本专利技术的特定的 实施例。因此,本专利技术提供一种方法,用来确定手写图形的至少一个候选辨 认结果,其中该手写图形包括一条或多条曲线并表示多个符号。所述方 法包括,在所述手写图形中选择可能的分割点,用来分割所述手写图形, 并将所述手写图形的这些片断辨认为符号。所述方法还包括,将所述手 写图形片断与表示至少一个符号或者符号的一部分的模板进行比较,其 中,所述手写图形片断对应着从第一分割点到第二分割点的可能的分割 点序列。所述比较返回与模板相关的候选片断,其构成了所述手写图形 片断的可能的辨认结果,其中每个候选片断与所述模板和所述手写图形 片断之间的匹配的度量相关。所述方法还包括,形成候选片断序列的表 示。所a示包括对应着所述手写图形中的分割点的数据块,其中,数 据块包括对与随后分割点相对应的数据块的索引,所述索引包括候选片 断的信息以及所述分割点之间的手写图形片断的相关度量。所述方法还 包括,将所述候选片断序列的表示与字典进行比较,其中,所述字典被 表示为符号序列,序列中的符号保持有对允许的随后的符号的索引。所 述方法还包括,找到对应着所述字'典中允许的符号序列的候选片断序列, 以及将这些允许的符号序列中的至少一个符号序列返回,作为所述手写 图形的候选辨认结果。本专利技术也提供一种用于确定手写图形的至少 一个候选辨认结果的装置,其中该手写图形包括一条或多条曲线并表示多个符号,所述装置包括在所述手写图形中选择可能的分割点,以用来分割所述手写图形, 并将所述手写图形的这些片断辨认为符号的部件;将所述手写图形片断 与表示至少一个符号或者符号的一部分的模板进行比较的部件,其中, 所述手写图形片断对应着从第 一可能分割点到第二可能分割点的 一个分 割点序列,所述比较返回与模板相关的候选片断,该候选片断构成了所 述手写图形片断的可能的辨认结果,每个候选片断与所述模板和所述手 写图形片断之间的匹配的度量相关;形成候选片断序列的表示的部件, 所述表示包括对应着所述手写图形中的分割点的数据块,其中,数据块 保持对随后的分割点的索引,所述索引持有本文档来自技高网...

【技术保护点】
一种方法,用来确定手写图形的至少一个候选辨认结果,其中该手写图形包括一条或多条曲线并表示多个符号,所述方法包括:    在所述手写图形中选择可能的分割点,用来分割所述手写图形并将所述手写图形的这些被分割片断辨认为符号,    将所述手写图形的片断与表示符号或者符号的一部分的模板进行比较,其中,所述手写图形的片断对应着从第一分割点到第二分割点的可能的分割点序列,所述比较得到与模板相关的候选片断,该候选片断构成了对所述手写图形的所述片断的可能的辨认结果,每个候选片断与所述模板和所述手写图形的所述片断之间的匹配的度量相关,    形成候选片断序列的表示,所述表示包括对应着所述手写图形中的分割点的数据块,其中,数据块包括对与随后分割点相对应的数据块的索引,所述索引包括候选片断的信息以及所述分割点之间的所述手写图形的片断的相关的度量,    将所述候选片断序列的表示与字典进行比较,所述字典被表示为符号序列,其中,序列中的符号保持对被允许的随后的符号的索引,    找到对应着所述字典中被允许的符号序列的候选片断序列,以及    将这些被允许的符号序列中的至少一个返回,作为所述手写图形的候选辨认结果...

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J施特恩比
申请(专利权)人:ZI德库玛股份公司
类型:发明
国别省市:SE[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利