手写输入笔划分段的方法技术

技术编号:2936646 阅读:366 留言:0更新日期:2012-04-11 18:40
本发明专利技术的识别笔划分段的方法包括在接收到的手写字输入的每个点处(110)计算弯曲度的导数(140)或弯曲度瞬时变化率的步骤。选择输入中位于弯曲度导数高的点与弯曲度导数低的随后的点之间中点上的某些点子(像素)作为笔划边界点(150)。这样的边界点不受弯曲度绝对值的影响,而只受弯曲度相对变化的影响。笔划分段边界点提供给一个以笔划为基础的识别器,用于解释手写输入的笔划(170)。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及手写识别,具体涉及。对于人手写体的机器识别是很难的,最近随着笔基(pen—based)计算装置的迅速发展,这种识别业已成为一个重要问题而被提出来。对此,现已存在许多截然不同的解决方案,而其中的一种有用的方案是将手写体划分成一序列基本的动程或“笔划”,并用这些笔划(将它们按照某种方式参数化)作为字符识别器的输入。以笔划为基础的识别器的一个关键要求是同一字符类别的多种情况(例如不同次数和不同的书写者所写的字母“A”)每次都应被划分在一个相似的笔划组内。这有助于确保识别不太因难,因为该字符多种情况的描述对于字符识别器本身“看来”是相似的缘故。在理想情况下,一个给定字符的所有书写情况总是含有相同数目的笔划,这些笔划全都位于相同的相对位置上,并且这些笔划的特征描述对于各种情况全都很相似。虽然这种理想情况在实践中不能实现,但在一定程度上可以接近它,从而能改进识别的准确度。在先有技术中有一种识别技术是把笔划边界设定在垂直(或“y”)方向上笔尖速度为零的一些点上,也就是,在这些点上书写开始向上移动或者开始向下移动。这样所形成的笔划组可称为“向上的笔划”和“向下的笔划”。这种方法在Mermelstein & Eden,Information And Control Vol.7,PP.255—270,1964发表的文章“Experiments on Computer Recognition of ConnectedHandwritten Words”中讨论了。这种方法的一个问题是,在垂直方向上对笔划变化过分敏感,而在水平方向上对笔划变化根本不敏感。然而,许多字符是由一些水平线条组成的,例如,字母“t”中的一横和字母“E”的三横,即使草率的写,它们在正常情况下也是多为水平的而不是垂直的。y速度型笔划分段器因书写中在垂直方向上笔尖的抖动有时会使一个水平横断开成为一划,经常它被断成两段、三段甚至更多段。这导致差的识别准确性,因为同一字符的多种字体情况往往被分段成为看起来各不相同的笔划组。对于纠正这种方法的不准确性所做的努力包括在产生一个新笔划之前要求最小的垂直方向变化,这只取得了有限的成功,许多同样的基本问题依然存在。在另一种已有的技术中,这个问题是,通过在这样一些点上设定笔划边界而解决的,即在这样的点上出现局部最大弯曲,并超过某个对应于该书写体强列弯曲的阈值。因强列弯曲可能发生与笔尖的移动方向无关,故这种方法对手写输入例如语句或字符的各部分的取向不敏感。然而,以弯曲为基础的技术也有它自身的问题。例如,假定某人书写字母“L”时带有一个很渐变的弯曲,而不是强列的弯曲,以使它开始看起来它更象字母“C”。在这种情况下,如果笔划边界所需的弯曲度阈值不能满足,则这种方法不能分段。简单地降低阈值并不能解决这个问题,因为这会单纯地导致过多的笔划数目。具有过多的附加笔划与具有过少的笔划都不好,因为这又意味着同一字符的多种笔体时常被分段成不同的笔划类型。据此,现在需要一种更准确的、无上述的方法诸如y速度法和现有的弯曲度方法中存在的问题的笔划分段技术。为此,本专利技术提供一种将手写输入分段成为多个笔划的方法,对于每个具体字符类别的多种笔体,都能分段出一致的笔划数目。本专利技术提供一种将手写字输入分段成为多个笔划的方法,对于输入的每个具体字符类别的多种笔体分段笔划具有类似的形状和位置。总的说来,本专利技术的方法包括计算手写输入中各点上的弯曲度的导数或瞬时变化率的步骤。然后,该方法选择手写输入中的某些点(或像素)作为笔划边界点,它们位于一个高的弯曲度导数点与后继的一个低的弯曲度导数点之间。这样的边界点并不受绝对弯曲度值的影响,而是只受弯曲度相对变化的影响。附图说明图1示出按照本专利技术的一个优选实施例的用以识别笔划界限的操作的流程图;图2示出用先有技术的y速度方法产生的手写输入分段成为多个笔划的例子;图3示出用先有技术中弯曲度方法产生的手写输入分段成为多个笔划的例子;图4示出用本专利技术的优选实施例产生的手写输入分段成为多个笔划的例子;图5示出建立从数字化装置接收的字母“L”的点;图6示出按照本专利技术的优选实施例再取样后按照恒定距离建立字母“L”的点;图7示出本专利技术的优选实施例的弯曲度计算的分解图;图8示出对于图7各点计算得到的弯曲度值的曲线图9示出对于图7各点计算得到的弯曲度导数值的曲线图。手写字符输入通常是从用户以离散的连续段的形式收集的。一个离散的连续段是由一个或多个笔划组成的,其中,一个笔划是笔与一个数字化图形输入卡或纸之类的输入装置接触期间所留下的印迹。在本专利技术中,一个或多个离散的连续段是被识别的手写输入的多个单元。手写输入是电学捕获的输入,它包括但不限于以下输入手写输入;电子输入;压力捕获的输入,例如压印的输入;电子方法例如用传真机、寻呼机或其它装置接收的输入。一个笔划可以表示成为由输入装置以大致有规律的间隔取样的一序列的点。每个点至少可用x和y座标来描述。笔划可以利用一个数字化图形输入卡用电学方法来捕获,或在图像中线条的检测过程中从扫描的或传真的图像来得到;这样电学捕获的方法在本
内是公知的。在一个优选方法中,手写输入由一个诸如个人数字助理(PDA)装置或其它装置之类的装置来接收。具有接收手写输入功能的其它装置包括但不限于以下装置计算机、调制解调器、寻呼机、电话机、数字式电视机、交互式电视机、带有数字化图形输入卡的装置、传真装置、扫描装置、以及具有捕获手写输入能力的其它装置。通常,当笔划用电学方法捕获时,每个点以一个像素来表示,以使一个笔划可由该装置上的一系列像素来表示。按照本专利技术,手写输入可以是字母的字符形式、表意字符或手写通信中字符或符号的其它形式。参看附图,图2和图3示出当笔划分段通过一个以笔划为基础的识别器时,在对输入的理解中字母数字手写输入的笔划分段具有高或然率的不准确性。图4示出对于图2和图3的相同的字母数字输入的笔划分段,笔划分段是按照本专利技术的教导进行图中的这样的笔划分段通过一个以笔划为基础的识别器时具有高或然率的准确性的。参看图1,图中示出按照本专利技术教导的一种优选方法的流程图。从数字化装置或其它装置来的手写输入以x和y座标的形式(连同有关的笔尖上移或笔尖下移状态)在步骤110被接收。这些点通常由像素来表示。总的来说,本专利技术的方法在步骤120对手写输入再取样,以得到沿着手写输入长度以等间距离开的点。图5示出字母“L”500作为再取样之前,一系列点或像素的例子。图6示出同一字母“L”600在再取样之后的一系列点或像素。再取样是应用点子间距d610实现的,d值在整个手写输入是恒定的。d值最好选择得使手写输入的中间输入高度约为15至30倍d值。例如,图6所示的d值选择得可使字母的中间高度大约在15至30倍d值的范围内。图1的优选实施例在步骤130计算每个再取样点处的弯曲度。图7示出在点R(710)处弯曲度计算的数据描绘。在再取样点R(710)的弯曲度定义为的距离,从该R点的前一点(R-1,750)经R本身线性投影而得到一点P(720)到R点的后一点(点R+1,730)的间距。这个距离如图7中所示的间距740。在手写输入端点处的弯曲度定义为等于对应的最近相邻点处的弯曲度。手写输入的内部点处的弯曲度本文档来自技高网
...

【技术保护点】
一种用以识别含有多个墨迹像素的手写字符的方法,其特征在于包括以下步骤:对多个墨迹像素之每个像素计算弯曲度导数值,每个弯曲度导数值表示相应像素处的绝对弯曲度的变化率;选择一组笔划边界,以使每个笔划边界处在一个具有高弯曲度导数值的墨迹像 素与一个随后的具有低弯曲度导数值的墨迹像素之间;寻找一组笔划的位置,以使每个笔划边界位于一个笔划的末端;计算每个笔划的至少一种笔划特征值,以产生出一个字符特征集;应用该字符特征集来判定对所述手写字符的识别。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:克里斯A科尔奇
申请(专利权)人:摩托罗拉公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1