以直线段为主的手写体字符的预处理方法和微处理器技术

技术编号:2936283 阅读:195 留言:0更新日期:2012-04-11 18:40
一种方法,包括下列步骤: 将从手写体输入采集的样点送入手写体识别器中,其中在点之间形成矢量; 为每一个点确定连接于该点的两个矢量的角度变化值; 将每个点的角度变化值同预定阈值比较,如果每个点的角度变化值大于预定阈值,就识别该点为潜在分割点; 消除伪分割点,伪分割点是指角度变化值大于阈值的潜在分割点,但其与另一个角度变化值大于阈值的潜在分割点的距离小于预定的距离; 在每个点的潜在分割点之间确定一系列直线段笔画。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及手写体识别,尤其涉及手写体输入的直线段笔画的识别方法。人类手写体的机器识别是一项非常困难的问题,而且近年来随着基于笔式计算机设备的剧增,它成为待解决的重要研究问题。对于这个问题的解决已有许多不同的方法,但一种有效的方法是将手写体划分为一序列的基本移动或“笔画”,并使用这种笔画(用某些方法参数化)输入到基于笔画的字符识别器中。在基于笔画的识别器中的一项关键要求是同一字符类的多个实例(如不同时候和不同书写者所写的字母“A”)应该每次都被划分到相似的笔画集中,这将有助于确保识别不会太难,因为字符实例的描述将“看起来”象字符识别器中的描述。在理想情况下,一个给定字符的所有实例应该总是包含着同样的笔画数,这些笔画都应该在同样的相关位置,并且它们的特征描述在所有的实例中都应非常相似。这种理想情况在实际中是不可达到的,但在某中程度上是可以接近的,识别精度也可以提高。在现有技术中,笔画边界设置在笔的移动速度在垂直(或“Y”)方向为零的点处,即在书写开始向上移动、或向下移动的点处。于是笔画的结果集被称为“向上笔画”和“向下笔画”。这种方法在Mermelstein & Eden,“手写体连写词的计算机识别实验”,信息和控制第7卷255-270页,1964中有所讨论。此方法存在的一个问题是对垂直方向的变化完全敏感,而对水平方向的变化一点也不敏感。然而许多字符是由水平段组成的例如在字母“t”的交叉和字母“E”的三叉处,水平段比垂直段多,即使在斜体书写时也是如此。一个基于Y速度的笔画分段方法应该将一个水平段划分为一画,但仅仅因为在垂直方向的微小跳动,水平段经常被划分为二画,三画,甚至更多画,这就导致了较低的识别精度,因为同一字符的多个实例将经常被划分为看起来不同的笔画集。修正这种方法不精确性的尝试虽然取得了一些成功,包括在创建一个新笔画之前设定一个最小的垂直方向变化量,但是许多同样的基本问题仍未解决。相应地,笔画划分技术要求更精确一些,并且它不受在以上讨论方法中问题的影响,象Y-速度(Y-velocity)法。附图说明图1是根据本专利技术的实施方案的识别笔画边界操作的流程图。图2展示了根据本专利技术的一个实施方案在图1中110步之后,产生的手写体输入分割点。图3展示了根据本专利技术的一个实施方案在图1中112步之后产生的手写体输入分割点。图4展示了一序列表示图2中手写体输入的直线段(笔画)。图5展示了确定一序列表示手写体输入的直线段(笔画),其中要抬起输入笔(阴影线)。图6是在确定角度过程中说明角度变化的分解图。图7图示性地展示了为图6中每点计算的角度变化值。图8是根据本专利技术用于识别直线段为主的手写体字符的手写识别微处理器/设备的框图。一般来说,手写体字符输入是从用户那里以独立连续段的形式收集的。一个独立连续段由一个或多个笔段组成,一个笔段是指在笔与输入设备象数字输入板或纸接触期间由笔留下的标志。在本专利技术中,一个或多个独立连续段是被划分为笔画的手写体输入的基本单元。一个笔画是实际手写体输入的直线段近似,手写体输入是电子捕捉方式的输入,它包括但不局限于以下方式手写体输入;电子化输入;压力捕捉方式输入;象印模(stamped)输入;电子接受方式输入,象传真;寻呼机,或其它设备。一个段可表示为一序列的点,这些点通过输入设备以几乎规则的间隔取样,每个点至少需一个X坐标,一个Y坐标和一个笔状态来描述。笔状态表示笔是否与输入板接触,而且只能取两个值中的一个值(抬笔和落笔)。段可通过使用数字化输入板来获得或者通过对图象进行线监测处理从扫描图象或传真图象中获得。象这种电子获取方法在技术上是可以理解的。在本专利技术的优选方法中,某些设备,象个人数字辅助器(PDA)或其它设备可以接收手写体输入。具有接收手写体输入功能的其它设备包括但不局限于下列各设备计算机,调制解调器,寻呼机,电话,数字化电视,交互式电视,具有数字化输入板的设备,传真设备,扫描设备及其它可以获得手写体输入的设备。一般来说,当手写体输入被电子捕捉后,每个点可表示为一个象素点,因此,一个段就可表示为设备上一系列象素点。根据本专利技术,手写体输入的字符可以是字母,表意字符或者用于书面联系的其它形式字符或符号。在本技术中,笔画边界设在角度变化值局部极大值处,且该值超过了预定的、反映书写中形状弯曲程度的阈值。由于形状弯曲总会发生,而不考虑笔的移动方向,因此这种方法就会导致对手写体输入的不同部分,如单词或字符不灵敏。参照图1,图1展示了本专利技术方法的流程图。来自数字化装置或其它装置的手写体输入以X,Y坐标和抬笔,落笔状态(102)的形式被接收。一般来说,这些点以象素点表示。被选择的这些象素点的X,Y输入坐标需经过比例变换(104),以便变换后的坐标值在预先规定的限度内,经过比例变换的X,Y坐标还要经过平滑处理以消除由数字化输入装置引起的高频躁声。平滑处理是通过计算某一点及其相邻的点的坐标(X,Y)的平均值而得到的,(将该点与离它最近的较高的点加权),并用该平均值代替该点的(X,Y)坐标值。理想情况下,平滑处理的窗口大小是固定不变的。如果相互分离的落笔状态的两条线段交叉时,就不进行平滑处理。连结前面的点到当前点就形成了第一个矢量,连结当前点到当下一个点就形成了第二个矢量。第一个矢量与第二个矢量之间的夹角就确定下来(108),其为当前点的角度变化值(见图6)。位于角度变化值极大值处且超过了预定的阈值(110)(见图7)的潜在分割点被认为是落笔点。可通过选择阈值来使真分割点尽可能多,使伪分割点尽可能少(如由颤动产生的分割点),这样就消除了伪分割点(112),例如钩,也就是,先消除在落笔段首/尾处的小距离笔移动,并且当第一个分割点处的角度变化值小于第二个分割点处的角度变化值且该点位于离第一个分割点的预定的范围内,就删除第一个分割点,这样从有用的分割点内就可确定一序列直线段笔画(114)。当两个分割点之间是抬笔状态时,也在它们之间引入一条直线段。每个直线段笔画一般用四个参数描述直线段中点的X坐标,直线段中点的Y坐标,直线段的长度及它相对于预定参考系的角度。参见图2和图3,图2展示了图1中110步之后,由本专利技术的实施方案产生的手写体输入分割点。这些分割点来自于局部角度变化值极大值处且该值超过了预定阈值,还来自落笔段的首尾处。因此在图2中就确定了段(201,202,204,206,208,210,212,214,216,218)。每条线段的边界由两个分割点来确定。图3展示了图1中112步之后,由本专利技术的实施方案产生的手写体输入分割点(302)。注意,图1中的分割点220在图3中消除了。即线段201表示一个“钩”,即人为现象(artifact),就消除分割点220。决定分割点220是伪分割点的规则是该点到分割点222的距离小于预定的距离,分割点222同分割点220相比有较大的角度变化值。图4展示了图2中手写体输入的一连串直线段笔画(402),图3中的任意两个连续分割点之间的点的序列用图4中的直线来代替。有时笔需要从输入设备上抬起(抬笔段)并在一个新位置放下以继续进行手写输入,在图5中展示了这个例子。虚线(502)表示笔在该处笔抬起的线段。在预处理末期,抬笔笔画与落笔笔画是不可本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:凯恩南·帕塞萨尔泰约翰L·C·西博尔德
申请(专利权)人:摩托罗拉公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1