一种手写字识别方法技术

技术编号:6100373 阅读:314 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种手写字识别方法,该方法包括步骤1、将原字符按设定度数连续多次旋转,得到多个旋转角度的样本字符,分别计算各样本字符的偏转度;步骤2、依据样本字符的偏转度,计算原字符在各旋转角度的偏转倾向度;步骤3、依据偏转倾向度,计算原字符旋转校正角度的初值和微调值;步骤4、依据旋转校正角度的初值和微调值,对原字符进行坐标变换,校正原字符,进行识别。本发明专利技术纠错效果精确,稳定性更好,并且适用范围更广,可支持360范围内的任意角度变换。

【技术实现步骤摘要】

本专利技术涉及信息录入领域,特别涉及一种支持旋转字识别的手写字识别方法
技术介绍
作为一种简单方便而又高效的输入方式,手写识别改变了传统的基于复杂编码或 拼音输入的键盘模式,为自然人性的人机交互提供了便利条件。近年来,随着模式识别技术 的发展,自然快捷的手写输入在日渐普及的嵌入式设备上越发凸显其重要性。孤立字识别, 也就是用单字识别技术处理用户逐个输入的单字符,因核心技术的成熟和识别性能的优越 而成为市场上最为主流的产品。目前大多数的联机汉字手写识别系统都支持书写框输入, 要求用户在预设的书写区域内书写。虽然书写框的设定确保了较高水平的识别率,但其对 用户书写设置了额外的限制。特别是在目前日益流行的指触触摸屏上,由于手指输入时活 动范围较大,在较小书写框内输入的书写模式不够方便。全屏输入模式,是支持用户在触摸屏的任意位置自由书写的方式,因其更为自然 人性的特性吸引了越来越多的关注。在全屏输入模式下,用户的输入更加自由,因而输入的 字符也具有更大的随机性和变化。其中最主要的变形是字符倾斜,也就是说字符的书写角 度和屏幕方向存在有明显偏差,其对应的偏差角度称之为该字的旋转角度。图1展示了汉字“大”的偏转样例,该字符的纵轴主方向和触摸屏的方向存在一定 的偏差。如果将这种具有一定倾斜角度的字符直接输入到在正常样本上训练得到的常规识 别器中必然导致识别率的下降,特别是当汉字倾斜角大于30度时几乎无法识别。汉字中横竖笔画约占所有笔画的四分之三,是字符的主要组成成分。在汉字这种 结构性很强的字符中,书写一般都讲究横平竖直同时横竖方向的夹角也有一定的规律。而 同一字符内不同横竖笔画的方向也具有一致性,聚类后通常分散在类中心周边。目前,手写 识别领域对孤立字符的角度矫正方法正是基于对横竖笔画的这两点特性分析。现以支持(_25,25)范围内的倾斜字角度为例说明,具体分析流程如图2所示。步骤S201、采集书写笔迹;在联机手写识别系统中,用户笔迹通常用一序列的二 维或三维点坐标表示,用以描述字符书写的空间和时间信息。步骤S202、利用各种降噪手段,如野点去除,平滑处理等方式减少字符可能的变 形。步骤S203、提取书写笔迹上拐点,并将原始连续采样点序列量化为笔段序列。步骤S204、计算各笔画的书写方向假设某一笔画的起始点和终点分别SP1 =(X1, Y1),P2 = (X2,,则该笔画的书写方向为权=I =⑷t,in I^ZIL2 —』\ ι ο步骤S205、对笔画方向聚类,将方向相近的笔段聚在一起。考虑到汉字结构较为复 杂,不同汉字间笔划变化很大,笔段方向的聚类中心数很难确定。算法采用了基于均值距离 的分级聚类方法,其中距离度量定义为笔段方向的夹角。步骤S206、根据聚类结果确定横笔和竖笔的方向(这里假设右水平方向为0度且逆时针为正)。判断横笔可能方向在限制横笔可能的书写方向在(-30°,45° )的假设下,结合 聚类结果得到若干方向聚类中心作为可能的横笔方向;根据横竖方向之间的夹角限制来寻 找竖笔的方向系统假设横竖笔画夹角在(85,11 范围内,由已得的若干横笔方向,选择 满足条件的竖笔方向;再进一步确认最佳的横笔方向。步骤S207、用所得到的横竖最佳方向值判定字符的倾斜程度,对字符进行矫正。简 单说,在确定了横笔和竖笔方向之后,以0和-90度为横竖的标准方向,分别对字符在水平 和垂直两个方向上校正。该算法通过对字符横竖主方向的分析求取字符可能的倾斜角度,在工整字以及横 竖笔划较多的字符取得的了较好的矫正效果。然而由于单个字符的横竖方向较易受到各种 噪音干扰,因而在缺少横竖笔划的字符或者存在较多撇捺笔划干扰的字符上效果依然不尽 人意。同时为了实现的方便和有效性,该算法只能对有限范围内的倾斜字符修正,如(-25, 25)角度内倾斜,而对其它倾斜严重的字符地纠正则超出该算法的矫正范围。
技术实现思路
本专利技术的目的提供,该方法纠错效果精确,稳定性更好,并且 适用范围更广,可支持360范围内的任意角度变换。本专利技术,该方法包括步骤1、将原字符按设定度数连续多次旋转,得到多个旋转角度的样本字符,分别 计算各样本字符的偏转度;步骤2、依据样本字符的偏转度,计算原字符在各旋转角度的偏转倾向度;步骤3、依据偏转倾向度,计算原字符旋转校正角度的初值和微调值;步骤4、依据旋转校正角度的初值和微调值,对原字符进行坐标变换,校正原字符, 进行识别。优选的,步骤1之前,还包括对输入字符提取笔段序列,计算笔段序列中笔段总 长度,确认笔段总长度大于0。优选的,计算笔段序列中笔段总长度具体为计算字符采样点的张角,若采样点张 角小于设置的阈值,则确认该采样点为拐点,两个拐点之间构成一笔段;分别计算各笔段的 长度,将各笔段长度相加得到笔段总长度。优选的,将原字符按设定度数连续多次旋转具体为将原字符按每次旋转45度, 顺序旋转8次。优选的,计算各样本字符的偏转度具体为计算样本字符各笔段在预设8个基准 方向上的分解值;依据该分解值,分别计算各笔段的方向贡献值、长度贡献值和位置贡献 值;综合各笔段的方向贡献值、长度贡献值和位置贡献值,计算样本字符的偏转度。优选的,在计算样本字符各笔段的分解值之前,还包括确定样本字符的字框,该 字框为包含样本字符的最小矩形水平框。优选的,计算原字符各笔段在预设的8个基准方向上的分解值具体为将笔段映 射到8个基准方向中与该笔段最接近的两个基准方向上,分别计算该笔段在上述两个坐标 轴的分解值,将其他6个坐标轴的分解值设为0。优选的,计算位置贡献值时,当笔段为笔划非起始笔段时,位置贡献值减半。优选的,步骤3具体为如相邻旋转角度的字符偏转倾向度具有不同正、负值,且 按顺时针方向从正到负变换,则选择对应正值的偏转倾向度为校正角度的初值,依据对应 负值的偏转倾向度计算微调步长。优选的,对原字符进行坐标变换具体为依据当前迭代次数计算当次校正角度,进 行坐标变换;判断当前迭代次数是否小于预先设置的迭代次数,如果,且当前校正角度不等 于0,则迭代次数加1,返回步骤1 ;否则,结束原字符校正。与现有技术相比,本专利技术具有以下优点本专利技术利用字符在顺逆时针方向上的旋转对称性,提出纠正偏转字符的方法。该 方法的纠错效果精确,稳定性更好,并且适用范围更广,可支持360范围内的任意角度变 换。附图说明图1为一偏 转样例图;图2为现有的倾斜字分析流程图;图3为本专利技术手写字识别方法流程图;图4为样本字符计算流程图;图5为字框示意图;图6为笔段在8个基准方向的分解图;图7为字符偏转倾向度分布图。具体实施例方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本专利技术作进一步详细的说明。本专利技术提出了一种基于字符旋转平衡的旋转校正识别方法。假设将字符分别沿逆 时针方向和顺时针方向旋转同样的角度,得到两个旋转样本。这两个旋转样本相对于初始 正写的原字符在笔段方向、长度和笔段起始点、结束点,在整个字框中的相对位置上表现出 一定的差异,该差异称为偏转度。偏转度反映了当前字符笔迹与字符旋转角度为0时写法 之间的偏差。按照正常角度书写,原字符的旋转角度为0,其顺时针和逆时针旋转后样本字符的 偏转度基本保持一致,偏转对称性最好;反之,如原字符具有本文档来自技高网
...

【技术保护点】
1.一种手写字识别方法,其特征在于,该方法包括步骤1、将原字符按设定度数连续多次旋转,得到多个旋转角度的样本字符,分别计算各样本字符的偏转度;步骤2、依据样本字符的偏转度,计算原字符在各旋转角度的偏转倾向度;步骤3、依据偏转倾向度,计算原字符旋转校正角度的初值和微调值;步骤4、依据旋转校正角度的初值和微调值,对原字符进行坐标变换,校正原字符,进行识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:何婷婷翟吉博竺博葛勇刘庆峰胡郁胡国平
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1