手写体识别中基线,行距和字高的估算制造技术

技术编号:2936765 阅读:276 留言:0更新日期:2012-04-11 18:40
通过把数字化仪检测到的手写体的笛卡尔座标加以规格化,使之和原型字符空间相符合,一种手写体识别系统中的行距基线调整器能改善识别准确度。规格化技术包括加权平均估算法,原型提取估算法,极值点聚类估算法以及原型提取估算法和极值点聚类估算法的结合。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及信号处理的领域,特别涉及到手写体识别。本专利技术专门用于改善识别准确度,其方法是将手写字符的笛卡尔座标规格化,使之和字符原型座标空间相符合。在书写识别系统中,通常把手写体区域标上线条,以引导用户为书写定位。用户书写的手迹由数字化仪检测并传送到模式匹配器,后者把手写体和代表书写单元(字符)的模式进行匹配,而此原型模式可由系统识别。此匹配过程中的一步是必须把数字化仪检测到的手写体的笛卡尔座标加以规格化,使之和原型座标空间相符合。为了获得高的识别准确度,座标的规格化是一个重要因素。在获得正确规格化的过程中所用信息包括一些测量值,诸如行距和基线位置。由于不同用户的书写风格不同,而且就是用一用户的书写风格也有变化,所以这些测量值和系统所提供的书写区域的线条的值会相差很多。由于规格化对模式匹配算法的成功至关重要,因此要求手写体识别系统提供一种准确的在线估算行距和基线位置数值的方法,以便得到高的识别准确率。有不少专利和文献涉及到手写体识别,它们各有一定值优缺点。Herbst等人的美国专利4,024,500中公开了一种方法和装置,用于在手写体分析系统中完成字符分段,包括形成所述手写体的书写工具的连续的x、y座标值和x、y速度值的获取,包括对和手写字符的所有x和y极值点有关的x位移值的连续平均值,在这些x和y极值点处x或y速度值等于零,包括连续检查每个x极值的x位移值并确定所述极值的x位移值是否超过了预定的阈值,该阈值是相对于当前字符的x位移平均值而言,如果是超过了,则说明以下两点所述新极值点位于下一字符内,应在刚才研究过的极值点和以前研究过的极值点间的连线上预定的距离处打上分段标记。分段的结果然后送给字符识别装置,所述分段标记会大大提高字符识别装置的效率和准确度。根据设计,在书写过程中系统也能跟踪基线和中位线的偏差。Kochert等人在美国专利4,845,768中公开了一种用于字符识别的编辑装置,该装置在一个X/Y可寻址地图象信号存储器中存储了一个用二进制编码的字符。信号首先从所述存储器中逐列读出,接着分别把所述信号中包含黑点的各连续列投影在字符基线上,该投影即为所述字符的第一个字符影。然后,根据在相对于Y轴的正的和/或负的斜角进行扫描,重复地读出存储的字符模式,直至产生一个最小的字符影象。得到这个最小字符影象的被扫描模式即被选用,以便进一步估算所述字符。Sklarew在美国专利4,972,496中公开了一个不用键盘输入的计算机系统,该系统包括一个透明输入屏和显示屏。该透明输入屏当指示笔接触时即产生位置信息,该显示屏装于所述输入屏的下面,以使所显示字符能在输入屏下面看见。系统包括一台计算机,该计算机的程序可把位置信息编译成笔划,可计算笔划特性,然后把该特性和数据库中存储的笔划特性相比较,以便识认指示笔所书写符号。该系统的关键性能是1)透明的位置检测子系统;2)放在下面的显示装置,用于模仿所检测到的位置的图案和用于显示字符或符号;3)用于把检测到的位置首先转换到画出的点,然后转换到识别的字符或符号的装置;和4)能“学会”把检测到的输入位置和某字符或符号连系起来的装置。J.Kim在IBM技术公报的1983年3月的25卷10期的5111-5114页的名为“手写试验中基线漂移的校正”的文章中把一个字分成几个较小的单元。每个单元是一个等宽的框子,其高度足以包容该宽度内的所有点。这些框子在该字上面均匀分布。因此可以分析框子的相对位置和检测它们如何上升或下降。这些框子的dy/dx的平均值就是漂移值,可用于校正。根据本专利技术,用于手写体识别的基线,行距和字信息可通过对以前识别过的字的特征提取以及应用笔划的Y座标极值点聚类的启发式信息来进行估算,从而改善手写体的识别准确度。本专利技术的目的是提供手写体识别系统中一个改善的行距和基线调整器。本专利技术另一个目的是应用加权平均估算法为手写体识别系统提供一个改善的行距和基线调整器。本专利技术又一个目的是应用原型提取估算法为手写体识别系统提供一个改善的行距和基线调整器。本专利技术再一个目的是应用端点群集估算法为手写体识别系统提供一个改善的行距和基线调整器。本专利技术还有一个目的是把原型提取估算法和极值点聚类估算法结合起来,加以应用,提供手写体识别系统中一个改善的行距和基线调整器。手写体识别系统中的行距基线调整器改善识别准确度的方法是把由数字化仪检测到的手写体的迪卡尔座标规格化,并使之和原型字符空间相重合。规格化技术包括加权平均估算法,原型提取估算法,极值点聚类估算法以及原型提取估算法和极值点聚类估算法的结合。附图说明图1是根据本专利技术设计和操作的手写体识别系统的简化框图;图2显示了手写体识别系统内的基线,行距和字高;图3显示了手写体识别系统内的漂移的手迹;图4显示了手写体识别系统内的省缺估算法;图5显示了基于一个线段的最大和最小Y座标值的估算结果;图6显示了加权平均估算结果;图7显示了原型提取估算结果;图8显示了笔划的Y轴座标极值点的自然聚合类;图9是一个提供加权平均估算法的系统的框图;图10是一个提供原型提取估算法的系统的框图;图11是一个提供极值点聚类估算法的系统的框图;和图12是把原型提取估算法和极值点聚类估算法结合起来的系统的框图。图1显示了一个根据本专利技术设计和操作的在线手写字符识别系统10。例如,系统10可以是一个带有PenPoint操作系统的IBM Think Pad计算机700-T。系统的操作在用户手册(IBM部件号41G3122)中有说明。ThinkPad是IBM公司的注册商标,而PenPoint是GO公司的注册商标。系统10包括一个手写体转换器,该转换器由一个集成电子输入面板和一个带有书写工具(如指示笔14)的显示装置12组成。对手写字符作出响应,该转换器输出一串(x,y)座标对,后者对应于指示笔14在输入面板12的座标系中的相对位置。这些座标对送到一个笔划分段器16,后者用于鉴别离散的手写笔划的起点和终点。笔划送到行距(LS)基线(BL)调整器17,该调整器估算每个字符的LS和BL以提供规格化字符,从而获得更大的字符识别准确度。如何做到这一点将接着在后面详细介绍。规格化的笔划送至字符匹配器18。字符匹配器18和一个预定的字符原存储器20相耦合,把输入笔划的各点和存储的字符原型的各点相比较,以便在一定概率下鉴别输入的笔划或一组笔划是否代表一个特定的字符。被识别的字符由匹配器18经过信号线19送至输入面板和显示装置12,以便显示该字符。该字符也可能用于例如显示装置那样的实用装置21或是类似字处理程序那种的应用程序。实用装置21可能向行距基线调整器17提供LS和BL的省缺值,以改善识别准确度。在有些系统内字符分段器16和字符匹配器18的功能可能会在一个手写笔划处理单元内统一起来。可以由系统10的一个用户管理一个培训周期,并向存储器20提供字符原型。字符原型可由一个特定的系统用户输入,而以后当该特定用户手写输入字符时即可使用该字符原型。还有,也可以产生一套全局或通用的字符,以供多个用户使用。在这方面,可以设计一套启动原型,供任一位首次使用系统10的书写者用作初始原型。如果该书写者愿意的话,他/她可以按自己的书写风格增加字符原型,从而得到一套适合该书写者的原型,这也称之为一套个本文档来自技高网...

【技术保护点】
在手写体识别系统中一种调整行距和底线的方法,其中底线是供用户在上面书写不带下垂笔划的字符的自然线条,而行距是从底线往上的最大正距离,一个字符的所有各点部包括在该距离内,所述方法的特征包括以下各步:对于每一个书写在输入面板上的字符采样一串(X,Y)座标对,这些座标对对应于指示笔在所述输入面板座标系统中的相对位置;对于书写在所述输入面板上的每个字符,计算该字符采样值的Y点最小值和最大值;对一个字符按下式计算行距值(LS):***其中:LS↓[old]是LS以前的计算值;W↓[old]和W↓[cur]是系统常数按下式计算字符的基线值(BL):***其中:BL↓[old]是BL以前的计算值。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:威克尔S布鲁夫乔恩基金唐纳德B马特森威廉D莫德林
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1