一种字符书写规范度评测的方法和装置制造方法及图纸

技术编号:7759629 阅读:180 留言:0更新日期:2012-09-14 02:14
本发明专利技术涉及模式识别领域,特别是一种字符书写规范度评测的方法和装置,所述方法包括:提取书写字符的笔画轨迹的原始特征矢量;将提取的所述原始特征矢量与第一字符集中的字符模板进行匹配,获取第一置信度;当判断所述第一置信度不满足预设评测条件时,执行二次匹配处理,获取第二特征矢量,将所述第二特征矢量与第二字符集中的字符模板进行匹配,获取第二置信度;根据所述第二置信度对所述书写字符进行评价。本发明专利技术实施例提供的方法有效解决了现有技术对混淆字符评价不准确的问题,提高了书写规范度评估的合理性、准确性。

【技术实现步骤摘要】

本专利技术涉及模式识别领域,特别是涉及ー种字符书写规范度评测的方法和装置
技术介绍
随着信息交互的发展,计算机辅助教学得到了广泛的应用。例如,在汉语教学方面,计算机辅助教学提供了汉字演化、拼音示范、汉字书写动态演示等应用,然而,在对用户汉字书写规范度评估方面却较少涉及。ー个书写规范的汉字通常要求笔画标准、笔顺符合规范,同时字符整体结构紧凑符合美观的要求。由于汉字数量较大,对汉字的规范性评估实现较为复杂,涉及图像处理、模式识别等技术,因此如何 有效地针对用户书写的字符进行规范度评估成为ー个具有挑战性的课题。现有技术中,在对书写字符进行规范度评价时,往往采用书写字符与单个标准字符比较计算相似度进行评判的方法,由此获取的评价结果往往不够可靠。这时,出现了ー种基于置信度的汉字书写质量评价方法。在这种方法中,通过计算字符匹配的置信度,获知当前书写字符和标准模板相似的可靠程度,进而对汉字书写质量进行评价。在这一方法中,首先利用修正二次判决函数分类器对手写汉字进行识别,得到K个候选字,并计算每个候选字与手写样本的距离;随后利用候选字距离计算置信度,再利用置信度进行汉字书写质量评价。这里,采用基于手写汉字字符模板和候选字符集模板得分比值的方法来计算置信度。一般来说,置信度越高,说明书写字符与其他候选字符的区分性越大,字符书写越规范。这种方法与传统的汉字书写质量评价方法相比,评价的标准主要基于训练样本的选取,在训练样本书写エ整的条件下,该评价系统对样本书写エ整性有较好的评价能力。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题现有技术提供的方法中,采用的基于应用字符模板和候选字符集模板得分比值的置信度计算来评估书写字符的规范度,虽然能较好的区分大部分字符的书写规范度,然而对诸如“天,夫”,“人,入”,“日,曰” “己、已、巳”等仅在局部有细微差异的字符对却存在低估其书写规范度的问题。一般来说,混淆字符的參考模板较为相似,相应的其和输入字符的特征向量的相似度也较为接近,在基于比值的置信度计算设定下,计算出的置信度得分往往偏低,即使用户正确规范地输入了该字符,系统也容易给出字符书写不够规范的结论。例如,对于用户输入汉字字符“己”,通过识别得出候选字符分别是“己”、“已”、“巳”,假设分别与候选字符计算得出的距离(或相似度)是O. 9、0.8、0. 7,在基于比值的置信度计算设定下,得出的置信度是O. 375。尽管用户输入的字符与标准模板的相似度很高,由于得出的置信度得分偏低,系统会得出书写不规范的结论。因此,现有技术提供的方法对于易混淆字符的评价往往不够准确。
技术实现思路
为解决上述技术问题,本专利技术实施例提供了字符书写规范度评测的方法和装置,可以有效解决现有技术中对混淆字符评价不准确的问题,提高了书写规范度评估的合理性、准确性。一方面,本专利技术实施例提 供了ー种字符书写规范度评测的方法,所述方法包括提取书写字符的笔画轨迹的原始特征矢量;将提取的所述原始特征矢量与第一字符集中的字符模板进行匹配,获取第一置信度;当判断所述第一置信度不满足预设的评测条件吋,执行二次匹配处理,获取第二特征矢量,将所述第二特征矢量与第二字符集中的字符模板进行匹配,获取第二置信度;根据所述第二置信度对所述书写字符进行评价。优选的,所述提取书写字符的笔画轨迹的原始特征矢量包括采集并记录书写字符的笔画轨迹;对所述书写字符的笔画轨迹进行预处理;提取预处理后的书写字符的笔画轨迹的原始特征矢量。优选的,所述将提取的所述原始特征矢量与第一字符集中的字符模板进行匹配,获取第一置信度包括获取与书写字符对应的标准字符模板;获取第一字符集;分别将提取的所述原始特征矢量与所述标准字符模板、第一字符集中的字符模板进行匹配,获取多个相似度值;根据所述多个相似度值获取第一置信度。优选的,在分别将提取的所述原始特征矢量与所述标准字符模板、第一字符集中的字符模板进行匹配之前,所述方法还包括对所述原始特征矢量进行特征转换,获取第一特征矢量;所述分别将提取的所述原始特征矢量与所述标准字符模板、第一字符集中的字符模板进行匹配为将获取的第一特征矢量与所述标准字符模板、第一字符集中的字符模板进行匹配。优选的,所述执行二次匹配处理,获取第二特征矢量,将所述第二特征矢量与第二字符集中的字符模板进行匹配,获取第二置信度包括获取第二字符集;根据所述第二字符集获取第二特征转换矩阵,根据所述第二特征变换矩阵对所述原始特征矢量进行特征变换以获取第二特征矢量;将所述第二特征矢量与第二字符集中的字符模板进行匹配,获取第二置信度。优选的,所述根据第二字符集获取第二特征转换矩阵包括根据与所述书写字符对应的标准字符模板以及与所述书写字符对应的混淆字符模板确定所述标准字符模板与所述混淆字符模板共属的子集;判断所述子集是否为决策树的根节点,如果不是,获取所述子集对应的特征转换矩阵作为第二特征变换矩阵。优选的,所述根据与所述书写字符对应的标准字符模板以及与所述书写字符对应的混淆字符模板确定所述标准字符模板与所述混淆字符模板共属的子集包括判断书写字符对应的标准字符以及与所述书写字符对应的混淆字符是否属于同一子集;如果不是,获取所述标准字符以及所述混淆字符的上ー级子集,重复上ー判断步骤;如果是,将所述子集作为所述标准字符模板与所述混淆字符模板共属的子集。优选的,所述方法进ー步包括 当判断所述第二置信度不满足预设条件时,执行再次二次匹配处理。另ー方面,本专利技术实施例还公开了ー种字符书写规范度评测装置,所述装置包括特征提取単元,用于提取书写字符的笔画轨迹的原始特征矢量;第一匹配単元,用于将提取的所述原始特征矢量与第一字符集中的字符模板进行匹配,获取第一置信度;第一判断単元,用于判断所述第一置信度是否满足预设条件;第二匹配単元,用于接收第一判断単元的判断结果,当判断结果表明所述第一置信度不满足预设的评测条件时,执行二次匹配处理,获取第二特征矢量,将所述第二特征矢量与第二字符集中的字符模板进行匹配,获取第二置信度;第二评价单元,用于根据所述第二置信度对所述书写字符进行评价。优选的,所述特征提取单元包括采集单元,用于采集并记录书写字符的笔画轨迹;预处理単元,用于对所述书写字符的笔画轨迹进行预处理;提取单元,用于提取预处理后的书写字符的笔画轨迹的原始特征矢量。优选的,所述第二匹配単元包括第一获取单元、第二获取单元、特征转换单元、第三获取单元,其中所述第一获取单元用于获取第二字符集;所述第二获取单元用于根据所述第二字符集获取第二特征转换矩阵;所述特征转换单元,用于根据所述第二特征变换矩阵对所述原始特征矢量进行特征变换以获取第二特征矢量;所述第三获取单元,用于将所述第二特征矢量与第二字符集中的字符模板进行匹配,获取第二置信度。优选的,所述第二获取单元包括确定单元,用于根据与所述书写字符对应的标准字符模板以及与所述书写字符对应的混淆字符模板确定所述标准字符模板与所述混淆字符模板共属的子集;第二判断単元,用于判断所述子集是否为决策树的根节点,如果不是,获取所述子集对应的特征转换矩阵作为第二特征变换矩阵。本专利技术实施例能够达到的有益效果为本专利技术实施例提供的方法提取书写字符的笔画轨迹的原始特征矢量,将提取的所述原始特征矢量与第一字符本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:何婷婷胡郁胡国平刘庆峰
申请(专利权)人:安徽科大讯飞信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1