手写登记方法、手写识别方法及其装置制造方法及图纸

技术编号:15640257 阅读:62 留言:0更新日期:2017-06-16 04:46
本发明专利技术公开了一种手写登记方法、手写识别方法及其装置。所述手写登记方法包括构建包括偏旁隐马尔可夫模型(HMM)的偏旁字典,并且通过组合从所述偏旁字典中选择的偏旁HMM,来生成基于偏旁的字符HMM。本发明专利技术能够实现更为精确和快速的手写识别结果。

【技术实现步骤摘要】
手写登记方法、手写识别方法及其装置
本专利技术总体涉及手写识别领域,特别是涉及一种用于在线识别手写字符的方法及其装置。
技术介绍
为了在线识别手写,现有技术1[1]为每个字符建立了一个隐马尔可夫模型(HMM,HiddenMarkovModel)。因此,包括成千上万模型的识别字典是大的,并且使用该技术的计算成本高。出于降低计算成本的目的,在表意语言的手写识别中使用了基于偏旁的方法。美国专利7903877B2(称为现有技术2)使用了字符-偏旁字典,以通过共享较小的偏旁子集来表示成千上万的字符。然而,与基于字符的方法相比,基于偏旁的方法看起来经常对识别精度有不利影响,这是因为,仅使用一个HMM来表示偏旁在不同字符中的所有外观的做法,很难涵盖该字符实际的多样性。为了提高识别精度,美国专利6956969B2(称为现有技术3)将偏旁分类为若干类别。图1A例示了现有技术3在建立偏旁模型时的原理。偏旁X根据其在不同字符中的几何布局,而被分类为m个类别,其中每个类别对应于HMM模型。m是正整数。基于现有技术3的识别精度仍然远低于现有技术1。因此,期望能够提供一种能够既快速又精确地识别手写的新手写识别方法。参考文献[1]HanShu,“On-LineHandwritingRecognitionUsingHiddenMarkovModels”,MasterThesisinElectricalEngineeringandComputerScienceattheMassachusettsInstituteofTechnology,1997
技术实现思路
本专利技术是鉴于上述问题中的至少一个而提出的。根据本专利技术的一个方面,提供了一种手写登记方法,所述手写登记方法包括:构建包括偏旁隐马尔可夫模型(HMM)的偏旁字典,并且通过组合从所述偏旁字典中选择的偏旁HMM,来生成基于偏旁的字符HMM,其中,所述偏旁字典中的偏旁HMM是通过以下步骤生成的:—训练数据获取步骤,其包括:选择包括至少一个类别的训练偏旁,并且获取所述至少一个类别中的一者的相应种子HMM,其中,将该训练偏旁分类到所述至少一个类别是基于该偏旁在不同字符中的几何布局;获取字符样本的训练数据集,其中,所述字符样本包括手写轨迹;获取字符HMM的模型数据集,其中,所述模型数据集包括多个字符的HMM;—偏旁检测及偏旁采样点确定步骤,通过使用所获取到的种子HMM,在所述训练数据集当中检测包含所述偏旁的字符样本作为所述偏旁的训练字符样本,并且针对所述偏旁的各个训练字符样本,来确定所述偏旁的采样点;—状态序列提取步骤,通过使用所述模型数据集中的相应字符的HMM,对所述偏旁的所述训练字符样本分别进行解码,并且从相应字符的HMM中,分别提取表示所述偏旁的状态序列;—聚类步骤,基于状态数,将所提取出的状态序列聚类到子类别,使得每个子类别对应于偏旁HMM。通过以下参照附图对示例性实施例的描述,本专利技术的进一步特征将变得清楚。附图说明被并入说明书中并构成说明书的一部分的附图例示了本专利技术的实施例,并且与文字描述一起用来说明本专利技术的原理。图1A例示了现有技术2的基本原理;图1B例示了根据本专利技术的实施例构建偏旁模型的基本原理。图2是通过根据本申请的实施例的手写登记方法而构建的手写识别字典的应用环境的图示。图3是根据第一示例性系统配置的装置的示意性框图,其中,所述装置通过根据本专利技术的实施例的嵌入式手写识别模块来实现手写输入功能。图4是根据第二示例性系统配置的装置的示意性框图,其中,所述装置通过根据本专利技术的实施例的分布式手写识别模块来实现手写输入功能。图5是例示图3中的手写识别模块330或图4中的手写识别模块430的示例性硬件配置的示意性框图。图6示出了根据本专利技术的实施例的手写登记方法的总流程图中的两个阶段。图7示出了图6中的阶段I的构造偏旁模型的流程图。图8示出了图7中的步骤200及步骤300的示例性实现方式。图9是示意性地例示根据本专利技术的实施例的构造偏旁模型的基本处理的示意图。图10是示意性地例示根据本专利技术的实施例的构造字符模型的处理的示意图。图11示出了根据本专利技术的实施例的、通过组合相应的偏旁模型来生成多个字符的模型的示例。图12是示意性地例示根据本专利技术的实施例的生成种子模型的处理的示意图。图13是根据本专利技术的实施例的手写登记装置的功能结构。具体实施方式下面,将参照附图来详细描述本专利技术的示例性实施例。应当指出,以下的描述实质上仅是说明性和示例性的,并且决不意在限制本专利技术及其应用或用途。在实施例中陈述的构成要素及步骤的相对布置、数值表达式以及数值并不限制本专利技术的范围,除非另外特别指明。此外,本领域的技术人员公知的技术、方法及设备可能不作详细讨论,但在适当的情况下应当作为本说明书的一部分。在基于HMM的手写识别方法中,每个字符对应于HMM,并且每个HMM由状态序列组成。特别是,如果字符HMM是通过偏旁共享方法而构建的,则可以将字符HMM视为各个偏旁的HMM的组合。例如,字符“呆”由偏旁“口”和偏旁“木”组成。因此,表示字符“呆”的状态序列是表示偏旁“口”的状态序列和表示偏旁“木”的状态序列的组合。在本申请中,如果没有特别指明,则偏旁模型是指偏旁HMM,并且字符模型是指字符HMM。HMM的状态数示出了该HMM的模型复杂度。换言之,字符HMM的状态数示出了该字符HMM的模型复杂度;偏旁HMM的状态数示出了该偏旁HMM的模型复杂度。考虑到偏旁的几何布局将偏旁分解成类的做法,能够提高精度。然而,相同几何布局的偏旁可能仍然具有不同的模型复杂度。以左侧竖向偏旁“金”为例。在此,“左侧竖向”是指偏旁在字符中的特定几何布局。在基于训练字符的HMM中,对于字符“針”,前17个状态与偏旁“金”相匹配。然而,对于字符“鐸”,仅前11个状态与偏旁“金”相匹配。在这种情况下,针对左侧竖向的“金”构建17个状态和11个状态的偏旁HMM,都是不合适的。接下来,进一步分析具有相同几何布局的偏旁与不同状态数相匹配的原因。一般而言,偏旁的模型复杂度受两个因素的影响。第一个因素是包含该偏旁的字符的整体状态数。第二个因素是相对复杂度。在字符的全部状态当中,一些将与该偏旁相匹配。HMM的固有性质使得匹配结果是基于偏旁的轨迹相对于字符的轨迹的相对复杂度。该相对复杂度越大,则字符HMM的全部状态当中有越多状态与偏旁相匹配。在上一示例中,“針”中的“金”得到17个状态,这比“鐸”中的“金”多6个状态。这是因为,“金”的轨迹相对于轨迹“針”的相对复杂度,大于“金”的轨迹相对于轨迹“鐸”的相对复杂度。在图1A和图1B中,每个圆圈表示模型中的状态。围绕圆圈的箭头表示状态转变。成行的一系列圆圈表示模型的状态转变路径。成行的一系列圆圈可以被视为状态序列。此外,通过参照图1B,来说明根据本专利技术的实施例的构建偏旁模型的基本原理。通过第一分类操作,根据偏旁X在不同字符中的几何布局,将其分类为m个类别C1、C2、…、Cm。在第一示例中,偏旁“口”可以被分类为顶部、底部及外部“口”3个类别。这3个类别中的3个代表性字符分别是“号”、“占”及“围”。第一示例仅基于偏旁的位置,将偏旁分解成类。在第二示例中,偏旁“口”可以被分类为大“口”及小“口”2个类别。2个本文档来自技高网...
手写登记方法、手写识别方法及其装置

【技术保护点】
一种手写登记方法,该手写登记方法包括:构建包括偏旁隐马尔可夫模型HMM的偏旁字典,并且通过组合从所述偏旁字典中选择的偏旁HMM,来生成基于偏旁的字符HMM,其中,所述偏旁字典中的偏旁HMM是通过以下步骤生成的:训练数据获取步骤,其包括:选择包括至少一个类别的训练偏旁,并且获取所述至少一个类别中的一者的相应种子HMM,其中,将该训练偏旁分类到所述至少一个类别是基于该偏旁在不同字符中的几何布局;获取字符样本的训练数据集,其中,所述字符样本包括手写轨迹;获取字符HMM的模型数据集,其中,所述模型数据集包括多个字符的HMM;偏旁检测及偏旁采样点确定步骤,通过使用所获取到的种子HMM,在所述训练数据集当中,检测包含所述偏旁的字符样本作为所述偏旁的训练字符样本,并且针对所述偏旁的各个训练字符样本,确定所述偏旁的采样点;状态序列提取步骤,通过使用所述模型数据集中的相应字符的HMM,对所述偏旁的所述训练字符样本分别进行解码,并且从相应字符的HMM中,分别提取表示所述偏旁的状态序列;聚类步骤,基于状态数,将所提取出的状态序列聚类到子类别,使得每个子类别对应于一个偏旁HMM。

【技术特征摘要】
1.一种手写登记方法,该手写登记方法包括:构建包括偏旁隐马尔可夫模型HMM的偏旁字典,并且通过组合从所述偏旁字典中选择的偏旁HMM,来生成基于偏旁的字符HMM,其中,所述偏旁字典中的偏旁HMM是通过以下步骤生成的:训练数据获取步骤,其包括:选择包括至少一个类别的训练偏旁,并且获取所述至少一个类别中的一者的相应种子HMM,其中,将该训练偏旁分类到所述至少一个类别是基于该偏旁在不同字符中的几何布局;获取字符样本的训练数据集,其中,所述字符样本包括手写轨迹;获取字符HMM的模型数据集,其中,所述模型数据集包括多个字符的HMM;偏旁检测及偏旁采样点确定步骤,通过使用所获取到的种子HMM,在所述训练数据集当中,检测包含所述偏旁的字符样本作为所述偏旁的训练字符样本,并且针对所述偏旁的各个训练字符样本,确定所述偏旁的采样点;状态序列提取步骤,通过使用所述模型数据集中的相应字符的HMM,对所述偏旁的所述训练字符样本分别进行解码,并且从相应字符的HMM中,分别提取表示所述偏旁的状态序列;聚类步骤,基于状态数,将所提取出的状态序列聚类到子类别,使得每个子类别对应于一个偏旁HMM。2.根据权利要求1所述的手写登记方法,其中,所述基于偏旁的字符HMM是通过以下步骤生成的:偏旁模型选择步骤,针对包括要素偏旁的训练字符,基于每个要素偏旁在所述训练字符中的几何布局,为每个要素偏旁选择一个类别,并且基于所述训练字符的整体字符HMM中的、表示每个要素偏旁的状态序列的状态数,从所述偏旁字典中为每个要素偏旁选择一个子类别,并且针对每个要素偏旁,获得与所选择的子类别相对应的偏旁HMM;以及偏旁模型组合步骤,通过组合所获得的每个要素偏旁的偏旁HMM,来生成所述训练字符的基于偏旁的HMM。3.根据权利要求1或权利要求2所述的手写登记方法,其中,所述几何布局包括以下属性中的至少一者:偏旁在字符中的位置、形状或大小。4.根据权利要求1或权利要求2所述的手写登记方法,其中,所述聚类步骤包括:将状态数相同的所提取出的状态序列聚类到同一子类别。5.根据权利要求4所述的手写登记方法,其中,在所述聚类步骤中,通过从属于每个子类别的状态序列当中选择状态序列,来获得与每个子类别相对应的偏旁HMM。6.根据权利要求4所述的手写登记方法,其中,在所述聚类步骤中,通过训练包含相应子类别的训练偏旁的多个手写样本,来获得与每个子类别相对应的偏旁HMM。7.根据权利要求1或权利要求2所述的手写登记方法,其中,通过从源字符的HMM中提取表示所述训练偏旁的状态序列,来获得所述种子HMM,其中,所述训练偏旁在所述源字符中的几何布局属于所述种子HMM相对应的类别。8.根据权利要求1或权利要求2所述的手写登记方法,其中,通过训练所述训练偏旁的多个手写样本,来获得所述种子HMM,其中,所述训练偏旁的所述多个手写样本属于所述种子HMM相对应的类别。9.根据权利要求1或权利要求2所述的手写登记方法,其中,所述手写登记方法用于登记东亚字符。10.一种手写识别方法,该手写识别方法包括以下步骤:获取手写样本;以及通过使用包含多个基于偏旁的字符模型的字符字典,来识别所获取到的手写样本,其中,通过权利要求1至权利要求9的任一手写登记方法来生成所述多个基于偏旁的字符模型。11.根据权利要求10所述的手写识别方法,其中,所述字符字典是离线构建的,并且所述手写识别方法是在线实现的。12.一种手写登记装置,该手写登记装置包括偏旁模型构造单元以及字符模型构造单元,其中,所述偏旁模型构造单元被构造为构建包括偏旁隐马尔可夫模型HMM的偏旁字典,并且所述字符模型构造单元被构造为通过组合从所述偏旁字典中选择的偏旁HMM,来生成基于偏旁的字符HMM,其中,所述偏旁模型构造单元包括:训练数据获取子单元,其被构造为:...

【专利技术属性】
技术研发人员:王亮李建杰刘欣
申请(专利权)人:佳能株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1