【技术实现步骤摘要】
本专利技术通常涉及手写识别领域,具体地,涉及一种用于在线识别手写字符的方法及其装置。
技术介绍
近年来,在线手写识别被广泛用于人机交互系统。以多功能外围设备(MFP)为例,手写识别的技术使得用户能够输入操作参数来指示MFP。用户能够通过手写输入姓名以及用户的传真目的地的地址。MFP识别手写字符,并相应地实施传真操作。在这种场景下,用户有时需要通过少量的手写样本,将新字符登记到手写识别引擎的字典中。例如,用户需要登记日文汉字字符,因为当ROM大小有限时,没有必要生成能够涵盖所有日文汉字字符的字典。然而,如果在登记阶段中由一个人书写了字符的样本,则对MFP的手写识别引擎而言,将难以识别由其他人书写的该字符的样本。因为不同的人可能具有不同的书写风格,例如不同的笔划顺序、不同的笔划数、不同的笔划形状等。图12A至图12E能够帮助理解笔划数。在图12A中,书写风格模板的笔划数是1,在图12B至图12D中,模板的笔划数分别是2,在图12E中,模板的笔划数是3。美国专利第7865018号公开了一种利用个性化手写识别引擎的手写识别技术。识别技术使用个人的先前的书写风格的示例,来帮助识别该个人输入的新笔迹。如果其他个人具有不同的书写风格,则该方法不能支持其他个人。在在线登记的场景下,用于登记的真实手写样本的数量通常太少,而不能包含一个字符的所有可能书写风格。但是,即使当字符的登记样本仅有少量时,仍然存在识别该字符的各种测试样本的需要。
技术实现思路
本专利技术是鉴于上述问题中的至少一者而提出的。根据本专利技术的一个方面,提供了一种手写登记方法,该手写登记方法包括:训练数据获取 ...
【技术保护点】
一种手写登记方法,该手写登记方法包括:训练数据获取步骤,用于获取训练字符的训练数据,其中,所述训练字符包括至少一个偏旁,所述训练数据包括所述训练字符的代码;虚拟样本生成步骤,用于基于偏旁数据集来生成所述训练字符的至少一个虚拟样本,其中,所述偏旁数据集包括所述训练字符的所述至少一个偏旁的至少一个书写风格模板;以及识别模板生成步骤,用于基于所述训练字符的所述训练数据和所述至少一个虚拟样本,来生成所述训练字符的至少一个识别模板。
【技术特征摘要】
1.一种手写登记方法,该手写登记方法包括:训练数据获取步骤,用于获取训练字符的训练数据,其中,所述训练字符包括至少一个偏旁,所述训练数据包括所述训练字符的代码;虚拟样本生成步骤,用于基于偏旁数据集来生成所述训练字符的至少一个虚拟样本,其中,所述偏旁数据集包括所述训练字符的所述至少一个偏旁的至少一个书写风格模板;以及识别模板生成步骤,用于基于所述训练字符的所述训练数据和所述至少一个虚拟样本,来生成所述训练字符的至少一个识别模板。2.根据权利要求1所述的手写登记方法,其中,所述至少一个书写风格模板包括所述训练字符的所述至少一个偏旁的代码和笔划特征。3.根据权利要求2所述的手写登记方法,其中,所述训练字符的所述至少一个偏旁的所述笔划特征包括笔划数、和/或笔划形状、和/或笔划方向、和/或笔划顺序。4.根据权利要求2或3所述的手写登记方法,其中,所述偏旁数据集包括所述训练字符的所述至少一个偏旁的多个书写风格模板,并且所述多个书写风格模板具有不同的笔划特征。5.根据权利要求1至3所述的手写登记方法,其中,所述虚拟样本生成步骤还包括:偏旁检测步骤,用于检测所述至少一个偏旁,其中,所述至少一个偏旁被包括在所述训练字符中;偏旁手写构造步骤,用于通过使用所述偏旁数据集,来构造所检测到的至少一个偏旁的至少一个手写;虚拟样本构造步骤,用于通过使用所构造的偏旁手写,来构造所述训练字符的至少一个虚拟样本。6.根据权利要求5所述的手写登记方法,其中,所述虚拟样本生成步骤还利用字符结构字典,所述字符结构字典包含至少一个条目,所述至少一个条目中的一个条目包括所述训练字符和相应偏旁的配对信息。7.根据权利要求6所述的手写登记方法,其中,所述配对信息还包
\t括所述相应偏旁中的各个的代码、位置以及顺序。8.根据权利要求7所述的手写登记方法,其中,针对所述训练字符中包括的各偏旁,所述偏旁数据集包括至少一个书写风格模板。9.根据权利要求8所述的手写登记方法,其中,所述偏旁检测步骤基于所述训练字符的代码以及字符结构字典,并且,所述虚拟样本构造步骤基于所述字符结构字典。10.根据权利要求5所述的手写登记方法,其中,所述虚拟样本生成步骤还利用所述训练字符的至少一个训练样本。11.根据权利要求10所述的手写登记方法,其中,所述偏旁检测步骤利用所述训练字符的所述至少一个训练样本以及所述偏旁数据集。12.根据权利要求11所述的手写登记方法,其中,所述偏旁手写构造步骤利用所述偏旁检测步骤的检测结果以及所述偏旁数据集;并且,所述虚拟样本构造步骤利用字符结构字典,所述字符结构字典包含至少一个条目,所述至少一个条目中的一个条目包括所述训练字符和相应偏旁的配对信息。13.根据权利要求11所述的手写登记方法,其中,所述偏旁手写构造步骤还包括基于笔划的拐点,将所述训练字符的所述至少一个训练样本的笔划分割为片段,并且基于所述偏旁数据集来组合所述片段。14.根据权利要求13所述的手写登记方法,其中,所述偏旁手写构造步骤还包括基于偏旁书写风格模板的组的笔划数信息和归一化笔划特征,来组合所述片段,其中,所述组包括与通过所述偏旁检测步骤获得的所述至少一个偏旁相对应的书写风格模板。1...
【专利技术属性】
技术研发人员:李建杰,刘欣,王亮,
申请(专利权)人:佳能株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。