用于复杂书写场景的手写文本数据生成方法及计算机产品技术

技术编号:30083664 阅读:30 留言:0更新日期:2021-09-18 08:42
本发明专利技术公开了一种用于复杂书写场景的手写文本数据生成方法及计算机产品,方法包括:获取单字样本;根据设定的书写场景,确定所对应的场景参数和增强参数;基于场景参数和增强参数,调整单字样本与当前手写样本之间的关系,将单字样本合成到当前手写样本中,以生成新的手写文本样本,并且记录对应的单字切分位置。本发明专利技术能够根据设定的书写场景生成对应的手写文本,从而实现了手写文本的定制化生成,而且非常适于通过单字样本来生成手写文本样本。本。本。

【技术实现步骤摘要】
用于复杂书写场景的手写文本数据生成方法及计算机产品


[0001]本专利技术涉及手写识别
,特别是涉及一种用于复杂书写场景的手写文本数据生成方法。

技术介绍

[0002]手写输入是人与设备的一种重要的交互方式。相应的,为了辨识手写输入,手写识别技术也在各种类型的电子设备上被广泛地应用起来。
[0003]现有技术中,手写识别技术主要是基于机器学习和深度学习的方法来构建识别模型,而构建识别模型的关键在于:将大量采样的数据集作为输入对识别模型进行训练,因此,为了提高识别模型的精度,需要足够多的数据。对于真实的、复杂的书写场景的手写识别,更加依赖足够逼近或模拟各类真实、复杂书写场景的测试数据。上述书写场景是指用户采用电子设备进行手写录入的方式,包括但不限于,单/多行,单/多列,跳跃书写,重叠书写,任意角度斜向书写等。
[0004]收集单字手写采样数据较容易实现,例如联机形式手写数据(通过某种电子设备获取到的用户手写输入以书写轨迹方式保存)中单字样本较多;然而,获取各类复杂场景下手写文本数据且同时记录单字类型(单字类型:书写单字的内容本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于数据增强的手写文本数据生成方法,其特征在于,包括如下步骤:获取单字样本;根据设定的书写场景,确定所对应的场景参数和增强参数;基于场景参数和增强参数,调整单字样本与当前手写文本样本之间的关系,将单字样本合成到当前手写文本样本中,以生成新的手写文本样本,并且记录对应的单字切分位置。2.根据权利要求1所述的方法,其特征在于,所述获取单字样本包括:根据语料内容从单字样本库中选取对应的单字形成单字样本集合,从单字样本集合中采集单字样本,并且对单字样本进行标准化;所述标准化包括归一化、估算单字样本的中心和计算单字样本的大小。3.根据权利要求1所述的方法,其特征在于,其中,还以当前手写文本样本的位置为参考;所述当前手写文本样本的位置包括:当前手写文本样本的中心位置,或者当前手写文本样本中末字的中心位置,所述末字为按照按书写时间排序的最后一个字符。4.根据权利要求1所述的方法,其特征在于,所述书写场景包括若干种典型书写场景以及两种以上典型书写场景的结合,所述典型书写场景包括:“行/...

【专利技术属性】
技术研发人员:陈欣李闯段金越肖骞宇
申请(专利权)人:中金金融认证中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1