手写样本生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:20682130 阅读:39 留言:0更新日期:2019-03-27 19:16
本发明专利技术公开了一种手写样本生成方法、装置、计算机设备及存储介质。所述方法包括:获取手写输入法中的字体文件;获取文本语料文件;根据预设的图片尺寸绘制画布,并设置画布的背景颜色;从预设的语料数据库中提取语料文本,并从预设的字体库中选取目标字体文件;使用目标字体文件将语料文本转换为目标字体文件对应的手写文本;根据画布尺寸和手写文本,确定手写文本的文本尺寸;按照手写文本的文本尺寸,在画布上绘制手写文本,得到手写样本图片;将手写样本图片和语料文本作为手写样本,保存到手写样本数据集中。本发明专利技术的技术方案提高手写样本的收集效率,同时能够丰富手写样本的样本数量,进而有效提高手写文本识别模型的识别准确率。

【技术实现步骤摘要】
手写样本生成方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种手写样本生成方法、装置、计算机设备及存储介质。
技术介绍
在对手写文本识别的研究中,需要准备大量的手写样本以支撑手写文本识别模型的模型训练。但是,目前的手写样本往往以人工收集为主,由于手写样本的种类繁多,造成人工收集手写样本的工作量大,同时,对收集到的手写样本还需要花费大量的时间进行错误清洗,导致手写样本的收集效率低,且人工收集的数量有限,无法很好的支撑手写文本识别模型的模型训练,造成模型训练困难,进而影响到模型的识别准确率。
技术实现思路
本专利技术实施例提供一种手写样本生成方法、装置、计算机设备及存储介质,以解决目前手写样本的收集成本高,收集效率低,影响手写文本识别模型的识别准确率的问题。一种手写样本生成方法,包括:获取预设的手写输入法中的字体文件,并将所述字体文件保存在预设的字体库中;获取文本语料文件,并将所述文本语料文件保存在预设的语料数据库中;根据预设的图片尺寸绘制画布,并设置所述画布的背景颜色;按照预设的选取方式,从所述预设的语料数据库中提取语料文本,并从所述预设的字体库中选取目标字体文件本文档来自技高网...

【技术保护点】
1.一种手写样本生成方法,其特征在于,所述手写样本生成方法包括:获取预设的手写输入法中的字体文件,并将所述字体文件保存在预设的字体库中;获取文本语料文件,并将所述文本语料文件保存在预设的语料数据库中;根据预设的图片尺寸绘制画布,并设置所述画布的背景颜色;按照预设的选取方式,从所述预设的语料数据库中提取语料文本,并从所述预设的字体库中选取目标字体文件;使用所述目标字体文件将所述语料文本转换为所述目标字体文件对应的手写文本;根据所述画布尺寸和所述手写文本,确定所述手写文本的文本尺寸;按照所述手写文本的文本尺寸,在所述画布上绘制所述手写文本,得到手写样本图片;将所述手写样本图片和所述语料文本作为手写...

【技术特征摘要】
1.一种手写样本生成方法,其特征在于,所述手写样本生成方法包括:获取预设的手写输入法中的字体文件,并将所述字体文件保存在预设的字体库中;获取文本语料文件,并将所述文本语料文件保存在预设的语料数据库中;根据预设的图片尺寸绘制画布,并设置所述画布的背景颜色;按照预设的选取方式,从所述预设的语料数据库中提取语料文本,并从所述预设的字体库中选取目标字体文件;使用所述目标字体文件将所述语料文本转换为所述目标字体文件对应的手写文本;根据所述画布尺寸和所述手写文本,确定所述手写文本的文本尺寸;按照所述手写文本的文本尺寸,在所述画布上绘制所述手写文本,得到手写样本图片;将所述手写样本图片和所述语料文本作为手写样本,保存到预设的手写样本数据集中。2.如权利要求1所述的手写样本生成方法,其特征在于,在所述获取文本语料文件,并将所述文本语料文件保存在预设的语料数据库中的步骤之后,并且在所述根据预设的图片尺寸绘制画布,并设置所述画布的背景颜色的步骤之前,所述手写样本生成方法还包括:根据预设的文本字典,对所述文本语料文件的内容进行筛选,将所述文本语料文件中不属于所述文本字典的文本内容从所述文本语料文件中删除。3.如权利要求1或2所述的手写样本生成方法,其特征在于,在所述将所述手写样本图片和所述语料文本作为手写样本,保存到预设的手写样本数据集中的步骤之后,所述手写样本生成方法还包括:按照预设的图片效果处理方式对所述手写样本图片进行处理,得到更新图片;将所述更新图片和所述语料文本作为新的手写样本,保存到所述手写样本数据集中。4.如权利要求3所述的手写样本生成方法,其特征在于,所述按照预设的图片效果处理方式对所述手写样本图片进行处理,得到更新图片包括:获取所述手写样本图片中每个像素点的像素值;从所述手写样本图片中所述手写文本所在的图像区域随机选择N个像素点,得到N个目标像素点,其中,N为正整数;对每个所述目标像素点的像素值进行高斯模糊处理,得到每个所述目标像素点的目标像素值;使用所述目标像素点的目标像素值替换所述目标像素点的像素值,得到所述更新图片。5.如权利要求4所述的手写样本生成方法,其特征在于,所述对每个所述目标像素点的像素值进行高斯模糊处理,得到每个所述目标像素点的目标像素值包括:以所述目标像素点为中心,将所述目标像素点和所述目标像素点周围的K个像素点构成权重区域,其中,K为正整...

【专利技术属性】
技术研发人员:金晨刘克亮
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1