【技术实现步骤摘要】
印刷手写混合的数学公式数据生成方法及装置
本专利技术涉及网络
,特别涉及印刷手写混合的数学公式数据生成方法及装置。
技术介绍
随着互联网的普及,数学作业自动批改被越来越多的人所使用。例如:数学教师可批量拍照,使用作业自动批改服务对图像中的内容进行批改,一次完成对多份作业的批改,减轻教师基础性、重复性的批改动作;再例如,学生家长在检查数据作业时,可使用作业自动批改服务进行批改;再例如,学生完成作业后,可通过作业自动批改服务进行自查。数学作业自动批改一般基于识别模型识别数学公式。模型在正式投入使用之前需要大量的数学公式样本进行模型训练。在现实场景下,一个数学公式可能同时包含印刷体和手写体,如图1所示,印刷体通常为题目,而手写体通常为学生作答。如何生成包含印刷体和手写体的数学公式,以供后续的识别模型训练,是目前研究的热门。
技术实现思路
有鉴于此,本专利技术实施例提供印刷手写混合的数学公式数据生成方法及装置,以生成印刷手写混合的数学公式。为实现上述目的,本专利技术实施例提供如下技术 ...
【技术保护点】
1.一种印刷手写混合的数学公式数据生成方法,其特征在于,基于手写字符图像集,所述手写字符图像集包括多个子集,任一子集包括对应同一字符意义的多个不同形态的手写字符图像;不同子集对应不同的字符意义;/n所述生成方法包括:/n从多个预设题型中确定出至少一个题型;确定出的题型为目标题型;/n在背景图上按照所述目标题型生成印刷体数学公式;所述印刷体数学公式中的任一字符为印刷体字符;所述印刷体数学公式中的每一印刷体字符对应一个位置;/n从与目标印刷体字符的字符意义相同的子集中,选择出手写字符图像;所述目标印刷体字符为预设目标位置所对应的印刷体字符;/n使用选择出的手写字符图像粘贴在所述 ...
【技术特征摘要】
1.一种印刷手写混合的数学公式数据生成方法,其特征在于,基于手写字符图像集,所述手写字符图像集包括多个子集,任一子集包括对应同一字符意义的多个不同形态的手写字符图像;不同子集对应不同的字符意义;
所述生成方法包括:
从多个预设题型中确定出至少一个题型;确定出的题型为目标题型;
在背景图上按照所述目标题型生成印刷体数学公式;所述印刷体数学公式中的任一字符为印刷体字符;所述印刷体数学公式中的每一印刷体字符对应一个位置;
从与目标印刷体字符的字符意义相同的子集中,选择出手写字符图像;所述目标印刷体字符为预设目标位置所对应的印刷体字符;
使用选择出的手写字符图像粘贴在所述预设目标位置,得到印刷手写混合的数学公式。
2.如权利要求1所述的生成方法,其特征在于,在所述从多个预设题型中确定出至少一个题型之前,还包括:
获取所述手写字符图像集。
3.如权利要求2所述的生成方法,其特征在于,所述获取所述手写字符图像集包括:
获取图像集;所述图像集中的图像包含字符;
从所述图像集的图像中截取出手写字符图像;
根据截取出的手写字符图像的字符意义,将所述截取出的手写字符图像放入相应的子集中;
以子集中的手写字符图像为原始图像进行数据增强处理,得到与所述原始图像的形态相差异的多个手写字符图像。
4.如权利要求3所述的生成方法,其特征在于,所述数据增强处理包括:旋转变换、颜色空间变换、平衡变换、尺度变换、高斯加噪中的至少一种。
5.如权利要求1所述的生成方法,其特征在于,
选择出的手写字符图像为目标手写字符图像;
所述使用选择出的手写字符图像粘贴在所述预设目标位置,得到印刷手写混合的数学公式包括:
对所述目标手写字符图像进行预处理;
将预处理后的目标手写字符图像粘贴在所述预设目标位置。
6.如权利要求5所述的生成方法,其特征在于,所述进行预处理包括:
将所述...
【专利技术属性】
技术研发人员:曹润东,饶丰,
申请(专利权)人:北京一起教育信息咨询有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。