一种错题本自动生成方法及装置制造方法及图纸

技术编号:33131637 阅读:28 留言:0更新日期:2022-04-17 00:49
本申请公开了一种错题本自动生成方法。对题目图像进行智能裁剪,仅保留所述图像中的文档区域,去除所述图像中的非文档区域。通过神经网络方法对所述图像的文档区域进行检测,并将所述图像的文档区域划分为三类子区域。基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征,将所述图像的文档区域分割成一个或多个题目区域,同时得到每个题目区域的位置信息。在每个题目区域中确定该题目的批改内容并分类。在每个题目区域中,去除手写内容。将答案为错误、无手写内容、仅有完整印刷内容的题目生成为错题本。本申请实现了自动获取每个错题的坐标,无需人工调整错题坐标,生成错题本的效率更高。错题本的效率更高。错题本的效率更高。

【技术实现步骤摘要】
一种错题本自动生成方法及装置


[0001]本申请涉及一种基于神经网络(Neural Network,NN)的错题本自动生成的方法。

技术介绍

[0002]错题本,也称错题集、改错本、纠错本、摘错本等,是指将学生做过的作业、习题、试卷中的错题摘取出来整理而成的文件。
[0003]现有的错题本生成方法中,需要用户手动框选错题范围,也就是手动确定包含错题的矩形区域的范围。这个过程中用户需要不断调整错题范围的坐标,选择一道错题的耗时通常在10秒以上。

技术实现思路

[0004]本申请所要解决的技术问题是提出一种错题本自动生成的方法,可以显著提高错题本整理的灵活性和效率。
[0005]为解决上述技术问题,本申请提出了一种错题本自动生成方法,包括如下步骤。步骤S10:将做过的题目拍摄为图像,或者输入做过的题目的图像;对所述图像进行裁剪,仅保留所述图像中的文档区域,去除所述图像中的非文档区域。步骤S20:通过神经网络方法对所述图像的文档区域进行检测,并将所述图像的文档区域划分为多个子区域,这些子区域分为三类:印刷体子区域、印刷体手写体重叠子区域、手写体子区域。步骤S30:基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征,将所述图像的文档区域分割成一个或多个题目区域,同时得到每个题目区域的位置信息;每个题目区域中,均包含题目、答案、批改这三部分内容。所述步骤S20与步骤S30的顺序或者互换,或者同时进行;在步骤S20和步骤S30均执行完毕后,每个题目区域中,均包含印刷体子区域、印刷体手写体重叠子区域、手写体子区域这三类子区域。步骤S40:在每个题目区域中的手写体子区域和印刷体手写体重叠子区域中确定该题目的批改内容;通过已训练的批改内容分类器判断每个题目的批改内容是标记该题目的答案为正确还是错误。步骤S50:在每个题目区域中,运用背景色填充手写体子区域;在每个题目区域中的印刷体手写体重叠子区域中,运用背景色填充手写内容,同时保留印刷内容的完整性。步骤S60:将答案为错误、无手写内容、仅有完整印刷内容的题目生成为错题本。
[0006]进一步地,所述步骤S10中,所述图像中的文档区域是指图像中有字符或图形的区域,仅有一个;所述图像中的非文档区域是指图像中的空白区域,分布在所述图像中的文档区域的四周。
[0007]优选地,所述步骤S30中,所述基于神经网络的目标检测算法采用无锚框的目标检测算法,所述印刷体的形态特征是指印刷体的边特征和一致性特征,所述图像的文档区域、印刷体的形态特征共同作为神经网络的输入。
[0008]进一步地,在步骤S20和步骤S30均执行完毕后,在一个题目区域中,题目在印刷体子区域或印刷体手写体重叠子区域中,答案在手写体子区域或印刷体手写体重叠子区域
中,批改在手写体子区域或印刷体手写体重叠子区域中。
[0009]优选地,所述步骤S40中,所述批改内容分类器采用ResNet

101二分类模型,ResNet

101是具有101层深度的卷积神经网络。
[0010]进一步地,所述步骤S50中,采用图像修复方法通过判断缺失像素点对应周围像素点的信息依次修复缺失像素点,通过像素点分类结果来保留印刷内容的完整性。
[0011]可选地,所述步骤S60改为步骤S62;步骤S62:将用户选择的、答案为错误、无手写内容、仅有完整印刷内容的题目生成为错题本。
[0012]可选地,所述步骤S60改为步骤S64;步骤S64:通过题库匹配找出错题的参考答案,将答案为错误、无手写内容、仅有完整印刷内容、无参考答案的题目生成为错题本,同时生成对应的参考答案。
[0013]可选地,所述步骤S60改为步骤S66;步骤S66:通过题库匹配找出用户所选择的错题的参考答案,将用户选择的、答案为错误、无手写内容、仅有完整印刷内容、无参考答案的题目生成为错题本,同时生成对应的参考答案。
[0014]本申请还提出了一种错题本自动生成装置,包括裁剪单元、子区域划分单元、题目分割单元、批改分类单元、手写填充单元、以及生成单元一。所述裁剪单元用于将做过的题目拍摄为图像,或者输入做过的题目的图像;对所述图像进行裁剪,仅保留所述图像中的文档区域,去除所述图像中的非文档区域。所述子区域划分单元用于通过神经网络方法对所述图像的文档区域进行检测,并将所述图像的文档区域划分为多个子区域,这些子区域分为三类:印刷体子区域、印刷体手写体重叠子区域、手写体子区域。所述题目分割单元用于基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征,将所述图像的文档区域分割成一个或多个题目区域,同时得到每个题目区域的位置信息;每个题目区域中,均包含题目、答案、批改这三部分内容;每个题目区域中,均包含印刷体子区域、印刷体手写体重叠子区域、手写体子区域这三类子区域。所述批改分类单元用于在每个题目区域中的手写体子区域和印刷体手写体重叠子区域中确定该题目的批改内容;通过已训练的批改内容分类器,判断每个题目的批改内容是标记该题目的答案为正确还是错误。所述手写填充单元用于在每个题目区域中,运用背景色填充手写体子区域;还在每个题目区域中的印刷体手写体重叠子区域中,运用背景色填充手写内容,同时保留印刷内容的完整性。所述生成单元一用于将答案为错误、无手写内容、仅有完整印刷内容的题目生成为错题本。
[0015]本申请通过数据驱动方法,实现了对图像的智能裁剪、三类子区域识别、题目区域分割、批改内容识别、手写内容填充等,实现了智能识别出图像中的错题,并取得每个错题的坐标,完美匹配错题,无需人工手动选择错题或调整错题坐标,生成错题本的效率更高。
附图说明
[0016]图1是本申请提出的错题本自动生成方法的流程示意图。
[0017]图2是本申请提出的错题本自动生成装置的结构示意图。
[0018]图中附图标记说明:10为裁剪单元、20为子区域划分单元、30为题目分割单元、40为批改分类单元、50为手写填充单元、60为生成单元一。
具体实施方式
[0019]请参阅图1,本申请提出的错题本自动生成方法包括如下步骤。
[0020]步骤S10:将做过的题目(例如作业、习题、试卷等)拍摄为图像,或者输入做过的题目的图像;通过算法定位所述图像中的文档区域的边缘,自动地对所述图像进行裁剪,仅保留所述图像中的文档区域,去除所述图像中的非文档区域。
[0021]所述图像通常为矩形。所述图像中的文档区域是指图像中有字符或图形的区域,仅有一个,通常也为矩形,并且比整个图像的矩形更小。所述图像中的非文档区域是指图像中的空白区域,通常分布在文档区域的四周也就是整个图像的边缘。
[0022]步骤S20:通过神经网络方法对所述图像的文档区域进行检测,将所述图像的文档区域划分为多个子区域,这些子区域分为三类:印刷体子区域、印刷体手写体重叠子区域、手写体子区域。例如采用U

Net图像分割(image segmentation)算法对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种错题本自动生成方法,其特征是,包括如下步骤;步骤S10:将做过的题目拍摄为图像,或者输入做过的题目的图像;对所述图像进行裁剪,仅保留所述图像中的文档区域,去除所述图像中的非文档区域;步骤S20:通过神经网络方法对所述图像的文档区域进行检测,并将所述图像的文档区域划分为多个子区域,这些子区域分为三类:印刷体子区域、印刷体手写体重叠子区域、手写体子区域;步骤S30:基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征,将所述图像的文档区域分割成一个或多个题目区域,同时得到每个题目区域的位置信息;每个题目区域中,均包含题目、答案、批改这三部分内容;所述步骤S20与步骤S30的顺序或者互换,或者同时进行;在步骤S20和步骤S30均执行完毕后,每个题目区域中,均包含印刷体子区域、印刷体手写体重叠子区域、手写体子区域这三类子区域;步骤S40:在每个题目区域中的手写体子区域和印刷体手写体重叠子区域中确定该题目的批改内容;通过已训练的批改内容分类器判断每个题目的批改内容是标记该题目的答案为正确还是错误;步骤S50:在每个题目区域中,运用背景色填充手写体子区域;在每个题目区域中的印刷体手写体重叠子区域中,运用背景色填充手写内容,同时保留印刷内容的完整性;步骤S60:将答案为错误、无手写内容、仅有完整印刷内容的题目生成为错题本。2.根据权利要求1所述的错题本自动生成方法,其特征是,所述步骤S10中,所述图像中的文档区域是指图像中有字符或图形的区域,仅有一个;所述图像中的非文档区域是指图像中的空白区域,分布在所述图像中的文档区域的四周。3.根据权利要求1所述的错题本自动生成方法,其特征是,所述步骤S30中,所述基于神经网络的目标检测算法采用无锚框的目标检测算法,所述印刷体的形态特征是指印刷体的边特征和一致性特征,所述图像的文档区域、印刷体的形态特征共同作为神经网络的输入。4.根据权利要求1所述的错题本自动生成方法,其特征是,在步骤S20和步骤S30均执行完毕后,在一个题目区域中,题目在印刷体子区域或印刷体手写体重叠子区域中,答案在手写体子区域或印刷体手写体重叠子区域中,批改在手写体子区域或印刷体手写体重叠子区域中。5.根据权利要求1所述的错题本自动生成方法,其特征是,所述步骤S40中,所述批改内容分类器采用ResNet

101二分类模型,ResNet

101是具有101...

【专利技术属性】
技术研发人员:曹超阳郭辉辉郭丰俊丁凯张驰李旭阳刘文亮郑齐陆大公龙腾
申请(专利权)人:上海合合信息科技股份有限公司上海生腾数据科技有限公司上海盈五蓄数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1