一种错题本自动生成方法及装置制造方法及图纸

技术编号：33131637 阅读：28 留言：0更新日期：2022-04-17 00:49

本申请公开了一种错题本自动生成方法。对题目图像进行智能裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域。通过神经网络方法对所述图像的文档区域进行检测，并将所述图像的文档区域划分为三类子区域。基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息。在每个题目区域中确定该题目的批改内容并分类。在每个题目区域中，去除手写内容。将答案为错误、无手写内容、仅有完整印刷内容的题目生成为错题本。本申请实现了自动获取每个错题的坐标，无需人工调整错题坐标，生成错题本的效率更高。错题本的效率更高。错题本的效率更高。

全部详细技术资料下载

【技术实现步骤摘要】
一种错题本自动生成方法及装置

[0001]本申请涉及一种基于神经网络(Neural Network，NN)的错题本自动生成的方法。

技术介绍

[0002]错题本，也称错题集、改错本、纠错本、摘错本等，是指将学生做过的作业、习题、试卷中的错题摘取出来整理而成的文件。
[0003]现有的错题本生成方法中，需要用户手动框选错题范围，也就是手动确定包含错题的矩形区域的范围。这个过程中用户需要不断调整错题范围的坐标，选择一道错题的耗时通常在10秒以上。

技术实现思路

[0004]本申请所要解决的技术问题是提出一种错题本自动生成的方法，可以显著提高错题本整理的灵活性和效率。
[0005]为解决上述技术问题，本申请提出了一种错题本自动生成方法，包括如下步骤。步骤S10：将做过的题目拍摄为图像，或者输入做过的题目的图像；对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域。步骤S20：通过神经网络方法对所述图像的文档区域进行检测，并将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域。步骤S30：基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息；每个题目区域中，均包含题目、答案、批改这三部分内容。所述步骤S20与步骤S30的顺序或者互换，或者同时进行；在步骤S20和步骤S30均执行完毕后，每个题目区域中，均包含印刷体子区域、印刷体手写体...

【技术保护点】

【技术特征摘要】
1.一种错题本自动生成方法，其特征是，包括如下步骤；步骤S10：将做过的题目拍摄为图像，或者输入做过的题目的图像；对所述图像进行裁剪，仅保留所述图像中的文档区域，去除所述图像中的非文档区域；步骤S20：通过神经网络方法对所述图像的文档区域进行检测，并将所述图像的文档区域划分为多个子区域，这些子区域分为三类：印刷体子区域、印刷体手写体重叠子区域、手写体子区域；步骤S30：基于已训练的基于神经网络的目标检测算法并结合印刷体的形态特征，将所述图像的文档区域分割成一个或多个题目区域，同时得到每个题目区域的位置信息；每个题目区域中，均包含题目、答案、批改这三部分内容；所述步骤S20与步骤S30的顺序或者互换，或者同时进行；在步骤S20和步骤S30均执行完毕后，每个题目区域中，均包含印刷体子区域、印刷体手写体重叠子区域、手写体子区域这三类子区域；步骤S40：在每个题目区域中的手写体子区域和印刷体手写体重叠子区域中确定该题目的批改内容；通过已训练的批改内容分类器判断每个题目的批改内容是标记该题目的答案为正确还是错误；步骤S50：在每个题目区域中，运用背景色填充手写体子区域；在每个题目区域中的印刷体手写体重叠子区域中，运用背景色填充手写内容，同时保留印刷内容的完整性；步骤S60：将答案为错误、无手写内容、仅有完整印刷内容的题目生成为错题本。2.根据权利要求1所述的错题本自动生成方法，其特征是，所述步骤S10中，所述图像中的文档区域是指图像中有字符或图形的区域，仅有一个；所述图像中的非文档区域是指图像中的空白区域，分布在所述图像中的文档区域的四周。3.根据权利要求1所述的错题本自动生成方法，其特征是，所述步骤S30中，所述基于神经网络的目标检测算法采用无锚框的目标检测算法，所述印刷体的形态特征是指印刷体的边特征和一致性特征，所述图像的文档区域、印刷体的形态特征共同作为神经网络的输入。4.根据权利要求1所述的错题本自动生成方法，其特征是，在步骤S20和步骤S30均执行完毕后，在一个题目区域中，题目在印刷体子区域或印刷体手写体重叠子区域中，答案在手写体子区域或印刷体手写体重叠子区域中，批改在手写体子区域或印刷体手写体重叠子区域中。5.根据权利要求1所述的错题本自动生成方法，其特征是，所述步骤S40中，所述批改内容分类器采用ResNet
‑
101二分类模型，ResNet
‑
101是具有101...

【专利技术属性】
技术研发人员：曹超阳，郭辉辉，郭丰俊，丁凯，张驰，李旭阳，刘文亮，郑齐，陆大公，龙腾，
申请(专利权)人：上海合合信息科技股份有限公司上海生腾数据科技有限公司上海盈五蓄数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人