一种客观题的自动阅卷方法技术

技术编号:38761505 阅读:18 留言:0更新日期:2023-09-10 10:34
本发明专利技术公开了一种客观题的自动阅卷方法,包括以下步骤:扫描试卷的客观题部分,得到图片;将答题卡图片的各个客观题答题区域的位置坐标和长宽形成一个矩形截图作为答案识别的目标;通过取反方式,提取选择题和判断题的答题结果;提取其余客观题的答题结果:找出文字/线条;确定字符分类集;输入与分类集对比找出最接近的字符;输出识别结果,用于将所述答题内容与预设正确答案一一对比,确定得分。本发明专利技术中利用对答题卡的切题处理,确定了题目的范围,从而提高对试卷的识别效率和准确率。从而提高对试卷的识别效率和准确率。从而提高对试卷的识别效率和准确率。

【技术实现步骤摘要】
一种客观题的自动阅卷方法


[0001]本专利技术属于教育信息化
,尤其涉及一种客观题的自动阅卷方法。

技术介绍

[0002]随着电子信息的发达,计算机自动识别答题卡客观题完成自动阅卷已经逐渐取代人工阅卷,因为人工阅卷有误差,工作量大且效率低下,非常耗费阅卷老师的精力。使用计算机自动识别答题卡客观题来辅助老师阅卷,可以大大提高工作效率,降低客观题的阅卷失败概率。目前题目识别采用机器学习方式,需要大量训练数据,效率低下。此外,现有技术中需要根据答题卡图片中三个黑色方块进行宏观定位,将答题卡图片裁剪缩放成统一的尺寸;根据每行选项最右端的黑色条形方块和最上方的黑色正方块,对答题卡图片上填涂的选项坐标进行识别,并根据各选项识别的像素大小,确定出客观题的答题结果;直至将答题卡图片中的全部问题识别完成;将识别出的填涂结果绘制成矩阵;分析数据结果,统计出作答成绩。
[0003]现有考试中一般使用的答题卡大多需要使用特定的扫描设备进行扫描,专用扫描设备价格高,需要专业的技术人员进行维护操作,并且扫描设备对答题卡的模板也有一定的限制和要求,需要教师有一定的计算机能力设计制作合适的答题卡,因此扫描设备兼容性较差,速度较慢,无法实现对多种类型答题卡的识别。答题卡阅卷主要利用的原理是红外线扫描,而红外线对碳元素非常敏感,因而能识别出2B铅笔填涂的答案。对于答题卡上客观题的填涂,扫描设备很难区分是否为擦涂,对不规范填涂的识别能力较差。此外,在扫描设备进行填涂识别之后,无法实现答题人成绩的统计,自动化程度不高。

技术实现思路

[0004]本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提出了一种客观题的自动阅卷方法,为用户提供一种既方便又低廉的客观题阅卷方法。
[0005]本专利技术公开的一种客观题的自动阅卷方法,包括以下步骤:
[0006]扫描试卷的客观题部分,得到图片;
[0007]将答题卡图片的各个客观题答题区域的位置坐标和长宽形成一个矩形截图作为答案识别的目标;
[0008]通过取反方式,提取选择题和判断题的答题结果;
[0009]提取其余客观题的答题结果:找出文字/线条;确定字符分类集;输入与分类集对比找出最接近的字符;
[0010]输出识别结果,用于将所述答题内容与预设正确答案一一对比,确定得分。
[0011]进一步地,对截图中字母或符号进行识别方法具体为:
[0012]因为单选题和多选题选项为ABCD,判断题为√和
×
;识别答题卡中被识别出的选项,再进行取反,得到答题卡的答题结果。
[0013]进一步地,对于填空题,从答题卡中抽取一个或多个关键词,与标准答案中的关键
词进行比对,如果关键词之间存在依赖关系,则进一步比对关键词的顺序。
[0014]进一步地,所述依赖关系包括句间依赖关系和句内依赖关系。
[0015]本专利技术的有益效果如下:
[0016]本专利技术减少了前期准备的成本,并且利用识别技术对任一类型的试客观题进行识别及结构化处理,从而准确定位题目范围、类型及答案,大大减少了人力成本,提高了阅卷效率,拓宽了应用范围。综上所述,本专利技术能在减少成本的前提下准确识别答题卡内容,大大减轻了使用者的工作量。
[0017]本专利技术中利用对答题卡的切题处理,确定了题目的范围,从而提高对试卷的识别效率和准确率。
[0018]本专利技术简便易用的流程,提供从布置任务、生成试卷、上传答卷到智能批改的全流程系统,老师和学生可以轻松的进行各环节的操作,提升了用户体验。
附图说明
[0019]图1本专利技术的自动阅卷方法流程图;
[0020]图2本专利技术的答题卡示意图。
具体实施方式
[0021]下面结合附图对本专利技术作进一步的说明,但不以任何方式对本专利技术加以限制,基于本专利技术教导所作的任何变换或替换,均属于本专利技术的保护范围。
[0022]本专利技术的解决方案流程如下:
[0023]第一步:图片输入:
[0024]①
基于模式识别
[0025]②
将纸质答题卡的各个客观题答题区域的位置坐标(x坐标和y坐标)和长宽形成一个矩形截图作为答案识别的目标。
[0026]第二步:有用信息提取:
[0027]①
采用opencv作为工具,对截图中字母或符号进行识别。一般单选择题和多选择题为ABCD,判断题为√和
×

[0028]②
因为答题卡是采用涂抹选型的方式进行作答,因此识别出来有的字母或符号,则意味没有被涂掉,从而可以推断出缺少的字母或符号是哪些,进而判断答题结果。
[0029]③
为了保障识别的质量,我们采用取反的方式。如下图所示,经过引擎识别后,结果为【01】ABC,那么此题答案即D。因为D被涂掉了,所以D不在识别的值域里,如果正确答案为C,则该答题卡的答案错误。如果结果为【01】AB,则该答题卡的答案为C、D,如果正确答案为C,则该答题卡的答案错误。
[0030]第三步:输出识别结果
[0031]①
找出文字/线条;
[0032]②
确定字符分类集;
[0033]③
输入与分类集对比找出最接近的字符;
[0034]④
输出识别结果,用于将所述答题内容与预设正确答案一一对比,确定客观题得分。
[0035]优选地,本实施例使用Tesseract进行识别,Tesseract经过一系列样本或字体的训练,来提升ocr的识别精度。
[0036]对于填空题,从答题卡中抽取一个或多个关键词,与标准答案中的关键词进行比对,如果关键词之间存在依赖关系,则进一步比对关键词的顺序。
[0037]优选地,所述依赖关系包括句间依赖关系和句内依赖关系,依赖关系包括前后关系、限定关系。前后关系指两个关键词之间有先后,限定关系指一个关键词用于限定另一个关键词。
[0038]图2为通过在此答题卡进行客观题作答,基于模式识别把客观题作答区域形成矩形截图作为客观题识别区域。然后通过Tesseract作为ocr工具对有用信息的提取,输出识别结果。当然Tesseract本身可以经过一系列样本或字体的训练,来提升ocr的识别精度。
[0039]本专利技术的有益效果如下:
[0040]本专利技术减少了前期准备的成本,并且利用识别技术对任一类型的试客观题进行识别及结构化处理,从而准确定位题目范围、类型及答案,大大减少了人力成本,提高了阅卷效率,拓宽了应用范围。综上所述,本专利技术能在减少成本的前提下准确识别答题卡内容,大大减轻了使用者的工作量。
[0041]本专利技术中利用对答题卡的切题处理,确定了题目的范围,从而提高对试卷的识别效率和准确率。
[0042]本专利技术简便易用的流程,提供从布置任务、生成试卷、上传答卷到智能批改的全流程系统,老师和学生可以轻松的进行各环节的操作,提升了用户体验。
[0043]本文所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种客观题的自动阅卷方法,其特征在于,包括以下步骤:扫描试卷的客观题部分,得到图片;将答题卡图片的各个客观题答题区域的位置坐标和长宽形成一个矩形截图作为答案识别的目标;通过取反方式,提取选择题和判断题的答题结果;提取其余客观题的答题结果:找出文字/线条;确定字符分类集;输入与分类集对比找出最接近的字符;输出识别结果,用于将所述答题内容与预设正确答案一一对比,确定得分。2.根据权利要求1所述的客观题的自动阅卷方法,其特征在于,对截图中字母或符号进行识别方...

【专利技术属性】
技术研发人员:孟秋杰
申请(专利权)人:湖南墨思博教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1