一种自动阅卷方法及系统技术方案

技术编号:33129209 阅读:13 留言:0更新日期:2022-04-17 00:43
本发明专利技术涉及一种自动阅卷方法及系统,其中自动阅卷方法包括:构建文本识别模型并进行训练;获取待阅卷的试卷,输入文本识别模型,获得文本识别结果;将文本识别结果和参考答案分别进行文本编码;对文本识别结果与参考答案进行相似度计算,获得两者相似度;根据相似度数值进行打分。与现有技术相比,本发明专利技术具有自动化程度高、文字识别效果好等优点。文字识别效果好等优点。文字识别效果好等优点。

【技术实现步骤摘要】
一种自动阅卷方法及系统


[0001]本专利技术涉及自动阅卷
,尤其是涉及一种自动阅卷方法及系统。

技术介绍

[0002]机器学习一直都在记录中协助批改单选、多选题类型,这项技术做得很好。但在实际上生活中,尤其在高考,中考等国家大型考试中,例如地理,政治,语文等的试卷,存在大量的除选择题以外的问答题,阅卷老师们既要在指定的时间内完成批改试卷的任务,又要最大化保证评审的正确性,因此在阅卷期间,老师们的时间和精力受到极大的损耗,因此目前亟需一种能够进行自动阅卷的方法。

技术实现思路

[0003]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种自动化程度高、文字识别效果好的自动阅卷方法及系统。
[0004]本专利技术的目的可以通过以下技术方案来实现:
[0005]一种自动阅卷方法,所述的自动阅卷方法包括:
[0006]步骤1:构建文本识别模型并进行训练;
[0007]步骤2:获取待阅卷的试卷,输入文本识别模型,获得文本识别结果;
[0008]步骤3:将文本识别结果和参考答案分别进行文本编码;
[0009]步骤4:对文本识别结果与参考答案进行相似度计算,获得两者相似度;
[0010]步骤5:根据相似度数值进行打分。
[0011]优选地,所述的文本识别模型具体为:
[0012]首先,采用文字检测子模型检测试卷的文字;
[0013]然后,采用文本识别子模型对文字进行识别。
[0014]更加优选地,所述的文字检测子模型具体为DBnet模型。
[0015]更加优选地,所述的文本识别子模型具体为CRNN

CTC模型。
[0016]优选地,所述的文本识别子模型还包括BiLSTM模型,该模型用于对文字进行双向识别。
[0017]优选地,所述的步骤3具体为:采用BERT模型分别对文本识别结果和参考答案进行文本编码。
[0018]优选地,所述的步骤4具体为:采用余弦相似度对文本识别结果与参考答案进行相似度计算。
[0019]更加优选地,所述余弦相似度的计算方法为:
[0020][0021]其中,cos(θ)为余弦相似度;a和b分别为文本识别结果和参考答案的文本编码。
[0022]优选地,所述的步骤5具体为:
[0023]若相似度数值为[0.8,1],则该题目的得分为满分;
[0024]若相似度数值为[0.6,0.8),则该题目的得分为满分的70%;
[0025]若相似度数值为[0.4,0.6),则该题目的得分为满分的50%;
[0026]若相似度竖直为[0,0.4),则该题目的得分为零分。
[0027]一种用于上述自动阅卷方法的自动阅卷系统,所述的自动阅卷系统包括:
[0028]文本检测模块,采用DBnet模型对待阅卷的试卷进行文本检测;
[0029]文本识别模块,采用CRNN

CTC模型配合BiLSTM模型对检测出的文本进行文本识别;
[0030]文本编码模块,采用BERT模型分别对文本识别结果和参考答案进行文本编码相似度计算模块,计算文本识别结果编码与参考答案编码的余弦相似度;
[0031]分值计算模块,根据余弦相似度数值以及预设的分段函数确定每道题目的得分。
[0032]与现有技术相比,本专利技术具有以下有益效果:
[0033]一、自动化程度高:本专利技术中的自动阅卷方法及系统通过文字检测、文字识别、文字编码以及相似度的计算即可实现自动阅卷,有效实现了阅卷的自动化。
[0034]二、文字识别效果好:本专利技术中的自动阅卷方法及系统采用CRNN

CTC模型配合BiLTSM模型的方式进行文字识别,文字识别的准确率大大提高。
附图说明
[0035]图1为本专利技术中自动阅卷方法的流程示意图。
具体实施方式
[0036]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术的一部分实施例,而不是全部实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本专利技术保护的范围。
[0037]一种自动阅卷方法,其流程如图1所示,包括:
[0038]步骤1:构建文本识别模型并进行训练;
[0039]步骤2:获取待阅卷的试卷,输入文本识别模型,获得文本识别结果;
[0040]首先,采用文字检测子模型检测试卷的文字;
[0041]然后,采用文本识别子模型对文字进行识别;
[0042]步骤3:将文本识别结果和参考答案分别进行文本编码;
[0043]步骤4:对文本识别结果与参考答案进行相似度计算,获得两者相似度;
[0044]步骤5:根据相似度数值进行打分。
[0045]本实施例中的文字检测子模型具体为DBnet模型,文本识别子模型具体为CRNN

CTC模型,同时文字识别子模型还包括BiLSTM模型,该模型用于对文字进行双向识别。采用BERT模型分别对文本识别结果和参考答案进行文本编码。
[0046]步骤4采用余弦相似度对文本识别结果与参考答案进行相似度计算。
[0047]余弦相似度的计算方法为:
[0048]三角形中边a和边b的夹角的余弦计算公式为:
[0049][0050]在向量表示的三角形中,假设a向量是(x1,y1),b向量是(x2,y2),那么可以将余弦定理改写成下面的形式:
[0051][0052]如果向量a和向量b不是二维而是n维,上述余弦的计算法仍然正确。假设a和b是两个n维向量,则a与b的夹角的余弦等于:
[0053][0054]其中,cos(θ)为余弦相似度;a和b分别为文本识别结果和参考答案的文本编码。
[0055]步骤5具体为:
[0056]若相似度数值为[0.8,1],则该题目的得分为满分;
[0057]若相似度数值为[0.6,0.8),则该题目的得分为满分的70%;
[0058]若相似度数值为[0.4,0.6),则该题目的得分为满分的50%;
[0059]若相似度竖直为[0,0.4),则该题目的得分为零分。
[0060]本实施例还涉及一种自动阅卷系统,包括:
[0061]文本检测模块,采用DBnet模型对待阅卷的试卷进行文本检测;
[0062]文本识别模块,采用CRNN

CTC模型配合BiLSTM模型对检测出的文本进行文本识别;
[0063]文本编码模块,采用BERT模型分别对文本识别结果和参考答案进行文本编码相似度计算模块,计算文本识别结果编码与参考答案编码的余弦相似度;
[0064]分值计算模块,根据余弦相似度数值以及预设的分段函数确定每道题目的得分。
[0065]本实施例中的自动阅卷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动阅卷方法,其特征在于,所述的自动阅卷方法包括:步骤1:构建文本识别模型并进行训练;步骤2:获取待阅卷的试卷,输入文本识别模型,获得文本识别结果;步骤3:将文本识别结果和参考答案分别进行文本编码;步骤4:对文本识别结果与参考答案进行相似度计算,获得两者相似度;步骤5:根据相似度数值进行打分。2.根据权利要求1所述的一种自动阅卷方法,其特征在于,所述的文本识别模型具体为:首先,采用文字检测子模型检测试卷的文字;然后,采用文本识别子模型对文字进行识别。3.根据权利要求2所述的一种自动阅卷方法,其特征在于,所述的文字检测子模型具体为DBnet模型。4.根据权利要求2所述的一种自动阅卷方法,其特征在于,所述的文本识别子模型具体为CRNN

CTC模型。5.根据权利要求4所述的一种自动阅卷方法,其特征在于,所述的文本识别子模型还包括BiLSTM模型,该模型用于对文字进行双向识别。6.根据权利要求1所述的一种自动阅卷方法,其特征在于,所述的步骤3具体为:采用BERT模型分别对文本识别结果和参考答案进行文本编码。7.根据权利要求1所述的一种自动阅卷方法,其特征在于,所述的步骤4具体为...

【专利技术属性】
技术研发人员:刘云翔朱建林原鑫鑫王春娅
申请(专利权)人:上海应用技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1