一种文科解答题自动批改方法技术

技术编号:34635120 阅读:6 留言:0更新日期:2022-08-24 15:08
本发明专利技术公开了一种文科解答题自动批改方法,包括批卷教师将示例答案修改为标准化答案;对标准化答案进行提取处理,获得关键词信息和标准答案的句向量组信息,并对关键词信息和标准答案的句向量信息分别标注分值;获取学生的作答文本,并对作答文本进行语句和词语的分别切分和Embedding工作;将作答的词语与关键词信息对比,获得关键词命中情况,获得关键词赋分;根据关键词命中情况,为语句的语义相似度得分进行范围的划分,并对于语句的语义与标准答案的句向量组相似度进行对比,获得语义相似度赋分;关键词赋分值和语义相似度赋分值之和,即为此回答所获得的总得分。本方案,简便的进行文科试卷的批改过程,减少教师的劳动量。量。量。

【技术实现步骤摘要】
一种文科解答题自动批改方法


[0001]本专利技术涉及文科试卷批改
,具体而言,涉及一种文科解答题自动批改方法。

技术介绍

[0002]作为对学生所掌握知识的熟悉程度进行评估的最常见的方式,考试在传统的教育过程中发挥着举足轻重的作用。在出题、作答、阅卷这一完整的考试流程中,人工阅卷一直是最为繁琐的环节,大量学生的作答不仅为老师带来了巨大的阅卷工作量,且会将人工阅卷可能出现的打分不公平、打分错误的情况也会被进一步放大。而上述困难,在文字量大、作答自由度高的文科解答题的阅卷上尤为突出。
[0003]当下常见的应用于解答题的自动批改的方案,大多仅采用了关键词赋分或相似度赋分中的一种方式。但前者,一方面在面对句式灵活多变、自由度高的真实的学生作答时,老师很难提前提出所有可能出现的关键词;另一方面,哪怕只是简单地大量猜测可能的关键词的答案,这样的方案也有可能给出较高的分数。而对于后者,仅依靠相似度的赋分方式,并不符合教师阅卷时对部分需要严格正确的词句的赋分,例如在语文、历史、政治中分别可以见到的“比拟”与“拟人”、“第一次鸦片战争”与“第二次鸦片战争”、“最基本”与“最根本”等词语的替换,在语义相似度上可以获得很高的评价,但却是错误的作答。
[0004]因此,寻找一个可以合理将上述两种方式进行结合的,自动批改的技术方案,以减轻教师的劳动量,是亟待解决的问题。

技术实现思路

[0005]本专利技术的主要目的在于提供一种文科解答题自动批改方法,以改善相关技术中,现有的批改方法,批改性能差,教师劳动量大的问题。
[0006]为了实现上述目的,本专利技术提供了一种文科解答题自动批改方法,具体包括以下步骤:
[0007]S1、批卷教师将示例答案修改为标准化答案;
[0008]S2、对标准化答案进行提取处理,获得关键词信息和标准答案的句向量组信息,并对关键词信息和标准答案的句向量信息分别标注分值;
[0009]S3、获取学生的作答文本,并对作答文本进行语句和词语的分别切分和Embedding工作;
[0010]S4、将作答的词语与关键词信息对比,获得关键词命中情况,获得关键词赋分;
[0011]S5、根据关键词命中情况,为语句的语义相似度得分进行范围的划分,并对于语句的语义与标准答案的句向量组相似度进行对比,获得语义相似度赋分;
[0012]S6、关键词赋分值和语义相似度赋分值之和,即为此回答所获得的总得分。
[0013]在本专利技术的一种实施例中,所述S3中,获取学生的作答文本,具体包括以下步骤:
[0014]S31、获取学生的答题试卷;
[0015]S32、利用扫描设备扫描答题试卷,获得作答的图片;
[0016]S33、利用OCR文字识别设备,对作答图片中的文字识别,并生成作答文本。
[0017]在本专利技术的一种实施例中,所述S4中,关键词赋分的赋分单位为字词或由数个词组成的短语,关键词赋分包括精确匹配与模糊匹配两种关键词匹配方式。
[0018]在本专利技术的一种实施例中,所述精确匹配为教师所指定的关键词,完全正确地出现在学生作答中,才可对此学生作答进行赋分。
[0019]在本专利技术的一种实施例中,所述模糊匹配包括词语切分、词嵌入与关键词相似度计算三个部分,其中:
[0020]词语切分部分,调用中文分词库jieba库进行词语切分;
[0021]词嵌入部分,使用向量数据集Tencent_AlLab_ChineseEmbedding;
[0022]关键词相似度计算部分,使用动态滑动窗口原理,将窗口尺寸设定为教师指定的模糊匹配关键词中词语个数的0.5

1.5倍,并向上取整,用以在学生作答中选定用于模糊匹配的短语内容,随后计算窗口中的所有词语的词向量的平均值与教师指定的模糊匹配关键词中的所有词语的词向量的平均值,获得两个180

220维的向量,并进行余弦相似度的计算,然后以相似度最高的短语作为匹配对象,若相似度高于设计的阈值,则匹配成功,获得对应分数,反之则匹配失败,不得分。
[0023]在本专利技术的一种实施例中,所述S6中,语义相似度赋分的赋分单位为完整的语句,语义相似度赋分包括示例答案预处理、学生作答预处理和语义相似度计算三个部分,其中:
[0024]示例答案预处理部分,将示例答案中的各个得分点语句进行切分,并借助BERT

whitening模型为各个语句进行句向量的计算;
[0025]学生作答预处理部分,以句号、分号、叹号、问号为分隔,将学生作答进行整句的切分;同时在每个整句内,以逗号为分隔,进行分句的切分;所有的整句与分句均通过BERT

whitening进行句向量的计算;
[0026]语义相似度计算部分,为每个示例答案的得分点语句,在对应的范围内匹配合适的学生作答语句进行余弦相似度的计算。
[0027]在本专利技术的一种实施例中,对应的范围具体分为:
[0028]若该示例答案语句中包括关键词,则系统只会在命中了关键词的学生作答的整句及其所有的分句内尝试匹配;
[0029]否则,将该示例答案语句与学生作答的所有整句及其分句进行尝试匹配。
[0030]在本专利技术的一种实施例中,在语义相似度计算后,根据预先设计的两个阈值,来为每个得分点语句进行完全命中和部分命中的评价,并进行对应的赋分。
[0031]与现有技术相比,本专利技术的有益效果是:
[0032]1、结合了语义与关键词两种批改方式,并支持精确匹配关键词与模糊匹配关键词两种机制,更加符合教师人工阅卷时的赋分逻辑,提升自动批改的性能;
[0033]2、简化了自动批改前的准备工作,使用方式简单,覆盖题目内容范围广,只需在标准答案的基础上进行简单的标准化修改,即可用以自动地大批量自动修改。
附图说明
[0034]图1为根据本专利技术实施例提供的文科解答题自动批改方法的流程结构示意图;
[0035]图2为根据本专利技术实施例提供的文科解答题自动批改方法的作答文本的流程示意图;
[0036]图3为根据本专利技术实施例提供的文科解答题自动批改方法的关键词得分的示意框图;
[0037]图4为根据本专利技术实施例提供的文科解答题自动批改方法的语义相似得分的示意框图。
具体实施方式
[0038]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0039]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文科解答题自动批改方法,其特征在于,具体包括以下步骤:S1、批卷教师将示例答案修改为标准化答案;S2、对标准化答案进行提取处理,获得关键词信息和标准答案的句向量组信息,并对关键词信息和标准答案的句向量信息分别标注分值;S3、获取学生的作答文本,并对作答文本进行语句和词语的分别切分和Embedding工作;S4、将作答的词语与关键词信息对比,获得关键词命中情况,获得关键词赋分;S5、根据关键词命中情况,为语句的语义相似度得分进行范围的划分,并对于语句的语义与标准答案的句向量组相似度进行对比,获得语义相似度赋分;S6、关键词赋分值和语义相似度赋分值之和,即为此回答所获得的总得分。2.如权利要求1所述的一种文科解答题自动批改方法,其特征在于,所述S3中,获取学生的作答文本,具体包括以下步骤:S31、获取学生的答题试卷;S32、利用扫描设备扫描答题试卷,获得作答的图片;S33、利用OCR文字识别设备,对作答图片中的文字识别,并生成作答文本。3.如权利要求1所述的一种文科解答题自动批改方法,其特征在于,所述S4中,关键词赋分的赋分单位为字词或由数个词组成的短语,关键词赋分包括精确匹配与模糊匹配两种关键词匹配方式。4.如权利要求3所述的一种文科解答题自动批改方法,其特征在于,所述精确匹配为教师所指定的关键词,完全正确地出现在学生作答中,才可对此学生作答进行赋分。5.如权利要求3所述的一种文科解答题自动批改方法,其特征在于,所述模糊匹配包括词语切分、词嵌入与关键词相似度计算三个部分,其中:词语切分部分,调用中文分词库jieba库进行词语切分;词嵌入部分,使用向量数据集Tencent_AILab_ChineseEmbedding;关键词相似度计算部分,使用动态滑动窗口原理,将窗口尺寸设定为教师指定的模糊匹配...

【专利技术属性】
技术研发人员:郭子铭钱锟
申请(专利权)人:中教云智数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1