一种主观题自动判题方法技术

技术编号:36086326 阅读:15 留言:0更新日期:2022-12-24 11:01
本发明专利技术公开了一种主观题自动判题方法,包括以下过程:a.构建词汇库数据模型A和近义词库数据模型B;b.提取主观题标题和标准答案,生成标准答案关键词二维数组tp;c.提取学生作题的答案,生成学生答案词汇组二维数组sp;d.轮询学生答案语句,将答案词汇组二维数组sp与标准答案关键词二维数组tp比较得出每句答案的匹配程度,计算得到总关键词得分系数roe;e.将标准答案每句关键词组去掉其中与学生答案重复的元素,得到学生答案中未匹配到的关键词组wp;f.轮询wp的各个词汇,计算得到总近义词得分系数qs;g.综合总关键词得分系数roe和总近义词得分系数,得到最终分数。本发明专利技术方法扩大了匹配域,使判题算法更加精确,有效的简化了教师工作,提高教学效率。提高教学效率。提高教学效率。

【技术实现步骤摘要】
一种主观题自动判题方法


[0001]本专利技术涉及教育平台信息化
,具体涉及一种主观题自动判题方法。

技术介绍

[0002]现有的教育专业信息平台,通过电脑端和手机端全面助力教师备课、教学、师生互动,并且实现了客观题的自动批改,但是对于主观题,由于答案的不唯一性,现有的信息平台无法实现自动批改,采用人工批改的方式,教师工作繁重。
[0003]公开号为CN108959261A的专利公开了:“基于自然语言的试卷主观题判题装置及方法”公开了:“通过词性标注模块对分词处理后的子句形成的单词进行词性标注,再用关键词抽取模块对词性标注模块词性标注后的单词进行关键词提取,用句法分析模块对分句处理后的子句进行句法分析,解析出子句的句法结构信息。”该方案对于某些主观题并不适用,且词性标注和句法结构的不统一容易导致误判。

技术实现思路

[0004]本专利技术的目的在于公开一种主观题自动判题方法,以实现对主观题的自动批改工作,提高教学效率。
[0005]为达此目的,本专利技术采用以下技术方案:一种主观题自动判题方法,包括以下过程:
[0006]一种主观题自动判题方法,其特征在于,包括以下过程:
[0007]a.构建词汇库数据模型A和近义词库数据模型B。
[0008]b.提取主观题标题和标准答案,将标准答案分割为语句集合Q,将每条语句Q(x)按词汇库数据模型A分割得到该句关键词组,每一条语句中分割得到的所有关键词为一个词汇组 tp(x),集合所有词汇组生成标准答案关键词二维数组tp。
[0009]c.提取学生作题的答案,将答案分割为语句集合Z,将每条语句Z(x)按词汇库数据模型A 分割得到该句关键词组,每一条语句中分割得到的所有关键词为一个词汇组sp(x),集合所有词汇组生成学生答案词汇组二维数组sp。
[0010]d.轮询学生答案语句,将学生答案词汇组二维数组sp与标准答案关键词二维数组tp比较得出每句答案的匹配程度,计算得到总关键词得分系数roe。
[0011]e.将标准答案每句关键词组去掉其中与学生答案重复的词汇,得到标准答案中未匹配到的关键词组wp;将学生答案每句词汇组中去掉已经匹配的关键词,得到未匹配的学生答案词汇。
[0012]f.轮询wp的各个词汇,在近义词库数据模型B查询,得到该元素的近义词库,求得未匹配的关键词与未匹配的学生答案词汇的匹配程度,计算得到总近义词得分系数qs。
[0013]g.综合总关键词得分系数roe和总近义词得分系数qs,得到最终分数。
[0014]进一步的,计算总关键词得分系数的具体方法为:
[0015]d1.将标准答案关键词二维数组tp中的每一条语句tp(x)设置语句权重系数a,将
每一条语句tp(x)中的每一个关键词进行筛选,设置关键词在该语句中的权重系数b,则通过下式计算该关键词的权重系数coe:
[0016]coe=a
×
b。
[0017]d2.将学生答案词汇组二维数组sp中的每一条语句sp(x)与标准答案关键词二维数组tp 中的每一条语句tp(x)进行比较,筛选出相同关键词的数量,计算每条语句的关键词得分系数,然后相加计算得到总关键词得分系数roe,即公式如下:
[0018][0019]其中,f(x)为求得数组元素的个数。
[0020]进一步的,计算总近义词得分系数的具体方法为:
[0021]f1.在近义词库数据模型B中,每一对近义词,都设置各自的近义系数pe。
[0022]f2.将每一条标准答案语句中未匹配到的关键词组wp(x)与每一条未匹配的学生答案词汇,在近义词库数据模型B查询是否为匹配的近义词,若匹配到近义词,计算该近义词得分系数qs(x),将所有近义词得分系数相加计算得到总近义词得分系数qs,即公式如下:
[0023][0024]其中,主观题最终得分score采用下式计算:score=s(roe+qs),其中s为题目总分。
[0025]进一步的,还包括语句相似度系数,将标准答案的所有关键词与学生答案的所有词汇进行相似度比较,得到语句相似度系数;综合关键词得分系数roe、近义词得分系数qs及语句相似度系数,得到校正的最终分数score


[0026]语句相似度系数的计算方法如下:
[0027]将标准答案关键词二维数组tp全部加入到一个新的一维数组,将此一维数组分别与标准答案和学生答案比较得到每个词汇的词频,转为标准答案词频向量x和学生答案词频向量y;根据两个向量即可得出两个答案的余弦相似度,即得到语句相似度系数,公式如下:
[0028][0029]设定语句相似度得分权重为p,则校正的最终分数score

的公式如下:
[0030]score=s(roe+qs)+s
×
p
×
cosθ。
[0031]优选的,当主观题的最终得分score少于题目总分s的一半时,引入语句相似度系数,计算校正的最终分数score


[0032]优选的,在过程b中提取主观题标题,将主观题标题与词汇库数据模型A进行匹配,得到标题词汇组T;若Q(x)与T有交集元素,则将该交集元素设置为Q(x)中的主体关键词,含主体关键词的语句须同时包含任意其他关键词才得分,只含主体关键词不得分。
[0033]其中,所述近义词库数据模型B由通用的近义词汇及人工完善的近义词汇组成,在过程 g计算学生答案的最终得分后,对最终得分进行人工检查,若由于学生答案中的关键词或语句引起误判,由人工进行评分更改,填写更正原因,同时形成人工完善的近义词汇加入至近义词库数据模型B中。
[0034]优选的,提取标准答案或者学生作题的答案,将标准答案或者学生作题的答案通过换行符或句号分割为多条语句集合,再将每一条语句集合中的语句经过A筛选分割得到若干词汇,去掉其中的代词和助词,即得到关键词组。
[0035]优选的,在计算关键词得分系数时轮询答案语句,将答案词汇组二维数组sp(x)与标准答案关键词二维数组tp(x)比较时,若得到的答案词汇组在关键词前带有否定词,则该答案语句不得分。
[0036]本专利技术的有益效果为:
[0037]1、本专利技术通过关键词匹配,关键词的近义词匹配的方法,进行学生答案的正确率判别,扩大了匹配域,使判题算法更加精确。有效的简化了教师工作,节约教师资源,提高教学效率。
[0038]2、本专利技术通过基于原始关键词的比较逻辑,结合大数据,可不断进行修正,自动判题更趋于准确。
[0039]3、本专利技术通过引入语句相似度系数,当计算得到的最终分数较低时,通过这一系数,计算校正的最终分数,可进一步微调最终分数,提升主观题判题的灵活度。
附图说明
[0040]图1是构建词汇库数据模型A的示意图。
[0041]图2是构建近义词库数据模型B的示意图。
[0042]图3是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种主观题自动判题方法,其特征在于,包括以下过程:a.构建词汇库数据模型A和近义词库数据模型B;b.提取主观题标题和标准答案,将标准答案分割为语句集合Q,将每条语句Q(x)按词汇库数据模型A分割得到该句关键词组,每一条语句中分割得到的所有关键词为一个词汇组tp(x),集合所有词汇组生成标准答案关键词二维数组tp;c.提取学生作题的答案,将答案分割为语句集合Z,将每条语句Z(x)按词汇库数据模型A分割得到该句关键词组,每一条语句中分割得到的所有关键词为一个词汇组sp(x),集合所有词汇组生成学生答案词汇组二维数组sp;d.轮询学生答案语句,将学生答案词汇组二维数组sp与标准答案关键词二维数组tp比较得出每句答案的匹配程度,计算得到总关键词得分系数roe;e.将标准答案每句关键词组去掉其中与学生答案重复的词汇,得到标准答案中未匹配到的关键词组wp;将学生答案每句词汇组中去掉已经匹配的关键词,得到未匹配的学生答案词汇;f.轮询wp的各个词汇,在近义词库数据模型B查询,得到该元素的近义词库,求得未匹配的关键词与未匹配的学生答案词汇的匹配程度,计算得到总近义词得分系数qs;g.综合总关键词得分系数roe和总近义词得分系数qs,得到最终分数。2.如权利要求1所述的主观题自动判题方法,其特征在于,计算总关键词得分系数的具体方法为:d1.将标准答案关键词二维数组tp中的每一条语句tp(x)设置语句权重系数a,将每一条语句tp(x)中的每一个关键词进行筛选,设置关键词在该语句中的权重系数b,则通过下式计算该关键词的权重系数coe:coe=a
×
bd2.将学生答案词汇组二维数组sp中的每一条语句sp(x)与标准答案关键词二维数组tp中的每一条语句tp(x)进行比较,筛选出相同关键词的数量,计算每条语句的关键词得分系数,然后相加计算得到总关键词得分系数roe,即公式如下:其中,f(x)为求得数组元素的个数。3.如权利要求2所述的主观题自动判题方法,其特征在于,计算总近义词得分系数的具体方法为:f1.在近义词库数据模型B中,每一对近义词,都设置各自的近义系数pe;f2.将每一条标准答案语句中未匹配到的关键词组wp(x)与每一条未匹配的学生答案词汇,在近义词库数据模型B查询是否为匹配的近义词,若匹配到近义词,计算该近义词得分系数qs(x),将所有近义词得分系数相加计算得到总近义词得分系数qs,即公式如下:分系数qs(x),将所有近义词得分系数相加计算得到总近义词得分系数qs,即公式如下:
...

【专利技术属性】
技术研发人员:余兴李海林郭毓剑季骁龙
申请(专利权)人:幼之幼厦门教育科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1