一种新增试题的知识点标注方法及系统技术方案

技术编号:22387507 阅读:34 留言:0更新日期:2019-10-29 06:33
本发明专利技术公开了一种新增试题的知识点标注方法及系统。新增试题的知识点标注方法包括:获取新增试题,遍寻样本库寻找与新增试题相似的相似题得到相似题组;根据相似题组对新增试题进行知识点标注:当最相似试题对应的相似度在第一级别范围内时,将位于第一级别范围内的相似度对应的相似题判定为第一待利用试题,将其对应的知识点赋予新增试题;当最相似试题对应的相似度在第二级别范围内时,将相似题组中的试题判定为第二待利用试题,将其对应的所有知识点中出现次数最多的知识点赋予新增试题,判断剩余知识点中与出现次数最多的知识点最可能同时出现的p个知识点,将p个知识点也赋予新增试题。本发明专利技术能够提升知识点标注的效率,节约时间和费用。

A marking method and system of knowledge points for new test questions

【技术实现步骤摘要】
一种新增试题的知识点标注方法及系统
本专利技术涉及教育
,更具体地,涉及一种新增试题的知识点标注方法及系统。
技术介绍
现有技术中,当在试题题库中增加新试题时,通常采用人工标注的方式对新增试题标注知识点。这种人工标注知识点的方式,通常需要有丰富教学研究经验的教师,对各科试题进行人工判断,来进行具体知识点的标注,从而达到较高的准确度。然而,采用人工标注的方式效率低且费用成本高昂。因此,提供一种新增试题的知识点标注方法及系统,提升知识点标注的效率,节约时间和费用,并且同时保证较高的准确性,是本领域亟待解决的技术问题。
技术实现思路
有鉴于此,本专利技术提供了一种新增试题的知识点标注方法及系统,解决了上述技术问题。第一方面,本专利技术提供一种新增试题的知识点标注方法,包括:获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,所述样本库中的试题均为待判断试题,一道所述待判断试题对应n个知识点,n为正整数,且n≥1,具体包括:确定所述新增试题的重要关键字符记为第一字符串,确定所述待判断试题的重要关键字符记为第二字符串,所述重要关键字符为新增、替换或者修改后会改变试题含义或者类型的字符;计算所述第一字符串和所述第二字符串之间的加权编辑距离,所述加权编辑距离为所述第一字符串和所述第二字符串之间相互转化的最少的加权操作次数;根据所述加权编辑距离计算所述新增试题与所述待判断试题之间的相似度r;当相似度r大于等于第一阈值时,相似度r所对应的所述待判断试题为所述相似题;遍寻所述样本库得到所述相似题组,所述相似题组包括m道所述相似题,m为正整数,且m≥1;根据所述相似题组对所述新增试题进行知识点标注,具体包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,将位于第一级别范围内的相似度r对应的所述相似题判定为第一待利用试题,将所述第一待利用试题对应的知识点赋予所述新增试题;当所述相似题组中最相似试题对应的相似度r在第二级别范围内时,将所述相似题组中的试题判定为第二待利用试题,将在所述第二待利用试题对应的所有知识点中出现次数最多的知识点赋予所述新增试题,然后根据两个知识点同时出现的置信度,判断所述第二待利用试题对应的剩余知识点中与所述出现次数最多的知识点最可能同时出现的p个知识点,将所述p个知识点也赋予所述新增试题,p为正整数,且p≥1;其中,最相似试题为所述相似题组中相似度r最大的试题,所述第一级别范围的相似度大于第二级别范围的相似度。可选的,相似度r的计算公式为:r=(sum-dist)/sum,其中,sum为所述第一字符串和所述第二字符串的长度总和,dist为所述加权编辑距离。可选的,所述两个知识点同时出现的置信度的计算方法为:统计所述样本库中,两个知识点在同一道题中同时出现的次数q;根据所述次数q计算所述置信度D,其中,D=R*q,R正相关系数。可选的,获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,进一步包括:将样本库中试题按题型进行分类为子样本库,一个所述子样本库中仅包括一种题型的试题;获取新增试题,根据所述新增试题的题型,遍寻相应的所述子样本库寻找与所述新增试题相似的相似题,得到相似题组。可选的,根据所述相似题组对所述新增试题进行知识点标注,还包括:当所述相似题组中最相似试题对应的相似度r在第二级别范围内,且所述相似题组中的所述相似题均各自对应一个知识点时,将所述相似题组对应的所有知识点均赋予所述新增试题。可选的,根据所述相似题组对所述新增试题进行知识点标注,还包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,根据相似度r由大到小对所述相似题进行排序,将最多前5道相似度r位于第一级别范围内的所述相似题判定为所述第一待利用试题;当所述相似题组中最相似试题对应的相似度r在第二级别范围内时,根据相似度r由大到小对所述相似题进行排序,将最多前5道所述相似题判定为所述第二待利用试题。可选的,确定所述新增试题的重要关键字符记为第一字符串,确定待判断试题的重要关键字符记为第二字符串的步骤包括:采用词频-逆文档频度模型构建重要关键字字符库;根据所述重要关键字字符库确定所述第一字符串和所述第二字符串。可选的,所述样本库中试题的来源至少包括:例题、课后习题、模拟题、期中考试试题、期末考试试题、升学考试真题。可选的,根据所述相似题组对所述新增试题进行知识点标注,进一步包括:将知识点赋予所述新增试题时,相同的知识点仅赋予一次。第二方面,本专利技术还提供一种新增试题的知识点标注系统,包括:相似题寻找模块、知识点标注模块;其中,所述相似题寻找模块,用于获取新增试题,并遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,所述样本库中的试题均为待判断试题,一道所述待判断试题对应n个知识点,n为正整数,且n≥1,包括:重要关键字符确定模块、加权编辑距离计算模块、相似度计算模块、相似题组生成模块;所述重要关键字符确定模块,与所述加权编辑距离计算模块相连接,用于确定所述新增试题的重要关键字符记为第一字符串,确定所述待判断试题的重要关键字符记为第二字符串,并将所述第一字符串和所述第二字符串发送给所述加权编辑距离计算模块,所述重要关键字符为新增、替换或者修改后会改变试题含义或者类型的字符;所述加权编辑距离计算模块,与所述相似度计算模块相连接,用于计算所述第一字符串和所述第二字符串之间的加权编辑距离,并将所述加权编辑距离发送给所述相似度计算模块,所述加权编辑距离为所述第一字符串和所述第二字符串之间相互转化的最少的加权操作次数;所述相似度计算模块,与所述相似题组生成模块相连接,用于根据所述加权编辑距离计算所述新增试题与所述待判断试题之间的相似度r,并将相似度r的计算结果发送给所述相似题组生成模块;所述相似题组生成模块,用于接收相似度r的计算结果并判断,当相似度r大于等于第一阈值时,相似度r所对应的所述待判断试题为所述相似题,遍寻所述样本库得到所述相似题组,所述相似题组包括m道所述相似题,m为正整数,且m≥1,并将所述相似题组的生成结果发送给所述知识点确定模块;所述知识点标注模块,用于根据所述相似题组对所述新增试题进行知识点标注;包括判断子模块、标注子模块;所述判断子模块,与所述标注子模块相连接,用于当判断所述相似题组中最相似试题对应的相似度r在第一级别范围内时,将位于第一级别范围内的相似度r对应的所述相似题判定为第一待利用试题,并将所述第一待利用试题的判定结果发送给所述标注子模块;所述标注子模块,根据所述第一待利用试题的判定结果,将所述第一待利用试题对应的知识点赋予所述新增试题;所述判断子模块,还用于当判断所述相似题组中最相似试题对应的相似度r在第二级别范围内时,将所述相似题组中的试题判定为第二待利用试题,并将所述第二待利用试题的判断结果发送给所述标注子模块,所述标注子模块,还用于根据所述第二待利用试题的判断结果将在所述第二待利用试题对应的所有知识点中出现次数最多的知识点赋予所述新增试题,并根据两个知识点同时出现的置信度,判断所述第二待利用试题对应的剩余知识点中与所述出现次数最多的知识点最可能同时出现的p个知识点,将所述p个知识点也赋予所述新增试题,p为正整数,且p≥1;其中,最相似试题本文档来自技高网...

【技术保护点】
1.一种新增试题的知识点标注方法,其特征在于,包括:获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,所述样本库中的试题均为待判断试题,一道所述待判断试题对应n个知识点,n为正整数,且n≥1,具体包括:确定所述新增试题的重要关键字符记为第一字符串,确定所述待判断试题的重要关键字符记为第二字符串,所述重要关键字符为新增、替换或者修改后会改变试题含义或者类型的字符;计算所述第一字符串和所述第二字符串之间的加权编辑距离,所述加权编辑距离为所述第一字符串和所述第二字符串之间相互转化的最少的加权操作次数;根据所述加权编辑距离计算所述新增试题与所述待判断试题之间的相似度r;当相似度r大于等于第一阈值时,相似度r所对应的所述待判断试题为所述相似题;遍寻所述样本库得到所述相似题组,所述相似题组包括m道所述相似题,m为正整数,且m≥1;根据所述相似题组对所述新增试题进行知识点标注,具体包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,将位于第一级别范围内的相似度r对应的所述相似题判定为第一待利用试题,将所述第一待利用试题对应的知识点赋予所述新增试题;当所述相似题组中最相似试题对应的相似度r在第二级别范围内时,将所述相似题组中的试题判定为第二待利用试题,将在所述第二待利用试题对应的所有知识点中出现次数最多的知识点赋予所述新增试题,然后根据两个知识点同时出现的置信度,判断所述第二待利用试题对应的剩余知识点中与所述出现次数最多的知识点最可能同时出现的p个知识点,将所述p个知识点也赋予所述新增试题,p为正整数,且p≥1;其中,最相似试题为所述相似题组中相似度r最大的试题,所述第一级别范围的相似度大于第二级别范围的相似度。...

【技术特征摘要】
1.一种新增试题的知识点标注方法,其特征在于,包括:获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,所述样本库中的试题均为待判断试题,一道所述待判断试题对应n个知识点,n为正整数,且n≥1,具体包括:确定所述新增试题的重要关键字符记为第一字符串,确定所述待判断试题的重要关键字符记为第二字符串,所述重要关键字符为新增、替换或者修改后会改变试题含义或者类型的字符;计算所述第一字符串和所述第二字符串之间的加权编辑距离,所述加权编辑距离为所述第一字符串和所述第二字符串之间相互转化的最少的加权操作次数;根据所述加权编辑距离计算所述新增试题与所述待判断试题之间的相似度r;当相似度r大于等于第一阈值时,相似度r所对应的所述待判断试题为所述相似题;遍寻所述样本库得到所述相似题组,所述相似题组包括m道所述相似题,m为正整数,且m≥1;根据所述相似题组对所述新增试题进行知识点标注,具体包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,将位于第一级别范围内的相似度r对应的所述相似题判定为第一待利用试题,将所述第一待利用试题对应的知识点赋予所述新增试题;当所述相似题组中最相似试题对应的相似度r在第二级别范围内时,将所述相似题组中的试题判定为第二待利用试题,将在所述第二待利用试题对应的所有知识点中出现次数最多的知识点赋予所述新增试题,然后根据两个知识点同时出现的置信度,判断所述第二待利用试题对应的剩余知识点中与所述出现次数最多的知识点最可能同时出现的p个知识点,将所述p个知识点也赋予所述新增试题,p为正整数,且p≥1;其中,最相似试题为所述相似题组中相似度r最大的试题,所述第一级别范围的相似度大于第二级别范围的相似度。2.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,相似度r的计算公式为:r=(sum-dist)/sum,其中,sum为所述第一字符串和所述第二字符串的长度总和,dist为所述加权编辑距离。3.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,所述两个知识点同时出现的置信度的计算方法为:统计所述样本库中,两个知识点在同一道题中同时出现的次数q;根据所述次数q计算所述置信度D,其中,D=R*q,R正相关系数。4.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,进一步包括:将样本库中试题按题型进行分类为子样本库,一个所述子样本库中仅包括一种题型的试题;获取新增试题,根据所述新增试题的题型,遍寻相应的所述子样本库寻找与所述新增试题相似的相似题,得到相似题组。5.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,根据所述相似题组对所述新增试题进行知识点标注,还包括:当所述相似题组中最相似试题对应的相似度r在第二级别范围内,且所述相似题组中的所述相似题均各自对应一个知识点时,将所述相似题组对应的所有知识点均赋予所述新增试题。6.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,根据所述相似题组对所述新增试题进行知识点标注,还包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,根据相似度r由大到小对所述相似题进行排序,将最多前5道相似度r位于第一级别范围内的所述相似题判定为所述第一待利用试题;当所述相似题组中最相似试题对应的相似度r在第二级别范围内时,根据相似度r由大到小对所述相似题进行排序,将最多前5道所述相似题判定为所述第二待利用试题。7.根据权利要求...

【专利技术属性】
技术研发人员:谢楚鹏李可佳郭晨阳
申请(专利权)人:江苏曲速教育科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1