【技术实现步骤摘要】
一种新增试题的知识点标注方法及系统
本专利技术涉及教育
,更具体地,涉及一种新增试题的知识点标注方法及系统。
技术介绍
现有技术中,当在试题题库中增加新试题时,通常采用人工标注的方式对新增试题标注知识点。这种人工标注知识点的方式,通常需要有丰富教学研究经验的教师,对各科试题进行人工判断,来进行具体知识点的标注,从而达到较高的准确度。然而,采用人工标注的方式效率低且费用成本高昂。因此,提供一种新增试题的知识点标注方法及系统,提升知识点标注的效率,节约时间和费用,并且同时保证较高的准确性,是本领域亟待解决的技术问题。
技术实现思路
有鉴于此,本专利技术提供了一种新增试题的知识点标注方法及系统,解决了上述技术问题。第一方面,本专利技术提供一种新增试题的知识点标注方法,包括:获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,所述样本库中的试题均为待判断试题,一道所述待判断试题对应n个知识点,n为正整数,且n≥1,具体包括:确定所述新增试题的重要关键字符记为第一字符串,确定所述待判断试题的重要关键字符记为第二字符串,所述重要关键字符为新增、替换或者修改后会改变试题含义或者类型的字符;计算所述第一字符串和所述第二字符串之间的加权编辑距离,所述加权编辑距离为所述第一字符串和所述第二字符串之间相互转化的最少的加权操作次数;根据所述加权编辑距离计算所述新增试题与所述待判断试题之间的相似度r;当相似度r大于等于第一阈值时,相似度r所对应的所述待判断试题为所述相似题;遍寻所述样本库得到所述相似题组,所述相似题组包括m道所述相似题,m为正整数,且m≥1;根据 ...
【技术保护点】
1.一种新增试题的知识点标注方法,其特征在于,包括:获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,所述样本库中的试题均为待判断试题,一道所述待判断试题对应n个知识点,n为正整数,且n≥1,具体包括:确定所述新增试题的重要关键字符记为第一字符串,确定所述待判断试题的重要关键字符记为第二字符串,所述重要关键字符为新增、替换或者修改后会改变试题含义或者类型的字符;计算所述第一字符串和所述第二字符串之间的加权编辑距离,所述加权编辑距离为所述第一字符串和所述第二字符串之间相互转化的最少的加权操作次数;根据所述加权编辑距离计算所述新增试题与所述待判断试题之间的相似度r;当相似度r大于等于第一阈值时,相似度r所对应的所述待判断试题为所述相似题;遍寻所述样本库得到所述相似题组,所述相似题组包括m道所述相似题,m为正整数,且m≥1;根据所述相似题组对所述新增试题进行知识点标注,具体包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,将位于第一级别范围内的相似度r对应的所述相似题判定为第一待利用试题,将所述第一待利用试题对应的知识点赋予所述新增试题;当所述相似题组中最 ...
【技术特征摘要】
1.一种新增试题的知识点标注方法,其特征在于,包括:获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,所述样本库中的试题均为待判断试题,一道所述待判断试题对应n个知识点,n为正整数,且n≥1,具体包括:确定所述新增试题的重要关键字符记为第一字符串,确定所述待判断试题的重要关键字符记为第二字符串,所述重要关键字符为新增、替换或者修改后会改变试题含义或者类型的字符;计算所述第一字符串和所述第二字符串之间的加权编辑距离,所述加权编辑距离为所述第一字符串和所述第二字符串之间相互转化的最少的加权操作次数;根据所述加权编辑距离计算所述新增试题与所述待判断试题之间的相似度r;当相似度r大于等于第一阈值时,相似度r所对应的所述待判断试题为所述相似题;遍寻所述样本库得到所述相似题组,所述相似题组包括m道所述相似题,m为正整数,且m≥1;根据所述相似题组对所述新增试题进行知识点标注,具体包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,将位于第一级别范围内的相似度r对应的所述相似题判定为第一待利用试题,将所述第一待利用试题对应的知识点赋予所述新增试题;当所述相似题组中最相似试题对应的相似度r在第二级别范围内时,将所述相似题组中的试题判定为第二待利用试题,将在所述第二待利用试题对应的所有知识点中出现次数最多的知识点赋予所述新增试题,然后根据两个知识点同时出现的置信度,判断所述第二待利用试题对应的剩余知识点中与所述出现次数最多的知识点最可能同时出现的p个知识点,将所述p个知识点也赋予所述新增试题,p为正整数,且p≥1;其中,最相似试题为所述相似题组中相似度r最大的试题,所述第一级别范围的相似度大于第二级别范围的相似度。2.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,相似度r的计算公式为:r=(sum-dist)/sum,其中,sum为所述第一字符串和所述第二字符串的长度总和,dist为所述加权编辑距离。3.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,所述两个知识点同时出现的置信度的计算方法为:统计所述样本库中,两个知识点在同一道题中同时出现的次数q;根据所述次数q计算所述置信度D,其中,D=R*q,R正相关系数。4.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,获取新增试题,遍寻样本库寻找与所述新增试题相似的相似题,得到相似题组,进一步包括:将样本库中试题按题型进行分类为子样本库,一个所述子样本库中仅包括一种题型的试题;获取新增试题,根据所述新增试题的题型,遍寻相应的所述子样本库寻找与所述新增试题相似的相似题,得到相似题组。5.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,根据所述相似题组对所述新增试题进行知识点标注,还包括:当所述相似题组中最相似试题对应的相似度r在第二级别范围内,且所述相似题组中的所述相似题均各自对应一个知识点时,将所述相似题组对应的所有知识点均赋予所述新增试题。6.根据权利要求1所述的新增试题的知识点标注方法,其特征在于,根据所述相似题组对所述新增试题进行知识点标注,还包括:当所述相似题组中最相似试题对应的相似度r在第一级别范围内时,根据相似度r由大到小对所述相似题进行排序,将最多前5道相似度r位于第一级别范围内的所述相似题判定为所述第一待利用试题;当所述相似题组中最相似试题对应的相似度r在第二级别范围内时,根据相似度r由大到小对所述相似题进行排序,将最多前5道所述相似题判定为所述第二待利用试题。7.根据权利要求...
【专利技术属性】
技术研发人员:谢楚鹏,李可佳,郭晨阳,
申请(专利权)人:江苏曲速教育科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。