一种试题难度分析方法及系统技术方案

技术编号:16472516 阅读:28 留言:0更新日期:2017-10-29 00:13
本发明专利技术公开了一种试题难度分析方法及系统,该方法包括:获取待分析试题;提取所述待分析试题的题目特征,所述题目特征包括题面特征、解析特征和答案特征;根据所述待分析试题的题目特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。由于本发明专利技术提供的方法根据待分析试题的题目特征预测待分析试题的难度得分,而无需根据该待分析试题的历史得分分布情况等预测待分析试题的难度得分,因此能够对冷数据情况,即没有学生做过的题目进行试题难度评价。

A method and system for analyzing the difficulty of test questions

The invention discloses a difficulty analysis method and system, the method includes: obtaining the questions to be analyzed; extracting the features of items subject to be analyzed, the topic features include theme features, analysis characteristics and answer feature; according to the analysis of difficulty test subject characteristics and pre built prediction the model obtained by the analysis of item difficulty score. The method provided by the invention according to the topic characteristic analysis test item difficulty prediction score to be analyzed, without the need to be analyzed according to the test of history score distribution prediction of the difficulty score, so can the cold data, there is no students did the problem of difficulty of evaluation.

【技术实现步骤摘要】
一种试题难度分析方法及系统
本专利技术涉及电子化教育领域,具体涉及一种试题难度分析方法及系统。
技术介绍
近年来,随着计算机技术和教育信息化的不断推进发展,计算机技术和人工智能技术已经逐步应用于日常教育教学的各项活动中。试题的难度作为考查试题的重要指标之一,其在题库构建过程中的选题、学生能力评估、以及个性化学习等方面起着重要的作用。现有的题目难度分析方法,主要有:1.基于人工专家标注的方法、2.基于简单统计的方法、3.基于教育领域模型的评价方法。其中,1.基于人工专家标注的方法通过此试题所在领域的人工专家对此试题进行主观评价,从而获取试题难度,其缺点为标注难度和成本偏大,且主观因素较大,容易导致不同的专家评价标准不一致;2.基于简单统计的方法通过试题被学生做过的历史记录,统计试题的正确率,将正确率作为试题难度系数的评估依据,如CTT,其缺点为对学生答题样本的分布和数量有较高要求,并且不同考次间的评分带有主观性,用此种方法获得的难度在大多情况下和人工专家的评价会产生偏差3.基于教育领域模型的评价方法,如教育领域中的项目反应理论模型,根据学生的答题矩阵直接估计出题目的难度,这种方法对学生答题样本进行整体建模,获得的难度在准确性上较之简单统计的方法有很大的提高,但这种方法无法对冷数据,即没有学生做过的题目进行难度评价。
技术实现思路
本专利技术实施例提供一种试题难度分析方法及系统,以解决现有的试题难度评价方法无法对冷数据,即没有学生做过的题目进行难度评价的问题。为此,本专利技术实施例提供如下技术方案:一种试题难度分析方法,包括:获取待分析试题;提取所述待分析试题的题目特征,所述题目特征包括题面特征、解析特征和答案特征;根据所述待分析试题的题目特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。优选地,所述题面特征、所述解析特征和所述答案特征分别包括:公式的语义特征以及以下任意一种或多种:文字的字面特征、文字的语义特征。优选地,获取所述公式的语义特征包括步骤:对题面、解析和答案分别进行公式识别,提取题面、解析和答案的公式;预先构建题面、解析和答案的公式的概率上下文无关语法模型;利用各概率上下文无关语法模型对公式进行解析,获取题面、解析和答案的公式的字符的语法树;遍历各公式的字符的语法树,获取题面、解析和答案的公式的语义特征。优选地,获取所述文字的字面特征包括步骤:对题面、解析和答案分别进行公式识别,提取题面、解析和答案的文字;对所述题面、解析和答案的文字分别进行分词处理;根据各分词处理的结果获取题面、解析和答案的文字的字面特征。优选地,所述方法还包括:获取题面、解析和答案的文字的字面特征之后,对所述题面、解析和答案的文字的字面特征进行特征优化,获取优化后题面、解析和答案的文字的字面特征。优选地,所述方法还包括:提取所述待分析试题的属性特征,所述待分析试题的属性特征包括以下任意一种或多种:题面长度、解析长度、解答长度、试题类型、试题题型、年级、试题来源学校知名度、试题包含知识点个数、试题包含知识点、试题在试卷中位置;所述根据所述待分析试题的题目特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分包括:根据所述待分析试题的题目特征、属性特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。优选地,预先构建所述试题难度预测模型包括:收集用于构建试题难度预测模型的训练语料;提取所述训练语料的题目特征;基于所述训练语料的题目特征训练试题难度预测模型。优选地,预先构建所述试题难度预测模型包括:收集用于构建试题难度预测模型的训练语料;提取所述训练语料的题目特征和属性特征;基于所述训练语料的题目特征和属性特征训练试题难度预测模型。优选地,所述试题难度预测模型采用回归模型。相应地,本申请还提供了一种试题难度分析系统,包括:获取模块,用于获取待分析试题;题目特征提取模块,用于提取所述待分析试题的题目特征,所述题目特征包括题面特征、解析特征和答案特征;难度预测模块,用于根据所述待分析试题的题目特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。优选地,所述题面特征、所述解析特征和所述答案特征分别包括:公式的语义特征以及以下任意一种或多种:文字的字面特征、文字的语义特征。优选地,所述题目特征提取模块包括:公式提取单元,用于对题面、解析和答案分别进行公式识别,提取题面、解析和答案的公式;语法模型构建单元,用于预先构建题面、解析和答案的公式的概率上下文无关语法模型;语法树获取单元,用于利用各概率上下文无关语法模型对公式进行解析,获取题面、解析和答案的公式的字符的语法树;公式的语义特征获取单元,用于遍历各公式的字符的语法树,获取题面、解析和答案的公式的语义特征。优选地,所述题目特征提取模块还包括:文字提取单元,用于对题面、解析和答案分别进行公式识别,提取题面、解析和答案的文字;分词单元,用于对所述题面、解析和答案的文字分别进行分词处理;字面特征获取单元,用于根据各分词处理的结果获取题面、解析和答案的文字的字面特征。优选地,所述系统还包括:特征优化模块,用于在所述题目特征提取模块获取题面、解析和答案的文字的字面特征之后,对所述题面、解析和答案的文字的字面特征进行特征优化,获取优化后题面、解析和答案的文字的字面特征。优选地,所述系统还包括:属性特征提取模块,用于提取所述待分析试题的属性特征,所述待分析试题的属性特征包括以下任意一种或多种:题面长度、解析长度、解答长度、试题类型、试题题型、年级、试题来源学校知名度、试题包含知识点个数、试题包含知识点、试题在试卷中位置;所述难度预测模块具体用于根据所述待分析试题的题目特征、属性特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。优选地,所述系统还包括:第一预建模模块,用于预先构建所述试题难度预测模型,包括:收集单元,用于收集用于构建试题难度预测模型的训练语料;第一提取单元,用于提取所述训练语料的题目特征;第一训练单元,用于基于所述训练语料的题目特征训练试题难度预测模型。优选地,所述系统还包括:第二预建模模块,用于预先构建所述试题难度预测模型,包括:收集单元,用于收集用于构建试题难度预测模型的训练语料;第二提取单元,用于提取所述训练语料的题目特征和属性特征;第二训练单元,用于基于所述训练语料的题目特征和属性特征训练试题难度预测模型。本专利技术实施例提供的试题难度分析方法及系统,该方法获取待分析试题后,提取待分析试题的题目特征,包括题面特征、解析特征和答案特征,然后根据待分析试题的题目特征与预先基于题目特征构建的试题难度预测模型获取待分析试题的难度得分。由于本专利技术提供的方法根据待分析试题的题目特征获取待分析试题的难度,而无需根据该待分析试题的历史得分分布情况等预测待分析试题的难度得分,因此能够对冷数据情况,即没有学生做过的题目进行试题难度评价。进一步地,本专利技术实施例提供的试题难度分析方法及系统,该方法还提取了待分析试题的属性特征,最终根据待分析试题的属性特征、题目特征及预先基于属性特征及题目特征共同构建的试题难度预测模型获取所述待分析试题的难度得分,能进一步提升预测待分析试题的难度得分的准确性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,本文档来自技高网...
一种试题难度分析方法及系统

【技术保护点】
一种试题难度分析方法,其特征在于,包括:获取待分析试题;提取所述待分析试题的题目特征,所述题目特征包括题面特征、解析特征和答案特征;根据所述待分析试题的题目特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。

【技术特征摘要】
1.一种试题难度分析方法,其特征在于,包括:获取待分析试题;提取所述待分析试题的题目特征,所述题目特征包括题面特征、解析特征和答案特征;根据所述待分析试题的题目特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。2.根据权利要求1所述的方法,其特征在于,所述题面特征、所述解析特征和所述答案特征分别包括:公式的语义特征以及以下任意一种或多种:文字的字面特征、文字的语义特征。3.根据权利要求2所述的方法,其特征在于,获取所述公式的语义特征包括步骤:对题面、解析和答案分别进行公式识别,提取题面、解析和答案的公式;预先构建题面、解析和答案的公式的概率上下文无关语法模型;利用各概率上下文无关语法模型对公式进行解析,获取题面、解析和答案的公式的字符的语法树;遍历各公式的字符的语法树,获取题面、解析和答案的公式的语义特征。4.根据权利要求2所述的方法,其特征在于,获取所述文字的字面特征包括步骤:对题面、解析和答案分别进行公式识别,提取题面、解析和答案的文字;对所述题面、解析和答案的文字分别进行分词处理;根据各分词处理的结果获取题面、解析和答案的文字的字面特征。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取题面、解析和答案的文字的字面特征之后,对所述题面、解析和答案的文字的字面特征进行特征优化,获取优化后题面、解析和答案的文字的字面特征。6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:提取所述待分析试题的属性特征,所述待分析试题的属性特征包括以下任意一种或多种:题面长度、解析长度、解答长度、试题类型、试题题型、年级、试题来源学校知名度、试题包含知识点个数、试题包含知识点、试题在试卷中位置;所述根据所述待分析试题的题目特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分包括:根据所述待分析试题的题目特征、属性特征及预先构建的试题难度预测模型获取所述待分析试题的难度得分。7.根据权利要求1至5任一项所述的方法,其特征在于,预先构建所述试题难度预测模型包括:收集用于构建试题难度预测模型的训练语料;提取所述训练语料的题目特征;基于所述训练语料的题目特征训练试题难度预测模型。8.根据权利要求6所述的方法,其特征在于,预先构建所述试题难度预测模型包括:收集用于构建试题难度预测模型的训练语料;提取所述训练语料的题目特征和属性特征;基于所述训练语料的题目特征和属性特征训练试题难度预测模型。9.根据权利要求1至5、8任一项所述的方法,其特征在于,所述试题难度预测模型采用回归模型。10.一种试题难度分析系统,其特征在于,包括:获取模块,用于获取待分析试题;题目特征提取模块,用于提取所述待分析试题的题目特征,所述题目特征包括题面...

【专利技术属性】
技术研发人员:张丹苏喻陈志刚邓晓栋魏思胡国平胡郁
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1