一种基于多模型的学情分析方法技术

技术编号:35914953 阅读:25 留言:0更新日期:2022-12-10 10:56
本发明专利技术提出一种基于多模型的学情分析方法,包括:S2.选取知识点下的测试题目进行测试,获取用户的作答情况数据,结合测试题目对应的学科能力、题目类型、题目易错点等特征信息,解析测试数据的多维度语义向量;S3.基于生成的多维度语义向量,利用复合预测模型,进行学情分析。本发明专利技术提供的学情分析基于复合预测模型进行集成学习,能够有效处理在线测试场景中的学情分析方法对多模型学习算法忽略和学情分析维度考虑不全的问题。情分析维度考虑不全的问题。情分析维度考虑不全的问题。

【技术实现步骤摘要】
一种基于多模型的学情分析方法


[0001]本专利技术涉及人工智能
,尤其涉及一种基于多模型的学情分析方法。

技术介绍

[0002]在智能教学领域,学习者会在系统中产生大量学习行为、学习认知等数据,教师为了达成有效决策而对学习者的学习记录数据进行挖掘、诊断、评估和分析,最终为有效的教学设计提供数据依据,为有效的教学提供动力支撑,为发展性的教学评价提供决策基准,为教师的教研和专业发展提供着力点,为利益相关者提供学情预警等。具体来说,学情分析指的是对学习者的学习记录进行挖掘、诊断和评估的过程,包括学习者的知识点掌握情况分析、学科能力层级分析等维度,其中,对于知识点掌握情况分析的技术,大多采用知识追踪的方法,方法[1]使用改进的贝叶斯知识追踪模型对知识点掌握情况进行预测,使用最大尝试次数、总尝试次数、平均作答时长与正确率等四个特征,但这种方法并未考虑知识点具有多种掌握等级的情况,因此也没有对该种情况进行处理的方案。此外,基于深度知识追踪的方法[2]通过引入学习者练习的行为特征和练习后能力的变化,建模学习者的认知状态,但难以对知识点掌握情况进行归因分析,并不具有良好的可解释性,存在算法黑箱问题。对于学科能力掌握程度预测的研究较少涉及,一方面,由于学科能力属于学习者的高阶能力,难以给出比较规则化的测评方法;另一方面,需要人工标注测试题目对应的学科能力。可见深入研究学习者的知识点掌握情况和学科能力掌握程度的测评方法,便于对学情精准分析,进而为利益相关者提供学情预警,最终达到智能教学的目的。
[0003]当前,针对学情分析的研究领域涉及课堂教学场景、在线教学场景等,其研究方法大多涉及数据挖掘、计算机视觉、知识图谱等,但是以上方法主要使用单一模型进行学情分析,单一模型可能产生算法偏差和缺陷,缺乏多模型集成学习的优势。因此,如何使用多模型技术进行学情分析并基于学情分析结果进行学情预警,成为当前亟待解决的问题。
[0004]参考文献:
[0005][1]余晴.基于知识追踪的学生知识点掌握情况研究[D].华中师范大学,2021.DOI:10.27159/d.cnki.ghzsu.2021.001818.
[0006][2]Xia Sun,Xu Zhao,et.al.Dynamic Key

Value Memory Networks With Rich Features for Knowledge Tracing[J].IEEE Transactions on Cybernetics,2021,PP(99):1
‑7
技术实现思路

[0007]针对以上问题,本专利技术提出一种基于多模型的学情分析方法,便于充分挖掘学习者的学情信息。
[0008]本专利技术提出的一种基于多模型的学情信息分析方法,其特征在于,包括以下步骤:
[0009]S2.选取知识点下的测试题目对用户进行测试,获取用户的作答情况数据,结合测试题目的特征信息,获取测试题目的多维度语义向量;
[0010]S3.将所述多维度语义向量输入复合预测模型,获得用户对知识点的掌握程度Y
A
和知识点下学科能力掌握情况Y
B

[0011]进一步地,所述特征信息包括学科能力层级、题目类型、题目易错点层级。
[0012]进一步地,所述测试题目的多维度语义向量的获取方法包括:
[0013]S21、根据用户的作答数据计算测试题目对应的知识点层级的作答得分率,并将所述作答得分率转换为用户作答情况特征向量;所述作答得分率的计算公式为:
[0014][0015]S22、计算测试题目的学科能力层级得分率,并将所述测试题目的学科能力层级得分率转换为学科能力层级特征向量;所述学科能力层级得分率的计算公式为:
[0016][0017]S23、通过关键词识别测试题目的题目类型,计算题目类型得分率,并将所述题目类型得分率转换为题目类型特征向量;所述题目类型得分率的计算公式为:
[0018][0019]S24、计算测试题目的题目易错点层级得分率,并将所述题目易错点层级得分率转换为题目易错点层级特征向量;所述题目易错点层级得分率的计算公式为:
[0020][0021]S25、将特征向量拼接形成测试题目的多维度语义特征向量。
[0022]进一步地,题目易错点层级表征了题目容易出错的原因,包括三个维度:概念理解不透、思维方法欠缺和解答能力不足,其中,概念理解不透包括E010101知识点掌握不好、E010102知识结构化缺乏;思维方法欠缺包括E020101思维方法欠缺、E020201审题不清、E020202信息提取与转换能力较弱、E020301问题猜想与假设、E020302数学建模;解答能力不足包括E030101运算能力较弱、E030201解答步骤不完整、E030202书写不规范。
[0023]进一步地,所述复合预测模型包括单层或者多层结构神经网络模型、K

近邻模型、随机森林模型以及逻辑回归模型,复合预测模型的输出为其中P(k)是复合预测模型对第k级掌握程度的预测概率,P(k,i)是第i个预测模型对第k级掌握程度的预测概率,W
i
是第i个预测模型所占的权重值,m为预测模型的数量。
[0024]进一步地,权值W
i
根据单个预测模型的准确率的比例然后归一化进行确定。
[0025]进一步地,还包括:
[0026]S1、将测试题目与带有属性标注的题目预处理后形成的语义向量输入孪生网络模型,生成测试题目的属性层级,其中,所述孪生网络包括编码层与输出层。
[0027]进一步地,编码层利用BERT模型生成测试题目和带有属性标注的题目的语义向量;输出层对所述语义向量进行余弦相似度计算,以此为权重,针对每个属性的层级进行求和计算,概率最大的属性层级即为测试题目的属性层级;
[0028]进一步地,还包括:
[0029]S4、重复步骤S2、S3,获取多个知识点下的学科能力掌握情况Y
Bi
,i表示第几个知识点;
[0030]S5、根据知识点i的重要度、是否为必测点、知识点权重进行加权计算,从而得出学科能力的整体掌握程度。
[0031]进一步地,所述学科整体掌握程度评分G的公式为:
[0032]G=∑a
i
(w
i
h
i
+w
i
t
i
)
[0033]其中,h
i
表示知识点i的重要度,t
i
表示知识点i是否属于必测点,a
i
表示知识点i的权重。
[0034]本专利技术的有益效果为:
[0035](1)本专利技术对于测试题目属性标注,将孪生网络模型应用于测试题目的知识点和学科能力识别,可以精准识别出测试题目中的属性信息。
[0036](2)本专利技术对于学生测试形成多维度语义向量表征,基于测试题目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多模型的学情信息分析方法,其特征在于,包括以下步骤:S2.选取知识点下的测试题目对用户进行测试,获取用户的作答情况数据,结合测试题目的特征信息,获取测试题目的多维度语义向量;S3.将所述多维度语义向量输入复合预测模型,获得用户对知识点的掌握程度Y
A
和知识点下学科能力掌握情况Y
B
。2.根据权利要求1所述的学情信息分析方法,其特征在于,所述特征信息包括学科能力层级、题目类型、题目易错点层级。3.根据权利要求2所述的学情信息分析方法,其特征在于,所述测试题目的多维度语义向量的获取方法包括:S21、根据用户的作答数据计算测试题目对应的知识点层级的作答得分率,并将所述作答得分率转换为用户作答情况特征向量;所述作答得分率的计算公式为:S22、计算测试题目的学科能力层级得分率,并将所述测试题目的学科能力层级得分率转换为学科能力层级特征向量;所述学科能力层级得分率的计算公式为:S23、通过关键词识别测试题目的题目类型,计算题目类型得分率,并将所述题目类型得分率转换为题目类型特征向量;所述题目类型得分率的计算公式为:S24、计算测试题目的题目易错点层级得分率,并将所述题目易错点层级得分率转换为题目易错点层级特征向量;所述题目易错点层级得分率的计算公式为:S25、将特征向量拼接形成测试题目的多维度语义特征向量。4.根据权利要求2所述的学情信息分析方法,其特征在于,题目易错点层级表征了题目容易出错的原因,包括三个维度:概念理解不透、思维方法欠缺和解答能力不足,其中,概念理解不透包括E010101知识点掌握不好、E010102知识结构化缺乏;思维方法欠缺包括E020101思维方法欠缺、E020201审题不清、E020202信息提取与转换能力较弱、E020301问题猜想与假设、E020302数学建模;解答能力不足包括E030101运算能力较弱、E030201解答步骤不完整、E030202书写不规范。5.根据权利要求2所述的学情信息分析...

【专利技术属性】
技术研发人员:卢宇夏雪莹陈鹏鹤余胜泉
申请(专利权)人:北京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1