System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及智慧教育,具体为一种基于认知诊断和集成学习的学生成绩预测方法。
技术介绍
1、通过认知诊断和集成学习的方法,利用在线学习平台的学生数据和答题数据能够预测出学生的学生认知能力模式和在某特定试卷中的小题得分和总分,对于提升学生的学习质量和教师的教学效果有着巨大帮助,大部分研究者会通过收集学习者的相关数据来预测学习者的期中成绩或期末成绩,然而大部分的成绩预测只是学生的总分成绩,并没有预测学生的认知能力情况和在试卷中的小题得分情况。
技术实现思路
1、针对现有的技术不足,本专利技术的目的是提供一种基于认知诊断和集成学习的学生成绩预测的方法,解决了现有技术中存在的对学习者的成绩预测中仅仅考虑了学生成绩总分的预测的不足。
2、为实现上述目的,本专利技术提供如下技术方案:一种基于认知诊断和集成学习的学生成绩预测方法,包括如下步骤:
3、步骤1:采集学习者的学习数据,包括静态数据和动态数据,所述静态数据包括学习者基本信息,所述动态数据包括学习者在平台上的交互数据、测试数据;
4、步骤2:对步骤1采集的学习者的学习数据进行处理;
5、步骤3:划定学生的认知能力属性,根据科目课程标准、教学大纲、布鲁姆的认知目标分类以及专业教师确定学生的认知能力属性;
6、步骤4:收集学生的习题作答数据;
7、步骤5:通过评价指标deviance、aic、bic进行选择认知诊断模型、评价指数的数值越小模型表现越好;
8、步
9、步骤7:通过步骤6选择的认知诊断模型确定学生的认知结构;
10、步骤8:对步骤7所确定的学生认知结构再结合步骤1的数据构建完整的学生认知模式成绩数据集;
11、步骤9:分类预测模型以准确率为主,精确率、召回率、f1值为辅的形式来确定;
12、步骤10:根据步骤9的评价指标将选择集成模型进行预测学生的认知结构;
13、步骤11:根据步骤10所预测的认知结构和选择认知诊断模型预测学生的各小题得分和总分;
14、作为一种优选方案,所述步骤1中的学习者基本信息包括以下小类:姓名、学号、专业、班级、院系;
15、所述步骤1中的学习者在平台上的交互数据包括以下小类:线上得分、在线时长、登录次数、评论次数;
16、所述步骤1中的学习者的测试数据包括以下小类:测试成绩、作业成绩、学习成绩、考试成绩、线下得分。
17、作为一种优选方案,所述步骤2具体为:
18、步骤2.1,数据清洗:对步骤1采集的学习者数据根据每个变量的合理取值范围和内在关系,检查所拿到的学习者数据是否符合要求,如果发现超出正常范围、逻辑上不合理或者相互矛盾的数据,对其进行核对和纠正;如果学习者的某些数据是缺失值,将以均值进行填充;
19、步骤2.2,将清洗的数据整合在一起;
20、步骤2.3,将学习者数据中的字符型数据转换为数值型数;
21、步骤2.4,将学习者数据进行归一化;
22、各列属性取值处于不同的数量级,需要对数据进行归一化,将数据都归一化到[0,1]范围之间。
23、数据归一化按照如下公式计算:
24、
25、其中x′表示归一化后的数值,x表示为原本的数据值,min表示数据特征量中的最小值,max表示数据特征量中的最大值。
26、作一种优选方案,所述步骤4具体为:
27、步骤4.1,由专业教师以及相关学科师范生或专业人士,根据步骤3的认知能力属性建立q矩阵,编制有效习题,并验证习题的有效性;
28、步骤4.2,将学生的作答习题数据答对记为1,答错记为0,进行数据收集;
29、作为一种优选方案,所述步骤5具体为:
30、步骤5.1,根据认知诊断模型的不同类型,选择不同的评价指标进行比较,选择deviance、aic、bic具体指标计算方式如下计算:
31、aic=2w-2ln(lmax)
32、
33、其中,w为模型估计参数的个数,lmax为模型的极大似然函数值,为当前模型的极大似然函数值,n是观察数据样本容量,k是需要自由估计的参数数目。
34、进一步的,采用最具有代表性的认知诊断模型:dina、dino、gdina、rrum,根据评价指标选择最佳模型对学生进行认知模式预测。
35、作为一种优选方案,所述步骤7具体为:
36、根据步骤6所确定的认知诊断模型,使用flexcdms平台确定学生的认知能力掌握模式,在二级评分cdms栏目中选择最大后验概率确定学生的认知能力掌握模式。
37、作为一种优选方案,所述步骤8具体为:
38、将步骤7所确定的学生认知能力属性模式,与在步骤1所述的数据根据对应的信息进行合并数据集,建立完整的学生认知模式成绩数据集。
39、作为一种优选方案,所述步骤9具体为:
40、步骤9.1,确定混淆矩阵;
41、所述混淆矩阵中包括真实类别和预测类别以及真实类别和预测类别的比较结果,所述真实类别是学习者期中和期末的学习成绩的及格情况,所述预测类别是指通过测试集预测得到的学习成绩的及格情况,所述真实类别和预测类别的比较结果包括:
42、若真实类别为及格且预测类别为及格则表示被正确地划分为正例,计被正确地划分为正例的个数为tp;
43、若真实类别为及格且预测类别为不及格则表示被错误地划分为负例,计被错误地划分为负例的个数为fn;
44、若真实类别为不及格且预测类别为及格则表示被错误地划分为正例,计被错误地划分为正例的个数fp;
45、若真实类别为不及格且预测类别为不及格则表示被正确地划分为负例,及被正确地划分为负例的个数为tn;
46、用p指真实类别中及格总数;n指真实类别中不及格的总数;p’指预测类别中及格总数,n’指预测类别中不及格总数;
47、步骤9.2,根据步骤9.1得到的混淆矩阵,计算预测的准确率、精确率和召回率,f1值,具体为:
48、准确率:
49、精确率:
50、召回率:
51、f1值:
52、进一步的,采用最具有代表性的且表现效果较好的集成模型:xgboost、gdbt、随机森林、lightgbm进行分类预测。
53、作为一种优选方案,所述步骤10具体为:
54、步骤10.1,,使用机器学习中的10折交叉验证及sklearn库中的gridsearchcv技术,以及在训练过程中分别采用本文档来自技高网...
【技术保护点】
1.一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤1中的学习者基本信息包括以下小类:姓名、学号、专业、班级、院系;
3.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤2具体为:
4.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤4具体为:
5.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤5具体为:
6.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤7具体为:
7.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤8具体为:
8.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤9具体为:
9.根据权利要求1所述的一种基于认知诊断和集成学习的
10.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤11具体为:
...【技术特征摘要】
1.一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤1中的学习者基本信息包括以下小类:姓名、学号、专业、班级、院系;
3.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤2具体为:
4.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤4具体为:
5.根据权利要求1所述的一种基于认知诊断和集成学习的学生成绩预测方法,其特征在于,所述步骤5具体...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。