一种面向大规模学员的学业预警监测方法技术

技术编号:26891840 阅读:45 留言:0更新日期:2020-12-29 16:10
本发明专利技术提供了一种面向大规模学员的学业预警监测方法,在对预测方法和大数据处理平台研究的基础上,针对目前智慧教学应用中学员差异化分析、个性化教学方法的不足,提出了一种有效的解决方案,即基于并行计算框架和学习预测算法,建立了离线学习预测模型,该方案包括特征处理、建模准备、模型训练和模型部署四个阶段。学习预测过程实现了一个基于Spark和HBase的大规模实时学习预测系统。并基于预测结果对风险学员(预测为挂科的学员)进行重点监测,寻找风险点。风险学员监测过程包含风险群体聚类分析,聚类分析的目的在于发掘各风险学员的风险点,便于针对不同的学员群体提供建议。

【技术实现步骤摘要】
一种面向大规模学员的学业预警监测方法
本专利技术涉及智慧教学的学情分析领域,特别涉及一种面向大规模学员的学业预警监测方法。
技术介绍
随着教育行业对智慧教学的研究越来越深入和广泛,差异化教学已成为教学研究的热点之一。学习成绩好的学习者与其他学习者在学习行为上存在一定的差异。基于学习者的学习行为,可以使用监督算法来预测学习者能否顺利通过课程,并可进一步挖掘低效学习者的学习特征。学业预测与群聚类结果可为教师教学活动、学员学习活动提供针对性的指导,具有重要的现实意义。目前,网络学习平台在高校中得到了广泛的应用,并记录了大量的学习行为数据。许多学业预测技术方法可以从网络学习平台上记录的学习行为数据中获取相关特征数据。通过数据分析和挖掘,预测学习效果,实施教学干预。但是存在的问题也显而易见:1、大规模场景下需要处理的数据规模与数据复杂度急剧上升,现有的非分布式基于机器学习的学业预测方法处理时间长、效率低,难以满足实时应答的要求;2、由于学业相关数据层次繁杂、数据类别多样,现有的许多方法仅凭先验知识,单纯提取若干个特征,不可避免会造成重要的信息丢失,进而削本文档来自技高网...

【技术保护点】
1.一种面向大规模学员的学业预警监测方法,其特征在于,包括学业预测过程和风险学员监测过程,其中,学业预测过程包括如下步骤:/n步骤a1,对学习者的学习活动数据进行特征处理;/n步骤a2,进行建模准备;/n步骤a3,利用Spark MLlib进行模型批量训练,得到训练好的预测模型;/n步骤a4,部署预测模型,进行Spark Streaming实时计算,对学情进行预测;/n风险学员监测过程包括如下步骤:/n步骤b1,根据学业预测所输出的结果,从数据库中抽取已经经过预处理、标准化处理和特征选择的样本,形成风险学员集合;/n步骤b2,使用参数eps经过自适应调整的DBSCAN算法,对风险学员集合进行聚...

【技术特征摘要】
1.一种面向大规模学员的学业预警监测方法,其特征在于,包括学业预测过程和风险学员监测过程,其中,学业预测过程包括如下步骤:
步骤a1,对学习者的学习活动数据进行特征处理;
步骤a2,进行建模准备;
步骤a3,利用SparkMLlib进行模型批量训练,得到训练好的预测模型;
步骤a4,部署预测模型,进行SparkStreaming实时计算,对学情进行预测;
风险学员监测过程包括如下步骤:
步骤b1,根据学业预测所输出的结果,从数据库中抽取已经经过预处理、标准化处理和特征选择的样本,形成风险学员集合;
步骤b2,使用参数eps经过自适应调整的DBSCAN算法,对风险学员集合进行聚类,挖掘各风险学员集合中的风险子集的风险特征;
步骤b3,对于具有不同特征的风险子集,基于专家知识库有针对性的提供对策方案,以改进各风险群体风险程度。


2.根据权利要求1所述的方法,其特征在于,步骤a1包括:
对学习者的学习活动数据进行特征提取,所述学习活动数据包括线上学习行为数据、线下学习行为数据和基础课程的成绩;
所述线上学习行为数据包括有课堂测试结果、出席情况和作业完成的结果;
所述线下学习行为数据包括有网上作业完成结果、在线视频观看时间、网上考试次数、在线测试结果、论坛中帖子的数量和作业评审次数;
所述基础课程的成绩数据是指各基础课程的成绩;
将学习活动数据、线上学习行为数据和线下学习行为数据下的各类子数据统一称为特征数据,设定有k类子数据,则特征数据有k组,称为k个指标,基于熵权法获得特征数据的相对重要性程度:
利用如下公式计算信息熵:
利用如下公式计算信息熵冗余度:dj=1-Hj
其中,p(xi)代表随机事件xi的概率,Hj是第j组特征数据的熵值,dj是第j组特征数据的信息熵冗余度,n是样本个数的和,i≤n,每个i对应一个学习主体。


3.根据权利要求2所述的方法,其特征在于,步骤a1还包括:
设定有m组特征数据,则xij为第i个样本的第j个指标的数值,i=1,…,n;j=1,…,m;
计算第j项指标下第i个样本值占该指标的比重pij:



计算第j个指标下的熵值Hj:



其中,
计算信息熵冗余度dj:
dj=1-Hj,
计算各项指标的权重wj:



降序排列各项指标的权重集合W={w1,…,wj,…,wm}中的元素,选择前t个w,使:



最终获取t组特征数据。


4.根据权利要求3所述的方法,其特征在于,步骤a1还包括:基于熵权法获得各组特征数据的重要性程度后,选择重要...

【专利技术属性】
技术研发人员:龚少麟满青珊赵文涛郝路遥王骏
申请(专利权)人:南京莱斯网信技术研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1