当前位置: 首页 > 专利查询>西北大学专利>正文

一种利用数据增强和特征加权实现的MOOC辍学预测方法技术

技术编号:33124228 阅读:40 留言:0更新日期:2022-04-17 00:31
一种利用数据增强和特征加权实现的MOOC辍学预测方法,基于数据增强和特征加权的CNN_GRU辍学预测模型以视频为单位,通过从在线教育平台中抽取学习者的学习行为数据作为模型输入,经过数据增强、信息提取、特征加权三个步骤计算发生辍学行为的概率。模型能更加准确地预测学习者发生辍学的概率且鲁棒性良好,在指标AUC和F1上模型均取得了最佳表现,分别为86.82%和90.35%。同时通过对比实验的方式,验证了特征加权能够有效提升模型性能。证了特征加权能够有效提升模型性能。证了特征加权能够有效提升模型性能。

【技术实现步骤摘要】
一种利用数据增强和特征加权实现的MOOC辍学预测方法


[0001]本专利技术涉及一种神经网络模型的应用,具体涉及一种利用数据增强和特征加权实现的MOOC辍学预测方法。

技术介绍

[0002]在线教育作为应对疫情等重大突发事件、保障学生受教育权、促进终身学习的有效方式,已经成为了传统教育的有益补充。但是,由于在线学习监管和学习成果认证的缺失导致在线教育极高的高辍学率,“空壳慕课”现象严重。若能提前地发现潜在的辍学者,并实施干预措施来提高学习者的学习兴趣,降低MOOC辍学率,对于引导学习者持续学习具有重要意义。
[0003]针对高辍学率问题,一部分学者致力于研究导致在线辍学的原因,目前的研究显示辍学主要与学习者和课程相关,而首要因素是学习者自身的因素。另一部分学者则是通过分析在线学习平台中的数据去预测学习者是否会发生辍学,目前使用的预测方法主要是统计机器学习方法、深度学习方法以及少量的自然语言处理方法。早期的辍学预测主要集中于传统分类方法,如使用逻辑回归LR(Logistic Regression)、决策树DT(Decision Tree)本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种利用数据增强和特征加权实现的MOOC辍学预测方法,其特征在于,包括以下步骤:步骤1、定义MOOCs的辍学预测:定义1.学习者和课程的属性信息,U和C分别表示学习者和课程集合,则(u,c)表示用户u选修课程c;定义2.学习行为数据:在线学习平台会记录学习者c在课程u的视频学习过程中包括开始学习、快进、倍速、暂停、结束播放等行为数据,将学习行为数据分为第t节视频学习行为数据与前t

1节视频学习的行为数据,分别记为x
t
(u,c),x
h
(u,c),则(u,c),则与(1≤i≤m
x
且i为整数,m
x
为学习行为数据的特征个数)表示学习者c在课程u中的第i个与学习相关的值为连续值的行为特征;步骤2、辍学者初筛选:给定学习者u在课程c前t

1节视频学习行为x
h
(u,c)和第t节视频学习行为x
t
(u,c)以及学习者信息u和课程信息c,则辍学预测的目标是预测学习者是否会继续第t+1视频课程的学习,用y(u,c)∈{0,1}表示第t节视频学习后是否发生辍学的基本事实,当且仅当y(u,c)为“1”表示该学习者在第t节视频学习后发生了辍学,可用函数表示为:f:(u,c,x
h
(u,c),x
t
(u,c))

y(u,c)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)步骤3、构建模型:为了能够及时准确地发现潜在的辍学者,构建基于数据增强和特征加权的ACG模型来预测和分析辍学,模型由卷积神经网络、门控循环单元、自注意力机制等部分组成;卷积层用于筛选学习行为中的有效特征,GRU层用于提取学习行为中的时序信息,模型使用上下文信息对学习行为特征进行增强并嵌入为向量,随后,将使用卷积神经网络和门控循环单元提取到的特征信息和使用自注意力机制学习到的特征权重融合用于辍学预测,提高模型的预测能力;步骤4、数据增强:由于学习者的学习行为对学习者信息、课程信息、历史学习活动高度敏感,模型利用上下文信息对学习行为数据增强,即针对第t节视频的学习活动中的第i个学习活动特征,将学习者信息u、课程信息c、以及第i个特征的历史学习活动扩展到第t节视频学习活动中进行数据增强:公式(2)中1≤i≤m
x
,而学习者的第i个特征的历史活动可以由映射函数G得到:到:因此,因此,随后,将每一个特征通过嵌入层将每个x转换为密集...

【专利技术属性】
技术研发人员:袁新瑞高彦太
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1