当前位置: 首页 > 专利查询>西北大学专利>正文

一种利用数据增强和特征加权实现的MOOC辍学预测方法技术

技术编号:33124228 阅读:24 留言:0更新日期:2022-04-17 00:31
一种利用数据增强和特征加权实现的MOOC辍学预测方法,基于数据增强和特征加权的CNN_GRU辍学预测模型以视频为单位,通过从在线教育平台中抽取学习者的学习行为数据作为模型输入,经过数据增强、信息提取、特征加权三个步骤计算发生辍学行为的概率。模型能更加准确地预测学习者发生辍学的概率且鲁棒性良好,在指标AUC和F1上模型均取得了最佳表现,分别为86.82%和90.35%。同时通过对比实验的方式,验证了特征加权能够有效提升模型性能。证了特征加权能够有效提升模型性能。证了特征加权能够有效提升模型性能。

【技术实现步骤摘要】
一种利用数据增强和特征加权实现的MOOC辍学预测方法


[0001]本专利技术涉及一种神经网络模型的应用,具体涉及一种利用数据增强和特征加权实现的MOOC辍学预测方法。

技术介绍

[0002]在线教育作为应对疫情等重大突发事件、保障学生受教育权、促进终身学习的有效方式,已经成为了传统教育的有益补充。但是,由于在线学习监管和学习成果认证的缺失导致在线教育极高的高辍学率,“空壳慕课”现象严重。若能提前地发现潜在的辍学者,并实施干预措施来提高学习者的学习兴趣,降低MOOC辍学率,对于引导学习者持续学习具有重要意义。
[0003]针对高辍学率问题,一部分学者致力于研究导致在线辍学的原因,目前的研究显示辍学主要与学习者和课程相关,而首要因素是学习者自身的因素。另一部分学者则是通过分析在线学习平台中的数据去预测学习者是否会发生辍学,目前使用的预测方法主要是统计机器学习方法、深度学习方法以及少量的自然语言处理方法。早期的辍学预测主要集中于传统分类方法,如使用逻辑回归LR(Logistic Regression)、决策树DT(Decision Tree)和支持向量机SVM(Support Vector Machine)等方法。机器学习方法的预测效果在普遍情况下效果良好,但由于进行训练时往往需要足够多的特征数据,否则难以达到更好地效果。近年来,越来越多的深度学习方法被应用于辍学预测。通过特征工程从原始记录中提取了186个特征,进而将CNN和RNN结合在一起进行辍学预测。将学习者和课程信息与4类学习行为记录数据组合到一起,通过DNN进行辍学概率预测。通过自动抽取学习者学习活动日志中一段时间内43个连续特征的统计数据,以学习者行为特征为变量,使用基于卷积神经网络的长短期记忆CNN_LSTM来预测学生下周辍学的可能性。一种基于多模型堆叠集成学习的辍学预测模型。为了提高神经网络模型对MOOC辍学预测的准确性,研究了每个学生初始权重的计算和实现算法,区别于通常的随机选择初始值的方法,训练样本加权后预测性能显著提高。通过采用静态注意力获得每个维度上的注意力权重,实现了模型性能的提高。
[0004]通过研究上述文献可以发现:(1)现有的模型使用的数据集是以周为单位的等长周期内学习者的各类活动的点击流信息,而实际MOOCs中的各个课程的周期和课时长度并不一致。(2)训练数据中点击流信息主要是学生一个周期内在课程学习中的视频学习活动、论坛活动、作业活动、网页活动等方面的数量统计,而不是真正的具有时序特征的学习过程行为数据。因此,提出了利用以视频学习为单位的具有时序特征的学习行为数据进行辍学预测的深度网络模型,通过数据增强和特征加权的方式有效提高模型的预测能力,进而及时发现潜在的辍学者。

技术实现思路

[0005]本专利技术的目的是提供一种利用数据增强和特征加权实现的MOOC辍学预测方法,不仅可以准确发现存在辍学可能性的学习者并及时进行干预,还有助于在线教育持续健康发
展。
[0006]为了实现上述目的,本专利技术采用的技术方案是:
[0007]一种利用数据增强和特征加权实现的MOOC辍学预测方法,其特征在于,包括以下步骤:
[0008]步骤1、定义MOOCs的辍学预测:
[0009]定义1.学习者和课程的属性信息,U和C分别表示学习者和课程集合,则(u,c)表示用户u选修课程c;
[0010]定义2.学习行为数据:在线学习平台会记录学习者c在课程u的视频学习过程中包括开始学习、快进、倍速、暂停、结束播放等行为数据,将学习行为数据分为第t节视频学习行为数据与前t

1节视频学习的行为数据,分别记为x
t
(u,c),x
h
(u,c),则(u,c),则与(1≤i≤m
x
且i为整数,m
x
为学习行为数据的特征个数)表示学习者c在课程u中的第i个与学习相关的值为连续值的行为特征;
[0011]步骤2、辍学者初筛选:
[0012]给定学习者u在课程c前t

1节视频学习行为x
h
(u,c)和第t节视频学习行为x
t
(u,c)以及学习者信息u和课程信息c,则辍学预测的目标是预测学习者是否会继续第t+1视频课程的学习,用y(u,c)∈{0,1}表示第t节视频学习后是否发生辍学的基本事实,当且仅当y(u,c)为“1”表示该学习者在第t节视频学习后发生了辍学,可用函数表示为:
[0013]f:(u,c,x
h
(u,c),x
t
(u,c))

y(u,c)
ꢀꢀꢀ
(1)
[0014]步骤3、构建模型:
[0015]为了能够及时准确地发现潜在的辍学者,构建基于数据增强和特征加权的ACG模型来预测和分析辍学,模型由卷积神经网络、门控循环单元、自注意力机制等部分组成;卷积层用于筛选学习行为中的有效特征,GRU层用于提取学习行为中的时序信息,模型使用上下文信息对学习行为特征进行增强并嵌入为向量,随后,将使用卷积神经网络和门控循环单元提取到的特征信息和使用自注意力机制学习到的特征权重融合用于辍学预测,提高模型的预测能力;
[0016]步骤4、数据增强:
[0017]由于学习者的学习行为对学习者信息、课程信息、历史学习活动高度敏感,模型利用上下文信息对学习行为数据增强,即针对第t节视频的学习活动中的第i个学习活动特征,将学习者信息u、课程信息c、以及第i个特征的历史学习活动扩展到第t节视频学习活动中进行数据增强:
[0018][0019]公式(2)中1≤i≤m
x
,而学习者的第i个特征的历史活动可以由映射函数G得到:数G得到:因此,因此,
[0020]随后,将每一个特征通过嵌入层将每个x转换为密集向量。作为连续变量,通过
将乘以参数向量来获得相应的嵌入向量:
[0021][0022]公式(3)用表示的嵌入矩阵,到这里,可以看作是对学习过程行为数据的数据增强表示;
[0023]步骤5、信息提取:
[0024]模型使用卷积神经网络和门控循环单元进行学习行为中有效信息的提取,CNN自动提取输入数据的重要特征,并且在辍学预测问题中,CNN分类模型进行辍学预测,使用一维卷积神经网络对每一个E
i
(1≤i≤m
x
)进行卷积操作:
[0025]S
i
=σ(W
conv
δ(E
i
)+b
conv
)
ꢀꢀꢀ
(4)
[0026]公式(4)中σ为激活函数,δ是用于将E
i
铺平为一维向量的函数,因此,分别表示E
i
、E卷积后的向量,然后,使用门控循环神经网络进行时序信息提取:
[0027][0028][0029][0030][0031]公式(5)到公式(8)中分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用数据增强和特征加权实现的MOOC辍学预测方法,其特征在于,包括以下步骤:步骤1、定义MOOCs的辍学预测:定义1.学习者和课程的属性信息,U和C分别表示学习者和课程集合,则(u,c)表示用户u选修课程c;定义2.学习行为数据:在线学习平台会记录学习者c在课程u的视频学习过程中包括开始学习、快进、倍速、暂停、结束播放等行为数据,将学习行为数据分为第t节视频学习行为数据与前t

1节视频学习的行为数据,分别记为x
t
(u,c),x
h
(u,c),则(u,c),则与(1≤i≤m
x
且i为整数,m
x
为学习行为数据的特征个数)表示学习者c在课程u中的第i个与学习相关的值为连续值的行为特征;步骤2、辍学者初筛选:给定学习者u在课程c前t

1节视频学习行为x
h
(u,c)和第t节视频学习行为x
t
(u,c)以及学习者信息u和课程信息c,则辍学预测的目标是预测学习者是否会继续第t+1视频课程的学习,用y(u,c)∈{0,1}表示第t节视频学习后是否发生辍学的基本事实,当且仅当y(u,c)为“1”表示该学习者在第t节视频学习后发生了辍学,可用函数表示为:f:(u,c,x
h
(u,c),x
t
(u,c))

y(u,c)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)步骤3、构建模型:为了能够及时准确地发现潜在的辍学者,构建基于数据增强和特征加权的ACG模型来预测和分析辍学,模型由卷积神经网络、门控循环单元、自注意力机制等部分组成;卷积层用于筛选学习行为中的有效特征,GRU层用于提取学习行为中的时序信息,模型使用上下文信息对学习行为特征进行增强并嵌入为向量,随后,将使用卷积神经网络和门控循环单元提取到的特征信息和使用自注意力机制学习到的特征权重融合用于辍学预测,提高模型的预测能力;步骤4、数据增强:由于学习者的学习行为对学习者信息、课程信息、历史学习活动高度敏感,模型利用上下文信息对学习行为数据增强,即针对第t节视频的学习活动中的第i个学习活动特征,将学习者信息u、课程信息c、以及第i个特征的历史学习活动扩展到第t节视频学习活动中进行数据增强:公式(2)中1≤i≤m
x
,而学习者的第i个特征的历史活动可以由映射函数G得到:到:因此,因此,随后,将每一个特征通过嵌入层将每个x转换为密集...

【专利技术属性】
技术研发人员:袁新瑞高彦太
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1