一种基于多源稀疏注意力卷积网络的学生成绩预测方法技术

技术编号:34687989 阅读:52 留言:0更新日期:2022-08-27 16:21
本发明专利技术涉及一种基于多源稀疏注意力卷积神经网络的学生成绩预测方法,属于计算机技术领域。该方法将学生知识水平动态发展整合到学生特征,采用多尺度卷积神经网络挖掘课程结构化特征,采用稀疏注意力网络挖掘课程间的关联关系,整合多源信息实现个性化预测,实现了预测任意学生在任意课程成绩的泛化建模。相比于基线方法,本发明专利技术具有更高的预测准确率,且在各种冷启动情况下都能取得比基线方法更高预测准确率。另外,通过分析注意力层权重可以解释模型预测结果,挖掘课程间关联关系,构造专业课程关联图。业课程关联图。业课程关联图。

【技术实现步骤摘要】
一种基于多源稀疏注意力卷积网络的学生成绩预测方法


[0001]本专利技术属于计算机技术(智慧教育)领域,具体涉及一种基于多源稀疏注意力卷积神经网络的成绩预测方法。

技术介绍

[0002]现有学生成绩预测研究工作主要可以分为:基于矩阵分解的方法、基于相似性度量的方法和基于映射的方法。
[0003]矩阵分解的方法旨在通过学生特征矩阵和课程特征矩阵的乘积近似成绩矩阵,学生成绩通常被形式化为“学生

课程”矩阵。然而,基于矩阵分解的方法存在数据冷启动问题,即无法预测训练集中未出现过的学生的成绩或训练集中未出现过的课程的成绩。
[0004]相似性度量的方法基于在历史表现类似的学生在未来的表现也会相似的假设,算法旨在发现学生记录中类似的模式,即在训练集中寻找与测试样本相似的学生样本。然而,基于相似性度量的方法存在距离度量不确定和预测成本高的问题。
[0005]基于映射的方法旨在构建从“学生

课程”特征到成绩的映射。基于映射的方法又可以分为传统机器学习方法和深度神经网络。基于映射的传统机器学习方法无法建模课程之间的关联关系与课程组织的层次结构。基于映射的深度神经网络多集中于使用在线学习平台记录的学生行为数据,预测时序课程成绩。例如Aljohani等人基于学生与在线学习平台进行交互时产生的点击流信息,利用长短期记忆网络进行成绩预测;Kim等人将课程按照时序关系组织,提出了一种基于双向长短期记忆网络的GritNet;Ma等人使用行为数据来预测学生课程成绩,提出了双路径卷积神经网络DPCNN。
[0006]然而,传统线下教育中课程并不是按照严格的时序关系组织。课程根据先修关系安排在多个学期,同一学期内课程并行开展,课程组织呈现出层次结构。学生的知识水平随修课数量增多逐渐增长。现有的基于深度神经网络的方法忽略了传统线下教育中课程组织的层次结构以及学生的知识水平动态变化的问题,且只能预测特定的课程或学生,缺乏泛化建模。因此,基于传统课堂教育数据,利用深度学习进行学生成绩预测的工作尚待探索。

技术实现思路

[0007]要解决的技术问题
[0008]学生成绩预测的核心任务是评估学生知识水平。从学生角度来说,学习是一个循序渐进的过程,学生的知识状态随着修课数量的增多动态变化,学生的知识水平影响着其学习表现,在其掌握程度较高的课程上通常表现出较好的成绩。从课程角度来说,课程间的关联关系影响着学生成绩,学生在有相似知识或强关联关系的课程中可能会取得近似的成绩。此外,课程组织结构反映了学科的知识体系,线下传统教育的课程按照先修关系安排在不同学期,且在低年级安排基础内容教学,高年级安排逻辑内容教学,课程的组织呈现出层次结构。相关研究表明,卷积神经网络不但可以学习有效的样本表征,而且在捕捉数据的细粒度局部结构和数据空间的结构信息上也有很强的能力,同时易于泛化。
[0009]因此,本专利技术针对现有研究缺乏课程结构层次建模、缺乏对学生知识水平动态增长建模、课程间关联关系建模以及缺乏预测任意学生、任意课程的泛化建模等问题,提出了一种基于多源稀疏注意力卷积神经网络的成绩预测方法。本专利技术从学生对于课程知识掌握程度研究学生知识水平,可以帮助教学过程所有参与者理解学生学习表现,优化课程结构,提高课程质量,制定合理的课程计划或教学安排。
[0010]技术方案
[0011]一种基于多源稀疏注意力卷积网络的学生成绩预测方法,其特征在于步骤如下:
[0012]步骤1:构建数学模型
[0013]采用表示学生i的人口统计特征,表示第j门课程的特征,g
ij
表示学生i在第j门课程上的成绩;由于数据集中每一个预测目标g
ij
代表了学生不同的知识水平,因此假设每一条学习记录对应于一个独立的个体,即数据集中所有学习记录独立同分布;在这样的假设下,将学生在所有课程中的成绩作为学生当前的知识水平特征整合到学生特征中其中g
i
=(g
i1
;g
i2
;...g
ik
),k是数据集包含的课程数量,如果学生i未修过课程t(1≤t≤k),则g
it
=0;
[0014]基于以上假设,一条学习记录表示为{x
i
,y
i
},其中y
i
=g
ij
;学生成绩预测问题被定义为:给定n条遵循独立同分布的成绩记录寻找一个映射函数使得从而预测学生在未知课程上的成绩
[0015]步骤2:构建目标函数
[0016]从成绩特征g
i
和背景特征中分别提取特征,模型的目标函数来自于最小化两部分数据的损失函数;
[0017]步骤2

1:第一部分数据g
i
与课程间的关联关系和课程组织的局部结构化特征有关,定义成绩特征g
i
的映射函数
[0018][0019]式中,用于学习课程全局关系特征,用于挖掘课程局部结构化特征,f1(x
i
)是结果特征;通过最小化损失函数学习第一部分数据g
i
的特征映射函数
[0020][0021]步骤2

2:第二部分数据包括描述学生和课程的背景信息,定义映射函数
[0022][0023]通过最小化损失学习第二部分数据的特征映射函数
[0024][0025]步骤2

3:令f(x
i
)=(f1(x
i
);f2(x
i
)),结合公式(2)和(4),得到最终的目标函数:
[0026][0027]步骤3:基于神经网络学习全局课程关系映射函数局部结构化特征映射函数和分类映射函数
[0028]步骤3

1:稀疏注意力网络学习全局课程关系映射函数
[0029]引入稀疏注意力网络识别与预测目标课程关联性较强的课程子集:
[0030][0031]式中,SFC是稀疏全连接层,h
i
是稀疏全连接层的第i个元素,权重为w
i
,SFC定义为:
[0032][0033]式中,λ是稀疏连接参数,使用softmax函数将注意力权重归一化:
[0034][0035]最后为成绩特征g
i
加权:
[0036][0037]式中,式中,表示向量内积;
[0038]步骤3

2:多尺度卷积神经网络学习课程局部结构化特征映射函数
[0039]将课程成绩数据根据{学期{课程结束时间{课程类别}}}组织为3层层次结构,然后使用多尺度一维卷积从层次结构的课程成绩中提取潜在的时序特征:
[0040][0041]式中,表示第l层中第q个一维特征图的第t个元素;表示第l层中第q个卷积核向量的第j个元素;a是卷积核大小;1≤t≤T,T是的长度;CNN的输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多源稀疏注意力卷积网络的学生成绩预测方法,其特征在于步骤如下:步骤1:构建数学模型采用表示学生i的人口统计特征,表示第j门课程的特征,g
ij
表示学生i在第j门课程上的成绩;由于数据集中每一个预测目标g
ij
代表了学生不同的知识水平,因此假设每一条学习记录对应于一个独立的个体,即数据集中所有学习记录独立同分布;在这样的假设下,将学生在所有课程中的成绩作为学生当前的知识水平特征整合到学生特征中其中g
i
=(g
i1
;g
i2
;...g
ik
),k是数据集包含的课程数量,如果学生i未修过课程t(1≤t≤k),则g
it
=0;基于以上假设,一条学习记录表示为{x
i
,y
i
},其中y
i
=g
ij
;学生成绩预测问题被定义为:给定n条遵循独立同分布的成绩记录寻找一个映射函数使得从而预测学生在未知课程上的成绩步骤2:构建目标函数从成绩特征g
i
和背景特征中分别提取特征,模型的目标函数来自于最小化两部分数据的损失函数;步骤2

1:第一部分数据g
i
与课程间的关联关系和课程组织的局部结构化特征有关,定义成绩特征g
i
的映射函数的映射函数式中,用于学习课程全局关系特征,用于挖掘课程局部结构化特征,f1(x
i
)是结果特征;通过最小化损失函数学习第一部分数据g
i
的特征映射函数的特征映射函数步骤2

2:第二部分数据包括描述学生和课程的背景信息,定义映射函数包括描述学生和课程的背景信息,定义映射函数通过最小化损失学习第二部分数据的特征映射函数的特征映射函数步骤2

3:令f(x
i
)=(f1(x
i
);f2(x
i
)),结合公式(2)和(4),得到最终的目标函数:步骤3:基于神经网络学习全局课程关系映射函数局部结构化特征映射函数和分类映射函数步骤3

1:稀疏注意力网络学习全局课程关系映射函数引入稀疏注意力网络识别与预测目标课程关联性较强的课程子集:式中,SFC是稀疏全连接层,h
i
是稀疏全连接层的第i个元素,权重为w
i
,SFC定义为:
式中,λ是稀疏连接参数,使用softmax函数将注意力权重归一化:最后为成绩特征g
i
加权:式中...

【专利技术属性】
技术研发人员:张育培尚学群安蕊刘树慧崔嘉琪
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1