【技术实现步骤摘要】
一种基于多层门控神经网络的学情预测方法
[0001]本专利技术属于学情预测
,尤其涉及一种基于多层门控神经网络的学情预测方法。
技术介绍
[0002]本科生的成绩关系着未来的奖学金、毕业乃至未来的研究生录取、工作录取情况。若缺少事先的提醒与督促,学生们很可能会对某一学课程缺少重视,而导致低分甚至挂科,影响未来生活。因此,根据学生的当前成绩等因素,如何精确地预测其未来的成绩走向,是当前教育领域重点关注的问题。目前,对学生未来成绩的判断主要基于人工评判,即教师观察学生的以往成绩,对于以往成绩不好的学生进行提醒与教育,以督促其通过后续的考试。
[0003]另外,奖学金、优秀学生等的评选多依靠学生排名而非成绩,因此,如何能够对学生的未来排名做出精确地预测,也具有重要的意义,而目前无法对学生排名进行有效预测。
[0004]总体而言,现有的人工学情预测方法存在以下不足之处:(1)基于人工为主的经验的模型,严重依赖于教师的个人能力,效率不足、准确性低、推广性差;(2)只考虑到了学生自身的往常成绩,而未考虑到课程自身的 ...
【技术保护点】
【技术特征摘要】
1.一种基于多层门控神经网络的学情预测方法,其特征在于,包括如下步骤:步骤1.从教务系统数据库中收集原始数据,包括学生的性别、籍贯、前两学期的成绩与奖学金情况,并统计当前学期的待预测课程在前两学期的总体成绩情况;步骤2.对原始数据首先进行量化以及标准化预处理操作,然后将预处理后的数据进行拼接操作,得到对应于每个学生的两个一维输入向量数据;其中,每个一维向量分别对应该学生前两个学期中一个学期的数据;同时,将从教务系统数据库中采集到的每个学生在当前学期的真实成绩与真实排名区间段,分别作为该学生的真实成绩标签数据以及真实排名标签数据;真实成绩标签数据与真实排名标签数据作为真实值,分别对应一个一维输入向量;将对应于同一学生的两个一维输入向量数据、真实成绩标签数据以及真实排名标签数据,作为该学生的样本数据;将所有学生的样本数据分为训练样本数据集以及测试样本数据集;步骤3.根据输入输出数据维度,搭建多层门控神经网络,作为成绩预测模型;步骤4.将训练样本数据集中每个训练样本的两个一维向量数据作为成绩预测模型的输入,输入到成绩预测模型中,设置迭代次数进行训练,得到训练集的成绩预测数据;计算成绩预测数据与真实成绩标签数据的损失值,选取优化器,对多层门控神经网络参数进行优化,获得优化后的网络参数,得到训练后的成绩预测模型;步骤5.根据输入输出数据维度,搭建多层门控神经网络,作为排名预测模型;利用迁移学习方法,排名预测模型在步骤4中优化后的网络参数的基础上,继续进行二次训练,排名预测模型的输入为训练数据集中训练样本的两个一维向量,设置迭代次数进行训练,排名预测模型的输出为训练样本数据集的排名预测数据;计算排名预测数据与真实排名标签数据的损失值,选取优化器,其中,在训练过程中多层门控神经网络参数的输入层以及隐藏层系数被冻结,仅需对输出层系数进行优化;训练结束后,得到训练后的排名预测模型;步骤6.使用成绩测试样本数据集对步骤4训练好的成绩预测模型进行性能测试,若得到的成绩预测数据的正确率大于设定的正确率阈值,则转到步骤8;否则,转到步骤4,修改迭代次数,重新对成绩预测模型进行训练,直至满足要求;步骤7.使用排名测试样本数据集对步骤5训练好的排名预测模型进行性能测试,若得到的排名预测数据的正确率大于设定正确率阈值,则转到步骤8;否则,转到步骤5,修改迭代次数,重新对排名预测模型进行训练,直至满足要求;步骤8.利用成绩预测模型以及排名预测模型对学生的成绩和排名分别进行预测。2.根据权利要求1所述的基于多层门控神经网络的学情预测方法,其特征在于,所述步骤2中,一维向量数据的获取过程如下:2.1.学生性别的量化;对于学生性别,男性被编码为1,女性则被编码为0;量化后生成一个1*1维的向量;2.2.学生籍贯量化;根据身份证号前两位,获得学生所在的地区,针对于34个省级行政区和国外情况,利用one
‑
hot编码方式,生成一个1*35维度的向量,按顺序依次对其进行编码;2.3.学生往年成绩量化与标准化;
针对待预测课程,分别查找学生在前两学期获得的所有与待预测课程具有相同开课院系的课程,即相同类型的课程成绩,取每个学期与待预测课程具有相同类型的课程中的最高分数、最低分数以及加权平均分数、挂科数量、重修情况,并放入1*5维度的向量中;若学生某一学期未修过与相同类型的课程,则取学生该学期所有课程的成绩最高分数、最低分数以及加权平均分数、挂科数量、重修情况,放入1*5维度的向量中;若学生在某一学期未修过任何课程,设置此学期的1*5维度向量的默认值为[80,80,80,0,0];某一学期的加权平均分数由以下公式得到:其中c
i
表示某课程学分,s
i
表示该课程的对应分数,s
new
表示最终获得的该学期参与计算的课程的加权平均分;对于成绩无具体分数,只以优秀、良好、一般、合格、待合格区分,各等级将分别转换为90、80、70、60、0分;对于以通过与不通过分级的学科,分别以60和0分为代替;以上所有成绩在量化为具体数值后,将使用标准化公式(2)对最高分数、最低分数以及加权平均分数进行压缩,使以上所有成绩数据分布在[0,1]范围内;若当前课程是重修课程,则设置重修课程为0,否则设置重修课程为1;2.4.奖学金量化;在获取学生往年奖学金情况后,按国家级、地方级、校级对奖学金分级量化,分别编码为1、0.75、0.25,没有则为0,若学生获得多项奖学金,则进行累加操作;奖学金量化后生成一个1*1维的向量;2.5.待预测课程的以往总体成绩量化;取该课程前两学期的总体成绩,分别计算每个学期的最高分数、最低分数、最多分数、课程学分、通过率,并使用标准化公式(2)对每个学期的最高分数、最低分数、最多分数进行压缩,使每个学期该课程的最高分数、最低分数、最多分数数据均分布在[0,1]范围内;另外将课程学分压缩为原先的1/10,并将通过率由百分比转换为小数形式,以使课程学分、通过率也基本分布在[0,1]范围内,并最终将压缩后的数据放入1*5维向量;上述操作中,使用到的标准化公式为:其中,x
inew
表示标准化后的新数据,x
i
表示某学生个体的单科成绩原始分数,max表示该课程的成绩最高分数,min表示该课程的成绩最低分数;若待预测的课程在前两学期有未开课情况,则依次从更早的学期中寻找该课程的数据作为代替,直至获得共两学期的开课成绩数据;若该待预测课程为新开课或开课不满两学期,则取默认值为[80,80,80,1,100],标准化数据为[0.8,0.8,0.8,0.1,1];将步骤2.1至步骤2.5中得到的前两个学期中每个学期的数据进行横向拼接,得到两个1*47维向量,其中,每个1*47维向量分别对应一个学期的数据。3.根据权利要求1所述的基于多层门控神经网络的学情预测方法,其特征在于,所述步骤2中,真实成绩标签数据以及真实排名标签数据的获取过程如下:
对当前学期真实成绩进行提取与量化处理,真实成绩直接从教务系统数据库中成绩数据表内遍历得到,并按照分值不同,划分到90
‑
100分、80
‑
90分、70
‑
80分、60
‑
70分、50
‑
60分、0
‑
50分六个成绩区间中;针对六个成绩区间,利用one
‑
hot编码方式,量化为1*6的成绩标签向量,即真实成绩标签数据;需要对同年级同专业同班级的学生成绩进行遍历比较,以获得学生的真实排名,并进一步将排名转化为百分比形式,并且进一步将其划分为0
‑
10%、10
‑
20%、20
‑
30%、30
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。