一种成绩预测方法、系统、计算机设备及存储介质技术方案

技术编号:27196202 阅读:17 留言:0更新日期:2021-01-31 11:52
本发明专利技术公开了一种成绩预测方法,包括:获取教育大数据平台中的学生数据;将所述学生数据按专业进行划分获得专业学生数据集;将所述专业学生数据按学期划分为历届专业学生数据集和本届专业学生数据集;选择要预测成绩的目标科目,以所述历届专业学生数据集中的目标科目成绩数据为目标,以所述历届专业学生数据集中的其他数据为特征,对SVM成绩预测模型进行训练;将本届专业学生数据集中的数据输入训练好的SVM成绩预测模型,输出本届专业学生的目标科目的预测成绩。本发明专利技术还公开了一种成绩预测系统、计算机设备以及存储介质。采用本发明专利技术,能够具备对多源异构数据融合以及海量数据处理的能力,同时成绩的预测更为精准。同时成绩的预测更为精准。同时成绩的预测更为精准。

【技术实现步骤摘要】
一种成绩预测方法、系统、计算机设备及存储介质


[0001]本专利技术涉及成绩预测领域,尤其涉及一种成绩预测方法、系统、计算机设 备及存储介质。

技术介绍

[0002]现有的成绩预测技术大多基于同源的、小规模的教育数据,缺乏对多源异 构数据融合以及海量数据处理的能力。现有的成绩预测技术在实际应用过程中 存在预测精准率低的问题。

技术实现思路

[0003]本专利技术所要解决的技术问题在于,提供一种成绩预测方法、系统、计算机 设备及存储介质,能够具备对多源异构数据融合以及海量数据处理的能力,同 时成绩的预测更为精准。
[0004]为了解决上述技术问题,本专利技术提供了一种成绩预测方法,包括:获取教 育大数据平台中的学生数据;将所述学生数据按专业进行划分获得专业学生数 据集;将所述专业学生数据按学期划分为历届专业学生数据集和本届专业学生 数据集;选择要预测成绩的目标科目,以所述历届专业学生数据集中的目标科 目成绩数据为目标,以所述历届专业学生数据集中的其他数据为特征,对SVM 成绩预测模型进行训练;将本届专业学生数据集中的数据输入训练好的SVM成 绩预测模型,输出本届专业学生的目标科目的预测成绩。
[0005]优选地,所述获取教育大数据平台中的学生数据的步骤包括:使用Spark 计算引擎来获取学生数据,其中,所述学生数据包括学工系统及教务系统中的 学生基本信息、专业信息、课程信息、成绩信息,一卡通系统中的学生消费信 息以及日志文件中的学生上网信息数据;使用XML配置文件来自动读取不同数 据源并完成数据的规范化。
[0006]优选地,所述获取教育大数据平台中的学生数据的步骤之后还包括:对所 述学生数据进行清洗处理,其中,包缺失值填补与异常值检测;对清洗处理后 的学生数据进行依据关键属性进行整合并标准化处理。
[0007]优选地,SVM分类模型的hinge loss函数为:
[0008][0009]其中,j≠y
i
代表不正确的分类,s
j
为不正确分类的分量值,为标签的 one-hot向量中为1的分量,Δ为SVM的决策边界,为类别平衡权重向量,α 代表错误分类的惩罚因子。
[0010]本专利技术还提供了一种成绩预测系统,包括:包括获取模块、划分模块、模 型构建模块以及预测模块;所述获取模块用于获取教育大数据平台中的学生数 据;所述划分模块用于将所述学生数据按专业进行划分获得专业学生数据集, 用于将所述专业学生数据按学期划分为历届专业学生数据集和本届专业学生数 据集;所述模型构建模块用于选择要预
测成绩的目标科目,以所述历届专业学 生数据集中的目标科目成绩数据为目标,以所述历届专业学生数据集中的其他 数据为特征,对SVM成绩预测模型进行训练;所述预测模块用于将本届专业学 生数据集中的数据输入训练好的SVM成绩预测模型,输出本届专业学生的目标 科目的预测成绩。
[0011]优选地,所述获取模块使用Spark计算引擎来获取学生数据,其中,所述学 生数据包括学工系统及教务系统中的学生基本信息、专业信息、课程信息、成 绩信息,一卡通系统中的学生消费信息以及日志文件中的学生上网信息数据; 使用XML配置文件来自动读取不同数据源并完成数据的规范化。
[0012]优选地,所述成绩预测系统还包括清洗融合模块,所述清洗融合模块用于 对所述学生数据进行清洗处理,其中,包缺失值填补与异常值检测;对清洗处 理后的学生数据进行依据关键属性进行整合并标准化处理。
[0013]优选地,所述模型构建模块构建的SVM分类模型的hinge loss函数为:
[0014][0015]其中,j≠y
i
代表不正确的分类,s
j
为不正确分类的分量值,为标签的 one-hot向量中为1的分量,Δ为SVM的决策边界,为类别平衡权重向量,α 代表错误分类的惩罚因子。
[0016]本专利技术还提供了一种计算机设备,包括存储器、处理器及存储在存储器上 并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现上述方法 的步骤。
[0017]本专利技术还提供了一种存储介质,其存储有计算机指令,该程序被处理器执 行时实现上述方法的步骤。
[0018]实施本专利技术的有益效果在于:
[0019]本专利技术提供的一种成绩预测方法、系统、计算机设备及存储介质,基于读 取XML配置文件方式,实现了一种多源异构数据的自动获取和规范化机制,提 出了一种改良的hinge loss损失函数,能有效地提高SVM分类模型的预测精准 度。本专利技术将大数据技术与教育数据挖掘技术深度融合,挖掘出更多的表征学 生学习成绩的信息和知识,从数据层面有效地提高模型的训练效果。本专利技术针 对成绩预测的实际应用目的,对模型训练的损失函数进行了改良,相比其他方 法在提高精准度方面有明显地提高。
附图说明
[0020]图1是本专利技术提供的成绩预测方法流程图;
[0021]图2是本专利技术提供的成绩预测系统示意图。
具体实施方式
[0022]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术 作进一步地详细描述。仅此声明,本专利技术在文中出现或即将出现的上、下、左、 右、前、后、内、外等方位用词,仅以本专利技术的附图为基准,其并不是对本发 明的具体限定。
[0023]如图1所示,本专利技术提供了一种成绩预测方法,包括:
[0024]S101,获取教育大数据平台中的学生数据。
[0025]S102,将所述学生数据按专业进行划分获得专业学生数据集。
[0026]S103,将所述专业学生数据按学期划分为历届专业学生数据集和本届专业 学生数据集。
[0027]S104,选择要预测成绩的目标科目,以所述历届专业学生数据集中的目标 科目成绩数据为目标,以所述历届专业学生数据集中的其他数据为特征,对SVM 成绩预测模型进行训练。
[0028]S105,将本届专业学生数据集中的数据输入训练好的SVM成绩预测模型, 输出本届专业学生的目标科目的预测成绩。
[0029]本专利技术提供的成绩预测方法,将大数据技术与教育数据挖掘技术深度融合, 挖掘出更多的表征学生学习成绩的信息和知识,通过分析历届学生的数据,从 数据层面有效地提高模型的训练效果,从而实现对本届学生的成绩预测。
[0030]优选地,所述获取教育大数据平台中的学生数据的步骤包括:使用Spark 计算引擎来获取学生数据,其中,所述学生数据包括学工系统及教务系统中的 学生基本信息、专业信息、课程信息、成绩信息,一卡通系统中的学生消费信 息以及日志文件中的学生上网信息数据;使用XML配置文件来自动读取不同数 据源并完成数据的规范化,从而实现了一种多源异构数据的自动获取机制。
[0031]需要说明的是,有的教育大数据平台中数据的存储方法不一,有存储于分 布式数据库系统(hive,Hbase)中的结构化数据和存储于分布式文件系统(HDFS) 中的非结构化数据,并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种成绩预测方法,其特征在于,包括:获取教育大数据平台中的学生数据;将所述学生数据按专业进行划分获得专业学生数据集;将所述专业学生数据按学期划分为历届专业学生数据集和本届专业学生数据集;选择要预测成绩的目标科目,以所述历届专业学生数据集中的目标科目成绩数据为目标,以所述历届专业学生数据集中的其他数据为特征,对SVM成绩预测模型进行训练;将本届专业学生数据集中的数据输入训练好的SVM成绩预测模型,输出本届专业学生的目标科目的预测成绩。2.如权利要求1所述的成绩预测方法,其特征在于,所述获取教育大数据平台中的学生数据的步骤包括:使用Spark计算引擎来获取学生数据,其中,所述学生数据包括学工系统及教务系统中的学生基本信息、专业信息、课程信息、成绩信息,一卡通系统中的学生消费信息以及日志文件中的学生上网信息数据;使用XML配置文件来自动读取不同数据源并完成数据的规范化。3.如权利要求1所述的成绩预测方法,其特征在于,所述获取教育大数据平台中的学生数据的步骤之后还包括:对所述学生数据进行清洗处理,其中,包缺失值填补与异常值检测;对清洗处理后的学生数据进行依据关键属性进行整合并标准化处理。4.如权利要求1所述的成绩预测方法,其特征在于,所述SVM分类模型的hingeloss函数为:其中,j≠y
i
代表不正确的分类,s
j
为不正确分类的分量值,为标签的one-hot向量中为1的分量,Δ为SVM的决策边界,为类别平衡权重向量,α代表错误分类的惩罚因子。5.一种成绩预测系统,其特征在于,包括:包括获取模块、划分模块、模型构建模块以及预测模块;所述获取模块用于获取教育大数据平台中的学生数据;所述划分模块用于将所述学生数据按专业进行划分获得专业学生数据集,用...

【专利技术属性】
技术研发人员:汪凡罗龙韩高强陈国镇
申请(专利权)人:三盟科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1