一种学情数据分析模型训练方法及系统技术方案

技术编号:32007780 阅读:26 留言:0更新日期:2022-01-22 18:24
本发明专利技术公开了一种学情数据分析模型训练方法及系统,所述方法包括获取采集原始学情数据,所述原始学情数据包括特征数据和标签数据;通过MapReduce算法对原始学情数据进行数据预处理,提取所述原始学情数据所对应的特征重要性的列表,所述特征重要性用于表示特征数据与标签数据之间的相关性;根据所述原始学情数据所对应的特征重要性的列表,选取特征重要性较高的特征数据构建训练数据集;基于训练数据集进行机器学习算法训练,获得学情数据分析模型。本发明专利技术通过MapReduce算法对原始学情数据进行数据预处理,选择特征重要性较高的特征数据构建训练数据集,大大降低训练模型的计算规模和计算时间,提高了模型的训练效率和模型质量。质量。质量。

【技术实现步骤摘要】
一种学情数据分析模型训练方法及系统


[0001]本专利技术属于人工智能
,涉及一种学情数据分析模型训练方法及系统。

技术介绍

[0002]随着学校信息化系统的持续建设,各类信息化系统积累了海量的学情数据,通过对这些学情数据进行分析挖掘能够形成学生画像,利用学生的画像数据可以帮助教师掌握学生的学习状态,为提高教师的学生管理水平和教学水平提供数据支撑。
[0003]学情数据的分析挖掘包括数据采集、数据分析、特征工程、训练模型、模型评估等步骤,学情数据分析的训练模型对于学情分析至关重要。

技术实现思路

[0004]本专利技术的目的在于克服现有技术中的不足,提供一种学情数据分析模型训练方法及系统。
[0005]第一方面,本专利技术提供了一种学情数据分析模型训练方法,所述方法包括:
[0006]获取采集原始学情数据,所述原始学情数据包括特征数据和标签数据;
[0007]通过MapReduce算法对原始学情数据进行数据预处理,提取所述原始学情数据所对应的特征重要性的列表,所述特征重要性用于表示特征数据与本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种学情数据分析模型训练方法,其特征在于,所述方法包括:获取采集原始学情数据,所述原始学情数据包括特征数据和标签数据;通过MapReduce算法对原始学情数据进行数据预处理,提取所述原始学情数据所对应的特征重要性的列表,所述特征重要性用于表示特征数据与标签数据之间的相关性;根据所述原始学情数据所对应的特征重要性的列表,选取特征重要性较高的特征数据构建训练数据集;基于训练数据集进行机器学习算法训练,获得学情数据分析模型。2.根据权利要求1所述的学情数据分析模型训练方法,其特征在于,所述特征数据包括班级排名、专业排名、学科排名、处分类型、奖励等级、考勤次数、学科成绩。3.根据权利要求1所述的学情数据分析模型训练方法,其特征在于,所述标签数据包括学习态度、动手能力、学习动力、学习兴趣。4.根据权利要求1所述的学情数据分析模型训练方法,其特征在于,所述通过MapReduce算法对原始学情数据进行数据预处理包括以下步骤:在map阶段,读取原始学情数据集文件,将原始学情数据集文件分解为若干小文件,通过计算获得每个小文件所对应的特征数据的特征重要性的列表;在reduce阶段,汇总形成所述原始学情数据所对应的特征重要性的列表。5.根据权利要求4所述的学情数据分析模型训练方法,其特征在于,所述若干小文件均包括全部特征数据和1个标签数据。6.根据权利要求4所述的学情数据分析模型训练方法,其特征在于,通过随机森林算法计算获得每个小文件所包含的特征...

【专利技术属性】
技术研发人员:李方方
申请(专利权)人:南京信息职业技术学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1