【技术实现步骤摘要】
一种学情数据分析模型训练方法及系统
[0001]本专利技术属于人工智能
,涉及一种学情数据分析模型训练方法及系统。
技术介绍
[0002]随着学校信息化系统的持续建设,各类信息化系统积累了海量的学情数据,通过对这些学情数据进行分析挖掘能够形成学生画像,利用学生的画像数据可以帮助教师掌握学生的学习状态,为提高教师的学生管理水平和教学水平提供数据支撑。
[0003]学情数据的分析挖掘包括数据采集、数据分析、特征工程、训练模型、模型评估等步骤,学情数据分析的训练模型对于学情分析至关重要。
技术实现思路
[0004]本专利技术的目的在于克服现有技术中的不足,提供一种学情数据分析模型训练方法及系统。
[0005]第一方面,本专利技术提供了一种学情数据分析模型训练方法,所述方法包括:
[0006]获取采集原始学情数据,所述原始学情数据包括特征数据和标签数据;
[0007]通过MapReduce算法对原始学情数据进行数据预处理,提取所述原始学情数据所对应的特征重要性的列表,所述特征重要 ...
【技术保护点】
【技术特征摘要】
1.一种学情数据分析模型训练方法,其特征在于,所述方法包括:获取采集原始学情数据,所述原始学情数据包括特征数据和标签数据;通过MapReduce算法对原始学情数据进行数据预处理,提取所述原始学情数据所对应的特征重要性的列表,所述特征重要性用于表示特征数据与标签数据之间的相关性;根据所述原始学情数据所对应的特征重要性的列表,选取特征重要性较高的特征数据构建训练数据集;基于训练数据集进行机器学习算法训练,获得学情数据分析模型。2.根据权利要求1所述的学情数据分析模型训练方法,其特征在于,所述特征数据包括班级排名、专业排名、学科排名、处分类型、奖励等级、考勤次数、学科成绩。3.根据权利要求1所述的学情数据分析模型训练方法,其特征在于,所述标签数据包括学习态度、动手能力、学习动力、学习兴趣。4.根据权利要求1所述的学情数据分析模型训练方法,其特征在于,所述通过MapReduce算法对原始学情数据进行数据预处理包括以下步骤:在map阶段,读取原始学情数据集文件,将原始学情数据集文件分解为若干小文件,通过计算获得每个小文件所对应的特征数据的特征重要性的列表;在reduce阶段,汇总形成所述原始学情数据所对应的特征重要性的列表。5.根据权利要求4所述的学情数据分析模型训练方法,其特征在于,所述若干小文件均包括全部特征数据和1个标签数据。6.根据权利要求4所述的学情数据分析模型训练方法,其特征在于,通过随机森林算法计算获得每个小文件所包含的特征...
【专利技术属性】
技术研发人员:李方方,
申请(专利权)人:南京信息职业技术学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。