当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于多分类BP-Adaboost的贫困生认定方法技术

技术编号:24890159 阅读:52 留言:0更新日期:2020-07-14 18:17
一种基于多分类BP‑Adaboost的贫困生认定方法,包括以下步骤:(1)获取往年贫困生的多维历史数据,(2)对采集到的往年贫困生历史数据进行预处理,构造学生特征矩阵S;(3)将往年贫困生的多维历史数据按照贫困程度分为三个类别,标注学生贫困类别标签,构造训练数据集;(4)设计BP‑Adaboost分类模型,使用提取的往年各贫困程度的贫困生特征矩阵构造的数据集训练BP‑Adaboost分类模型;(5)训练模型用于贫困生辅助认定。本发明专利技术利用在校学生产生的学生行为数据,设计了一个基于BP‑Adaboost的多分类模型,本模型可以快速、准确的将学生分为三种贫困类别,以此判断学生的贫困情况辅助高校贫困生管理工作人员进行决策。

【技术实现步骤摘要】
一种基于多分类BP-Adaboost的贫困生认定方法
本专利技术属于特征提取和分类算法
,具体涉及一种基于多分类BP-Adaboost的贫困生认定方法。
技术介绍
学生资助是脱贫攻坚、促进教育公平进而实现社会公平的重要内容和重要举措。高校贫困生认定是国家学生资助政策有效落实的基础工作,是推进学生资助精准化的重要内容。目前,大部分高校贫困生评定都是有学生所在地乡镇出示相关证明后由班级公开评选和院系辅导员审核。这种认定模式存在贫困认定偏差、各环节评选容易掺杂个人主观感情、贫困生因自尊心放弃评审等问题,导致影响贫困生资助的公平、效率和准确。大数据时代的来临和深度学习方法日益成熟,为贫困生资助工作带来了新的理念和技术支持,也为高校利用大数据与深度学习方法推进快速、便捷、高效精准资助工作带来了新的机遇。目前高校信息化建设已经取得了长足发展,学生在校园的一切行为都会产生数据,记录着学生各项特征,这类数据反映着学生的真实情况,合理的运用这类数据可以在一定程度上辅助贫困生认定过程,使认定结果更加真实客观,给予真正贫困的学生更多帮助。目前,本文档来自技高网...

【技术保护点】
1.一种基于多分类BP-Adaboost的贫困生认定方法,其特征在于,包括以下步骤:/n步骤1、学生历史行为数据的获取,获取往年贫困生的多维历史数据,往年贫困生多维历史数据包括学生家庭情况与经济情况、校园消费情况、学生成绩情况、贫困生基本信息;/n其获取往年贫困生多维历史数据建立贫困生特征矩阵的具体步骤如下:/n1)提取学生家庭情况与经济情况,包括是否独生子女、是否为孤儿、是否建档立卡贫困户、学生本人是否有残疾或患病、父母是否有残疾或患病、是否城乡特困供养人员、是否城乡最低生活保障家庭;提取校园消费情况,包括消费总金额、日消费额最大值、日消费额均值、月消费额最大值、日消费次数均值;提取学生成绩...

【技术特征摘要】
1.一种基于多分类BP-Adaboost的贫困生认定方法,其特征在于,包括以下步骤:
步骤1、学生历史行为数据的获取,获取往年贫困生的多维历史数据,往年贫困生多维历史数据包括学生家庭情况与经济情况、校园消费情况、学生成绩情况、贫困生基本信息;
其获取往年贫困生多维历史数据建立贫困生特征矩阵的具体步骤如下:
1)提取学生家庭情况与经济情况,包括是否独生子女、是否为孤儿、是否建档立卡贫困户、学生本人是否有残疾或患病、父母是否有残疾或患病、是否城乡特困供养人员、是否城乡最低生活保障家庭;提取校园消费情况,包括消费总金额、日消费额最大值、日消费额均值、月消费额最大值、日消费次数均值;提取学生成绩情况,包括绩点、学期平均成绩、挂科数量;提取贫困生基本情况,包括是否绿色通道入学、是否办理生源地贷款;
2)设学生家庭情况与经济情况数据集E={e1,e2,…,en},其中n表示学生编号,en是一个由是否独生子女、是否为孤儿、是否建档立卡贫困户、是否烈士或优抚子女、学生本人是否有残疾或患病、父母是否有残疾或患病、是否城乡特困供养人员、是否城乡最低生活保障家庭组成的矩阵;
3)设校园消费情况数据集C={c1,c2,…,cn},其中n表示学生编号,cn是一个由消费总金额、日消费额最大值、日消费额均值、月消费额最大值、日消费次数均值组成的矩阵;
4)设学生成绩情况数据集G={g1,g2,…,gn},其中n表示学生编号,gn是一个由绩点、学期平均成绩、挂科数量组成的矩阵;
5)设贫困生基本情况数据集B={b1,b2,…,bn},其中n表示学生编号,bn是一个由是否绿色通道入学、是否办理生源地贷款组成的矩阵;
步骤2、对步骤1采集到的往年贫困生多维历史数据进行预处理;具体步骤为:
1)处理数据集中的缺失值,缺失值使数据丢失了部分信息,对于缺失的空字段使用平均值进行填充;
2)去除重复数据,将往年贫困生数据按照学生编号进行排序,通过比较临近记录是否相似来检测记录是否重复,如有重复则删除重复记录;
3)对学生家庭情况与经济情况数据集E和贫困生基本情况数据集B进行特征编码,采用one-hot编码方式;
4)归一化,对校园消费情况数据集C和学生成绩情况数据集G进行使用Sigmoid函数进行归一化,归一化后的校园消费情况数据集记为学生成绩情况数据集记为
5)将学生家庭情况与经济情况数据集E、校园消费情况数据集学生成绩情况数据集贫困生基本情况数据集B合并成为学生特征矩阵S;
步骤3、将往年贫困生多维历史数据按照贫困程度分为三个类别,标注学生贫困类别标签,构造训练数据集,具体步骤为:
按照往年贫困级别将学生分为三个级别,分别是不贫困、一般贫困、特别贫困,并用one-hot编码,作为学生贫困类别标签,构造训练数据集T,T={(x1,y1),…,(xi,yi),…,(xn,yn)},其中输入数据xi随机抽取于学生特征矩阵S,标签yi∈{001,010,011},这里001,010,011分别对应了不贫困、一般贫困、特别贫困,n为数据数量。
步骤4、设计BP-Adaboost分类模型,使用步骤一中提取的往年各贫困程度的贫困生特征矩阵构造的数据集训练BP-Adaboost分类模型,具体步骤如下:
1)输入训练数据集T,初始化训练数据的权重D=(w11,…,w1...

【专利技术属性】
技术研发人员:杨建锋魏瀚哲王朝阳
申请(专利权)人:西北大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1