一种基于多维度评价的高校贫困生认证方法及其系统技术方案

技术编号:31805012 阅读:17 留言:0更新日期:2022-01-08 11:06
本发明专利技术属于高校学生贫困生资助领域,具体涉及一种基于多维度评价的高校贫困生认证方法及其系统,该方法包括:获取待认定学生的信息;将获取的信息输入到学生贫困生认证预测模型中,得到贫困认证结果;根据贫困认证结果对待认证的学生进行分类,完成贫困生认定;本发明专利技术对待认定的人员的信息采集更全面,不仅对申请者的个人消费情况、学习态度情况、日常行为情况、勤工俭学情况、助学贷款申请情况进行采集,还对申请者的家庭基本情况进行采集,使贫困资助系统更加数据更加精确,贫困评估更加全面。面。面。

【技术实现步骤摘要】
一种基于多维度评价的高校贫困生认证方法及其系统


[0001]本专利技术属于高校学生贫困生资助领域,具体涉及一种基于多维度评价的高校贫困生认证方法及其系统。

技术介绍

[0002]贫困生资助是各大高校每年必做的工作,而目前,传统的贫困生资助认证方式单一,往往通过乡镇盖章,提交申请,学生小组认证评定的方式进行评定贫困生。然而传统的贫困生资助认证方式存在一系列的弊端,首先许多非贫困生也能轻易地拿到乡镇盖章,从而通过认证,申请到不属于他们的贫困生资助;其次,在学生小组认证评定过程中,容易受到参与认定的人员主观因数的影响,造成评定结果不准确;最后,贫困生认证往往一次认证,多年持续认定,不能实时检测该生是否仅为暂时贫困,使得不能确保助学金均落实到真正有需要的学生身上。为提高助学金的精准度,依托信息科学及平台,确保助学金真正落实到有需要的学生身上,急需建立了一种能实时检测学生是否贫困的认证系统。

技术实现思路

[0003]为解决以上现有技术存在的问题,本专利技术提出了一种基于多维度评价的高校贫困生认证方法,该方法包括:获取待认定学生的信息;将获取的信息输入到学生贫困生认证预测模型中,得到贫困认证结果;根据贫困认证结果对待认证的学生进行分类,完成贫困生认定;
[0004]对贫困生认定模型进行训练的过程包括:
[0005]S1:获取学生的数据信息,将获取的数据信息集成数据库;
[0006]S2:采用SMOTE算法对数据库中的数据进行预处理,对预处理后的数据进行划分,得到训练集和测试集;
[0007]S3:将训练集中的数据输入到学生贫困生认证预测模型中进行训练,得到当前训练的模型;
[0008]S4:将测试集中的数据输入到步骤S3中训练的模型中进行测试,根据测试结果计算贫困生预测的综合指标;
[0009]S5:调整学生贫困生认证预测模型的参数,并重复步骤S3~步骤S4,直到贫困生预测的综合指标达到最优值,则完成模型的训练。
[0010]优选的,获取的学生数据信息包括:学生家庭信息、学生个人消费信息、学生学习态度信息、学生日常行为信息、学生勤工俭学信息以及学生贷款申请信息。
[0011]优选的,将获取的数据信息集成数据库的过程包括:
[0012]步骤1:采用COUNT函数对获取的数据信息进行整理分析,删除数据中重复的数据;
[0013]步骤2:将整理后的数据信息进行集合,得到数据表;
[0014]步骤3:采用聚类离群点的检测方法对数据表中的数据进行检测,删除异常数据,得到数据库。
[0015]进一步的,采用聚类离群点的检测方法对数据表中的数据进行检测的公式为:
[0016][0017]其中,D表示数据集中所有样本数据的误差平方和,K表示分类的个数,p表示任意给定的样本数据,c
i
表示第i个簇,n
i
表示簇c
i
的均值。
[0018]优选的,采用SMOTE算法对数据库中的数据进行预处理的过程包括:
[0019]第一步,对每一个稀有类样本x,找到与之距离最小的第k个邻近样本,令向上采样倍率为N,从这k个距离最小的邻近样本中随机选择n个样本,并记作(X1,X2,X3,

,X
n
);
[0020]第二步,在少数类数据样本x与X
i
(i=1,2,

,n)之间,采用随机性的线性插值方法合成新的少数类样本X
new
=x+rand*(X
i
),其中rand代表0到1之间的任何一个随机数值,X
i
代表x的第i个随机样本;
[0021]第三步,将合成的新样本插入到数据集中,形成新的数据集。
[0022]优选的,将训练集中的数据输入到学生贫困生认证预测模型中进行训练的过程包括:
[0023]S31:设置迭代次数k;
[0024]S32:从训练集中进行k次有放回的抽样,每次抽取n个训练样本,得到k个训练子集S={S1,S2,

,S
k
};
[0025]S33:采用信息增益计算方法求取每个训练子集中所有属性的信息增益,选择信息增益最大的属性作为根节点的分裂属性;
[0026]S34:根据根节点属性值采用信息增益计算方法建立后继枝,选择分枝中信息增益最大的属性进行分裂,直到所有分枝节点的样本属于同一类别;
[0027]S35:对每个训练子集提取出的同一类别的数据进行提取,生成对应的分类器,并返回步骤S33,直到生成k个分类器;
[0028]S36:将测试集中的数据输入到k个分类器中进行组合预测,输出结果。
[0029]进一步的,采用信息增益计算方法计算训练子集中属性的信息增益的过程包括:将训练数据集S作为样本集,每个样本中有m个属性向量;若类别属性A
n
具有k个不同取值,则根据不同的取值将样本集S划分为k个子集,得到样本集S的分类平均信息量H(s);若类别属性A作为属性划分训练样本集S,训练样本集S被划分成k个子集{S1,S2,

,S
k
},即将A的取值分为k个(a1,a2…
a
k
),定义S中属于第i类的训练实例个数为S
ij
,计算属性A的条件信息熵H(S/A);根据分类平均信息量H(s)和属性A的条件信息熵H(S/A)计算属性A的信息增益G(A,s);设划分训练集的属性A有k个不同的值,则将属性A样本集划分为k个不同的子集;其中,样本子集S
j
包含样本集S中的部分样本,a
i
为它们在属性A上的值,以属性A的值为基准,对样本进行分割,则属性A的分裂信息熵S(S,A)为:其中,p
j
为S
j
为S中包含样本值的概率;划分属性A的信息增益率为:GR(S,A)=G(A,S)/S(S,A),其中,S(S,A)表示属性A的分裂信息熵,G(A,S)表示属性A的信息增益。
[0030]优选的,贫困生预测的综合指标的计算公式为:
[0031][0032]其中,P表示准确率,R表示召回率,F1表示贫困生预测的综合指标。
[0033]一种基于多维度评价的高校贫困生认证系统,该系统包括:用户数据更新采集单元、数据分析集成检测与处理单元、PC端实时数据更新单元以及贫困生实时排名显示单元;
[0034]用户数据更新采集单元包括学生家庭基本情况采集模块、学生个人消费基本情况采集模块、学生学习态度基本情况采集模块、学生日常行为基本情况采集模块、学生勤工俭学模块、学生贷款申请模块;
[0035]所述学生家庭基本情况采集模块用于采集学生家庭的收入和支出信息,并采集学生家庭成员的年龄、姓名、性别以及健康状况信息;
[0036]所述学生个人消费基本情况采集模块用于采集学生在校消费信息和校外消费信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多维度评价的高校贫困生认证方法,其特征在于,包括:获取待认定学生的信息;将获取的信息输入到学生贫困生认证预测模型中,得到贫困认证结果;根据贫困认证结果对待认证的学生进行分类,完成贫困生认定;对贫困生认定模型进行训练的过程包括:S1:获取学生的数据信息,将获取的数据信息集成数据库;S2:采用SMOTE算法对数据库中的数据进行预处理,对预处理后的数据进行划分,得到训练集和测试集;S3:将训练集中的数据输入到学生贫困生认证预测模型中进行训练,得到当前训练的模型;S4:将测试集中的数据输入到步骤S3中训练的模型中进行测试,根据测试结果计算贫困生预测的综合指标;S5:调整学生贫困生认证预测模型的参数,并重复步骤S3~步骤S4,直到贫困生预测的综合指标达到最优值,则完成模型的训练。2.根据权利要求1所述的一种基于多维度评价的高校贫困生认证方法,其特征在于,获取的学生数据信息包括:学生家庭信息、学生个人消费信息、学生学习态度信息、学生日常行为信息、学生勤工俭学信息以及学生贷款申请信息。3.根据权利要求1所述的一种基于多维度评价的高校贫困生认证方法,其特征在于,将获取的数据信息集成数据库的过程包括:步骤1:采用COUNT函数对获取的数据信息进行整理分析,删除数据中重复的数据;步骤2:将整理后的数据信息进行集合,得到数据表;步骤3:采用聚类离群点的检测方法对数据表中的数据进行检测,删除异常数据,得到数据库。4.根据权利要求3所述的一种基于多维度评价的高校贫困生认证方法,其特征在于,采用聚类离群点的检测方法对数据表中的数据进行检测的公式为:其中,D表示数据集中所有样本数据的误差平方和,K表示分类的个数,p表示任意给定的样本数据,c
i
表示第i个簇,n
i
表示簇c
i
的均值。5.根据权利要求1所述的一种基于多维度评价的高校贫困生认证方法,其特征在于,采用SMOTE算法对数据库中的数据进行预处理的过程包括:第一步,对每一个稀有类样本x,找到与之距离最小的第k个邻近样本;令向上采样倍率为N,从这k个距离最小的邻近样本中随机选择n个样本,并记作(X1,X2,X3,

,X
n
);第二步,在少数类数据样本x与X
i
(i=1,2,

,n)之间,采用随机性的线性插值方法合成新的少数类样本X
new
=x+rand*(X
i
),其中rand代表0到1之间的任何一个随机数值,X
i
代表x的第i个随机样本;第三步,将合成的新样本插入到数据集中,形成新的数据集。6.根据权利要求1所述的一种基于多维度评价的高校贫困生认证方法,其特征在于,将训练集中的数据输入到学生贫困生认证预测模型中进行训练的过程包括:S31:设置迭代次数k;
S32:从训练集中进行k次有放回的抽样,每次抽取n个训练样本,得到k个训练子集S={S1,S2,

,S
k
};S33:采用信息增益计算方法求取每个训练子集中所有属性的信息增益,选择信息增益最大的属性作为根节点的分裂属性;S34:根据根节点属性值采用信息增益计算方法建立后继枝,选择分枝中信息增益最大的属性进行分裂,直到所有分枝节点的样本属于同一类别;S35:对...

【专利技术属性】
技术研发人员:郝树芹
申请(专利权)人:重庆医药高等专科学校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1