The invention discloses an assistant identification method for impoverished students based on SVM, which comprises the following steps: collecting students'data and pretreating students' data; extracting features from pre-processed students'data and ranking the importance of features through random forests; constructing a hybrid kernel function under Mercer conditions, and implanting SVM. In this paper, genetic algorithm is used to optimize the parameters of hybrid kernel function to obtain the optimal parameters of hybrid kernel function; the optimal parameters of hybrid kernel function are substituted into SVM, and the students'data are trained to get the classifier model; the classifier model will be input to the identified student data, and the classification results will be output; the invention adopts genetic algorithm. The method optimizes the parameters of SVM hybrid kernel function, and uses fitness as the evaluation basis. By randomly recombining important genes, individuals in the population can evolve continuously, obtain the optimal solution, reduce the global search time, improve the generalization ability of the classifier, and reduce the cost.
【技术实现步骤摘要】
一种基于SVM的贫困生辅助认定方法
本专利技术涉及SVM核函数研究领域,特别涉及一种基于SVM的贫困生辅助认定方法。
技术介绍
随着高等教育的发展,越来越多贫困生进入大学,资助贫困生也成为高校重要的学生工作。而贫困生资格认定是高校资助工作的前提和基础。目前主流的认定方式是通过人工甄别申请材料,认定过程中存在认定程序僵化、责任主体缺乏伦理监督等问题,难以保证公平客观公正。在信息爆炸时代,兴起的机器学习方法尚不能提出很好的解决方案,在分类器的训练上、分类器的拟合上都存着各种各样的问题。基于统计学习理论提出的支持向量机SVM遵循结构风险最小化原则,有效地避免了维数灾难,但其算法训练时间复杂度较高,泛化能力不够理想,在贫困生辅助认定的应用中始终乏力。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种基于SVM的贫困生辅助认定方法。本专利技术的目的通过以下的技术方案实现:一种基于SVM的贫困生辅助认定方法,包括以下步骤:S1、采集学生数据,并对学生数据进行预处理;S2、对预处理学生数据提取特征,通过随机森林对特征重要性进行排名;S3、在满足Mercer条件下,构造混合核函数,并植入支持向量机SVM中;S4、使用遗传算法对混合核函数参数进行寻优,得到最优混合核函数参数;S5、将最优混合核函数参数代入SVM中进行训练,训练之后得到分类器模型;S6、将学生数据输入分类器模型,输出分类结果。步骤S1中,所述学生数据包含学生一卡通流水记录、学生基本信息、学生成绩和贫困生名单;所述学生基本信息包含学生ID、学生性别、学生名字;学生基本信息包含学生ID、学生性 ...
【技术保护点】
1.一种基于SVM的贫困生辅助认定方法,其特征在于,包括以下步骤:S1、采集学生数据,并对学生数据进行预处理;S2、对预处理学生数据提取特征,通过随机森林对特征重要性进行排名;S3、在满足Mercer条件下,构造混合核函数,并植入SVM中;S4、使用遗传算法对混合核函数参数进行寻优,得到最优混合核函数参数;S5、将最优混合核函数参数代入SVM中进行训练,训练之后得到分类器模型;S6、将需要认定的学生数据输入分类器模型,输出分类结果。
【技术特征摘要】
1.一种基于SVM的贫困生辅助认定方法,其特征在于,包括以下步骤:S1、采集学生数据,并对学生数据进行预处理;S2、对预处理学生数据提取特征,通过随机森林对特征重要性进行排名;S3、在满足Mercer条件下,构造混合核函数,并植入SVM中;S4、使用遗传算法对混合核函数参数进行寻优,得到最优混合核函数参数;S5、将最优混合核函数参数代入SVM中进行训练,训练之后得到分类器模型;S6、将需要认定的学生数据输入分类器模型,输出分类结果。2.根据权利要求1所述的一种基于SVM的贫困生辅助认定方法,其特征在于,步骤S1中,所述学生数据包含学生一卡通流水记录、学生基本信息、学生成绩和贫困生名单;所述学生基本信息包含学生ID、学生性别、学生名字。3.根据权利要求1所述的一种基于SVM的贫困生辅助认定方法,其特征在于,步骤S1中,所述预处理包含去重、缺失值处理和格式化;所述去重为:将学生数据按学生ID进行排序,通过比较邻近记录是否相似来检测记录是否重复,重复则删除重复记录;所述缺失值处理为:学生数据中某个记录的某个字段为空,则使用平均值进行填充;所述格式化为:将消费时间格式化为yyyy-MM-dd;消费金额统一单位为分,超限则四舍五入。4.根据权利要求1所述的一种基于SVM的贫困生辅助认定方法,其特征在于,所述步骤S2具体过程为:U1、从学生一卡通流水记录构造特征;从时间维度、地点维度和交易维度统计均值和方差;U2、将学生一卡通流水记录数据特征、学生基本信息数据特征、学生成绩数据特征和贫困生名单数据特征,进行归一化;U3、使用随机森林对特征重要性进行排名,根据排名,选择前30个特征。5.根据权利要求4所述的一种基于SVM的贫困生辅助认定方法,其特征在于,所述使用随机森林对特征重要性进行排名具体为:Y1、设定N个样本,每个样本有M个特征;Y2、从N个样本中有放回的随机抽取,抽取N次,作为训练一棵决策树的样本;Y3、每个节点随机抽取m个特征,m<M,从中选取信息增益最大的特征作为决策树的分裂节点,在决策树成长的过程中,m值保持不变;Y4、重复步骤Y2、Y3,建立大量的决策树,构成随机森林;Y5、计算每个特征在随机森林中每棵树上的评分均值,作为特征重要性依据。6.根据权利要求1所述的一种基于SVM的贫困生辅助认定方法,其特征在于,所述步骤S3,具体过程为:基于对局部核函数和全局核函数,构造混合核函数,并植入SVM中:其中,ρ为混合核函数权系数,为高斯核,属于局部核函数;σ为高斯核的带宽,σ>0,[(xi·xj)+c]d为多项式核,属于全局核函数,c为自由参数,c≥0;d为多项式次数,d≥1,xi为第i个样本的特征值向量,xj为第j个样本的特征值向量。7.根据权利要求1所述的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。