当前位置: 首页 > 专利查询>淮阴工学院专利>正文

一种基于深度学习的贫困生认定方法技术

技术编号:19693855 阅读:60 留言:0更新日期:2018-12-08 11:41
本专利公开发明专利技术了一种基于深度学习的贫困生认定方法,本发明专利技术从学生一卡通消费数据、成绩数据、图书馆借阅数据中提取学生特征,将学生分为4个贫困等级并用one‑hot编码,将编码结果作为学生类别标签。使用提取的特征和类别标签训练搭建好的神经网络模型。当需要认定贫困生时,提取学生一卡通消费数据、成绩数据、图书馆借阅数据的特征,经过神经网络模型预测后得出学生类别。并将结果用于贫困生的辅助认定。本发明专利技术具有准确度高,隐藏层深度足够的特点。

【技术实现步骤摘要】
一种基于深度学习的贫困生认定方法
本专利技术属于特征提取和分类算法
,特别涉及一种基于深度学习的贫困生认定方法。
技术介绍
经过数十年的发展,中国已经形成了以助学金、国家励志奖学金、助学贷款为主的贫困生资助政策。然而中国与西方发达国家相比,由于没有完善的个人税收体制,难以实现贫困生的精准资助。同时由于人口基数大,也无法实现逐个走访调查,以至于难以实现贫困生的精准资助。近年来针对这种问题,研究者提出了相应的贫困生认定方案,如利用K-means,SVM,决策树等。朱全银等人已有的研究基础包括:朱全银,潘禄,刘文儒,等.Web科技新闻分类抽取算法[J].淮阴工学院学报,2015,24(5):18-24;李翔,朱全银.联合聚类和评分矩阵共享的协同过滤推荐[J].计算机科学与探索,2014,8(6):751-759;QuanyinZhu,SunqunCao.ANovelClassifier-independentFeatureSelectionAlgorithmforImbalancedDatasets.2009,p:77-82;QuanyinZhu,YunyangYan,JinDing,JinQian.TheCaseStudyforPriceExtractingofMobilePhoneSellOnline.2011,p:282-285;QuanyinZhu,SuqunCao,PeiZhou,YunyangYan,HongZhou.IntegratedPriceForecastbasedonDichotomyBackfillingandDisturbanceFactorAlgorithm.InternationalReviewonComputersandSoftware,2011,Vol.6(6):1089-1093;朱全银等人申请、公开与授权的相关专利:朱全银,胡蓉静,何苏群,周培等.一种基于线性插补与自适应滑动窗口的商品价格预测方法.中国专利:ZL201110423015.5,2015.07.01;朱全银,曹苏群,严云洋,胡蓉静等,一种基于二分数据修补与扰乱因子的商品价格预测方法.中国专利:ZL201110422274.6,2013.01.02;朱全银,尹永华,严云洋,曹苏群等,一种基于神经网络的多品种商品价格预测的数据预处理方法.中国专利:ZL201210325368.6;李翔,朱全银,胡荣林,周泓.一种基于谱聚类的冷链物流配载智能推荐方法.中国专利公开号:CN105654267A,2016.06.08;曹苏群,朱全银,左晓明,高尚兵等人,一种用于模式分类的特征选择方法.中国专利公开号:CN103425994A,2013.12.04;朱全银,严云洋,李翔,张永军等人,一种用于文本分类和图像深度挖掘的科技情报获取与推送方法.中国专利公开号:CN104035997A,2014.09.10;朱全银,辛诚,李翔,许康等人,一种基于K-means和LDA双向验证的网络行为习惯聚类方法.中国专利公开号:CN106202480A,2016.12.07。神经网络算法:神经网络算法是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络算法主要结构为输入层,隐藏层和输出层。输入层负责输入特征值,输出层则是输出预测结果或分类结果。隐藏层由连接的神经元组成。在深度学习中,为了加深神经网络,增加神经网络层数,引入了激活函数。激活函数通过抛弃部分神经元,达到加深神经网络并提高预测或分类准确率的目的。交叉熵损失函数:交叉熵损失函数可以衡量真实结果与预测结果的相似性。和其他损失函数一样,交叉熵损失函数作用是更新神经元连接之间的权值,以达到减少训练误差的目的。与方差损失函数相比,交叉熵损失函数克服了学习速度慢的问题。主要作为由Sigmoid、Softmax等函数作为输出层函数情况下的损失函数。Sigmoid函数:Sigmoid函数一个在生物学中常见的S型的函数,使用Sigmoid函数作为首层神经网络的激活函数可以较大程度上利用特征值,并且它的结果具有概率的特征,将更有利于Softmax函数的分类计算。Softmax函数:Softmax函数用于处理类别为三个及以上的分类或回归问题,Softmax函数是Sigmoid函数的一般形式,运用Softmax的算法属于有监督学习。改进的ReLU激活函数:ReLU激活函数在负输入时输出为零的特性,使其容易在训练中出现梯度消失的情况。针对ReLU的缺点,改进了其在输入为负时的公式,改用作为负输入时的计算公式,其中表示大于0的可调浮点数。相关专利:基于数据挖掘的学生贫困状态预测方法:CN106951568A,通过使用Spark平台进行数据预处理,再使用决策树算法对学生贫困状态进行预测,能直观、简单地理解。但该方法对噪声的表现不够健壮,扰乱一点,改动一点值就会使决策树发生改变。一种高校贫困生评定方法:CN106934742A,通过提取学生数据的十个特征值,使用三层神经网络进行贫困生评定,能够对隐藏层神经元数目进行自调整。但是该方法准确度不够高,隐藏层深度不够。
技术实现思路
专利技术目的:针对现有技术中存在的问题,本专利技术提出一种准确度高,隐藏层深度足够的基于深度学习的贫困生认定方法。技术方案:为解决上述技术问题,本专利技术提供一种基于深度学习的贫困生认定方法,具体步骤如下:(1)从学生一卡通消费数据、成绩数据和图书馆数据提取学生征值,建立学生贫困类别标签;(2)搭建深度学习神经网络模型;(3)使用提取的学生特征和学生标签训练神经网络模型;(4)训练模型用于贫困生辅助认定。进一步的,所述步骤(1)中建立学生贫困类别标签的具体步骤如下:(1.1)设学生一卡通消费数据集为X={X1n,X2n,…,Xmn},其中m表示消费类别,n表示学生编号,Xmn是一个由消费总金额和消费总次数组成的矩阵;(1.2)设学生成绩数据集为Y={Y1,Y2,…,Yn},n表示学生编号,Yn表示学生加权平均分的学校排名;(1.3)设学生图书馆数据集为Z={Z1,Z2,…,Zn},n表示学生编号,Zn表示学生图书馆借阅总次数;(1.4)合并数据集X,Y,Z形成学生特征矩阵S;(1.5)将学生分为4个贫困等级,并用one-hot进行编码,作为学生真实标签y*。进一步的,所述步骤(2)中搭建深度学习神经网络模型的具体步骤如下:(2.1)用Sigmoid函数作为激活函数搭建输入层,26个输入维度,200个神经元;(2.2)用改进的ReLU作为激活函数搭建5层神经网络每层200个神经元;(2.3)用Softmax函数作为激活函数搭建最后一层神经网络,共4个神经元;(2.4)设置交叉熵损失函数作为神经网络的损失函数,RMSProp为优化函数;(2.5)设置学习效率为0,001,批训练数量为200,迭代400次。进一步的,所述步骤(3)中使用提取的学生特征和学生标签训练神经网络模型的具体步骤如下:(3.1)定义循环变量为t,并赋初值t=1;(3.2)当t<=400执行步骤403,否则执行步骤414;(3.3)定义循环变量为k,并赋初值k=1;(3.4)将学生特征矩阵分批,每批包含200个学生的特征矩阵;(3.5)当k&本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的贫困生认定方法,其特征在于,具体步骤如下:(1)从学生一卡通消费数据、成绩数据和图书馆数据提取学生征值,建立学生贫困类别标签;(2)搭建深度学习神经网络模型;(3)使用提取的学生特征和学生标签训练神经网络模型;(4)训练模型用于贫困生辅助认定。

【技术特征摘要】
1.一种基于深度学习的贫困生认定方法,其特征在于,具体步骤如下:(1)从学生一卡通消费数据、成绩数据和图书馆数据提取学生征值,建立学生贫困类别标签;(2)搭建深度学习神经网络模型;(3)使用提取的学生特征和学生标签训练神经网络模型;(4)训练模型用于贫困生辅助认定。2.根据权利要求1所述的一种基于深度学习的贫困生认定方法,其特征在于,所述步骤(1)中建立学生贫困类别标签的具体步骤如下:(1.1)设学生一卡通消费数据集为X={X1n,X2n,…,Xmn},其中m表示消费类别,n表示学生编号,Xmn是一个由消费总金额和消费总次数组成的矩阵;(1.2)设学生成绩数据集为Y={Y1,Y2,…,Yn},n表示学生编号,Yn表示学生加权平均分的学校排名;(1.3)设学生图书馆数据集为Z={Z1,Z2,…,Zn},n表示学生编号,Zn表示学生图书馆借阅总次数;(1.4)合并数据集X,Y,Z形成学生特征矩阵S;(1.5)将学生分为4个贫困等级,并用one-hot进行编码,作为学生真实标签y*。3.根据权利要求1所述的一种基于深度学习的贫困生认定方法,其特征在于,所述步骤(2)中搭建深度学习神经网络模型的具体步骤如下:(2.1)用Sigmoid函数作为激活函数搭建输入层,26个输入维度,200个神经元;(2.2)用改进的ReLU作为激活函数搭建5层神经网络每层200个神经元;(2.3)用Softmax函数作为激活函数搭建最后一层神经网络,共4个神经元;(2.4)设置交叉熵损失函数作为神经...

【专利技术属性】
技术研发人员:朱全银李翔胡荣林蔡兵刘权周泓吴思凯倪金霆潘舒新其他发明人请求不公开姓名
申请(专利权)人:淮阴工学院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1