基于消费行为的学生隐性贫困识别方法技术

技术编号:21631566 阅读:40 留言:0更新日期:2019-07-17 11:56
本发明专利技术了公开了一种基于消费行为的学生隐性贫困识别方法,包括五个步骤,第一步,对一卡通消费异常数据进行数据清洗;第二步,根据一卡通数据计算学生每学年在校天数,并做学生在校天数正态分布检验;第三步,确定正常在校人群,将一个学年在校天数大于在校天数均值减一个标准差学生标记为正常在校人群,去掉非正常在校的学生;第四步:消费金额正态分布检验;第五步:确定隐形贫困人群。相对于现有的资助管理信息系统,本发明专利技术由被动申请变为主动识别出隐性贫困学生,替代了高校贫困申请工作,降低了高校的信息化管理成本,避免了虚假贫困申请。计算方法简单,结果客观真实,在实际应用中效果好,隐性贫困识别无错误,具有实用性。

A Method of Identifying Students'Implicit Poverty Based on Consumption Behavior

【技术实现步骤摘要】
基于消费行为的学生隐性贫困识别方法
本专利技术涉及教育大数据领域,尤其涉及一种基于消费行为的学生隐性贫困识别方法。
技术介绍
贫困生认定工作是高校学生管理中的一个重点和难点环节,但是却未能解决贫困申请面临的根本问题。其根本问题在于,高校贫困认定缺乏合理的认定标准和名额分配,并在认定过程中夹杂着大量主观因素,增加了认证工作的难度和复杂性。导致存在不合要求、不公平的贫困认定,例如虚假贫困认定、夸大认定、关系认定等,而学校的贫困生名额有限,该类不合规的认定占了部分名额。另一方面,一部分真正贫困的学生,由于家庭条件贫困,性格自卑,怕被同学嘲笑,羞于去申请贫困认定,致使真正贫困的学生未能获得资助。高校贫困生认定申请从传统的人为纸件申请,发展到现有的线上申请,国内部分高校已建立学生资助管理信息系统,通过此类信息系统在线申请和管理贫困生贫困认定,缩短了申请时间,简化了申请步骤,提高了贫困申请的申请效率。但其并未解决真正贫困学生不能获得资助的问题。
技术实现思路
本专利技术的目的就在于为了解决上述问题而提供一种基于消费行为的学生隐性贫困识别方法。本专利技术是通过以下技术方案来实现的;专利技术方法包括以下步骤:第一步:对一卡通消费异常数据进行数据清洗,删除大于A元的消费数据,删除小于-B元的消费数据,删除消费类型未知的数据,删除消费时间位于23:00和6:00之间的消费数据,合并连续0.1元的数据;第二步:根据一卡通的门禁和消费数据计算学生每学年在校天数,使用Kolmogorov-Smirnov按学年做学生在校天数正态分布检验;第三步:确定正常在校人群,将一个学年在校天数大于在校天数均值减一个标准差的学生标记为正常在校人群,去掉非正常在校的学生;第四步:消费金额正态分布检验根据第三步所得正常在校人群,统计所有正常在校人群的消费总金额,按消费时间合并早餐、午餐、晚餐消费金额,计算得到人均学年消费金额Csum以及人均每餐的食堂消费金额Cbreakfast,Clunch,Csupper,使用Kolmogorov-Smirnov分别检验所有正常在校学生的Csum,Cbreakfast,Clunch,Csupper得到分别满足正态分布的Csum,Cbreakfast,Clunch,Csupper;第五步:确定隐形贫困人群计算得到正常在校学生消费金额Csum,Cbreakfast,Clunch,Csupper对应的累积分布概率Psum,Pbreakfast,Plunch,Psupper,分别设置Csum,Cbreakfast,Clunch,Csupper的消费权重,初步设置值均为1/4,再将Psum,Pbreakfast,Plunch,Psupper,按消费权重加权得到贫困指数Pindex,计算全部正常在校学生的贫困指数Pindex的均值Uindex,确定小于均值减一个标准差即<Uindex—R的对应的学生作为隐形贫困。进一步的,所述第二步中使用Kolmogorov-Smirnov按学年检验学生在校天数的具体方法如下:首先计算n个独立同分布的观察值Xi的经验累积概率分布,然后计算所有学生在校天数样本的均值和方差,得到经验正态分布,其累计分布概率为,再计算对应的Kolmogorov-Smirnov统计量,当n值越大,越趋于服从Kolmogorov分布,当n值趋于无穷大,则若,则以显著性水平拒绝零假设,即收敛到Kolmogorov分布,则观察值服从正态分布。进一步的,所述第一步中的A为单次消费限额,其值可取50、80、100,B为单次充值限额,其值可取500,1000。进一步的,所述显著性水平设置值≤0.1,优选值为0.01。进一步的,所述n个独立同分布的观察值,n为在校学生人数,观察值为单个学生一学年的在校天数。本专利技术的有益效果在于:本专利技术相对于现有的学生资助管理信息系统,由学生自主申请变为学校主动识别贫困学生,改变了传统及现有的贫困学生申请模式,由被动申请变为主动识别出隐性贫困学生,无需学生线上做自主贫困申请,替代了高校贫困申请工作,降低了高校的信息化管理成本。传统贫困生申请和现有的学生资助管理信息系统的线上贫困生申请都必须依赖学生填表数据,而填表数据可能存在虚假填报或者每个学生填写标准不一致的问题。存在虚假申请,本专利技术能够通过学生消费数据采集和分析找到真正贫困的学生,避免了虚假贫困申请。本专利技术涉及学生的消费数据,隐性贫困识别结合Kolmogorov-Smirnov算法,计算方法简单,结果客观,在实际应用中效果好,隐性贫困识别无错误,具有实用性。附图说明图1为本专利技术的方法步骤流程图。具体实施方式以下结合附图进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。一种基于消费行为的学生隐性贫困识别方法,包括以下五个步骤:第一步:对一卡通消费异常数据进行数据清洗,删除大于A元的消费数据,删除小于-B元的消费数据。A值为单次消费限额,也就是一次刷卡不能超过A值,其值可取50、80、100,该值可以根据学校的实际规定来定,而B值为单次充值限额,单次充值数据必须有个限定,也就是说一次最多充值B元,根据实际调研学校充值规定定值,B可以取值为500,1000。删除消费类型未知的数据,该类型数据主要为一卡通刷卡系统产生的异常和错误数据。删除消费时间位于23:00和6:00之间的消费数据,该时间段,学校已禁止学生离开宿舍,食堂、小卖部等一卡通消费已禁止,固必须对该时间段产生的一卡通数据做出删除处理。合并连续0.1元的数据;0.1元的数据为淋浴消费数据,基本高校的淋浴消费都是按每5秒消费0.1元来设定的,因此一次完整的淋浴,需要合并连续0.1元的数据。第二步:根据一卡通的门禁和消费数据计算学生每学年在校天数,这里的在校天数可以通过一卡通刷卡时间得到。根据实际调研,多数高校都在规范管理,高校内部只能使用一卡通,不能现金交易,所以说一个学生在学校生活、学习必然会使用一卡通,因此很容易通过一卡通得到学生的在校天数;再使用Kolmogorov-Smirnov按学年做学生在校天数正态分布检验,正太分布检验具体过程如下:首先计算n个独立同分布的观察值的经验累积概率分布,n为在校学生数,观察值为单个学生的在校天数;然后计算所有学生在校天数样本的均值和方差,得到经验正态分布,其累计分布概率为,再计算对应的Kolmogorov-Smirnov统计量,当n值越大,越趋于服从Kolmogorov分布,根据本专利技术的实际应用,n值>1000,其正态分布已是相当明显,而理论上当n值趋于无穷大,则有,为随机变量,,达到绝对正态分布;若,则以显著性水平拒绝零假设,即收敛到Kolmogorov分布,则观察值服从正态分布;此处的值≤0.1,可取0.01、0.05、0.1,因为学生的在校天数在n值>1000时,一般学校人数都远超过1000,不满足正态分布的概率很小,所以值取小值更好,因此值优选0.01。第三步:确定正常在校人群,将一个学年在校天数大于在校天数均值减一个标准差学生标记为正常在校人群,去掉非正常在校的学生;大于在校天数均值减一个标准差可以表示为>,代表在校天数均值代表标准差,一般说来在实际实施时,各学生一学年在校天数的值会很接近,在在校天数均值上下浮动一定范围内的学生都本文档来自技高网...

【技术保护点】
1.一种基于消费行为的学生隐性贫困识别方法,其特征在于:包括以下步骤:第一步:对一卡通消费异常数据进行数据清洗,删除大于A元的消费数据,删除小于‑B元的消费数据,删除消费类型未知的数据,删除消费时间位于23:00和6:00之间的消费数据,合并连续0.1元的数据;第二步:根据一卡通的门禁和消费数据计算学生每学年在校天数,使用Kolmogorov‑Smirnov按学年做学生在校天数正态分布检验;第三步:确定正常在校人群,将一个学年在校天数大于在校天数均值减一个标准差的学生标记为正常在校人群,去掉非正常在校的学生;第四步:消费金额正态分布检验根据第三步所得正常在校人群,统计正常在校人群的学年消费总金额,按消费时间合并早餐、午餐、晚餐消费金额,计算得到人均学年消费金额Csum以及人均每餐消费金额Cbreakfast,Clunch,Csupper,使用Kolmogorov‑Smirnov分别检验所有正常在校学生的Csum,Cbreakfast,Clunch,Csupper得到分别满足正态分布的Csum,Cbreakfast,Clunch,Csupper;第五步:确定隐形贫困人群计算得到正常在校学生消费金额Csum,Cbreakfast,Clunch,Csupper对应的累积分布概率Psum,Pbreakfast,Plunch,Psupper,分别设置Csum,Cbreakfast,Clunch,Csupper的消费权重,初步设置值均为1/4,再将Psum,Pbreakfast,Plunch,Psupper,按消费权重加权得到贫困指数Pindex,计算全部正常在校学生的贫困指数Pindex的均值Uindex,确定小于均值减一个标准差即<Uindex—R的对应的学生作为隐形贫困。...

【技术特征摘要】
1.一种基于消费行为的学生隐性贫困识别方法,其特征在于:包括以下步骤:第一步:对一卡通消费异常数据进行数据清洗,删除大于A元的消费数据,删除小于-B元的消费数据,删除消费类型未知的数据,删除消费时间位于23:00和6:00之间的消费数据,合并连续0.1元的数据;第二步:根据一卡通的门禁和消费数据计算学生每学年在校天数,使用Kolmogorov-Smirnov按学年做学生在校天数正态分布检验;第三步:确定正常在校人群,将一个学年在校天数大于在校天数均值减一个标准差的学生标记为正常在校人群,去掉非正常在校的学生;第四步:消费金额正态分布检验根据第三步所得正常在校人群,统计正常在校人群的学年消费总金额,按消费时间合并早餐、午餐、晚餐消费金额,计算得到人均学年消费金额Csum以及人均每餐消费金额Cbreakfast,Clunch,Csupper,使用Kolmogorov-Smirnov分别检验所有正常在校学生的Csum,Cbreakfast,Clunch,Csupper得到分别满足正态分布的Csum,Cbreakfast,Clunch,Csupper;第五步:确定隐形贫困人群计算得到正常在校学生消费金额Csum,Cbreakfast,Clunch,Csupper对应的累积分布概率Psum,Pbreakfast,Plunch,Psupper,分别设置Csum,Cbreakfast,Clunch,Csupper...

【专利技术属性】
技术研发人员:聂敏连德富孙俊
申请(专利权)人:成都寻道科技有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1