The invention relates to a data mining-based method for predicting the degree of students'isolation, which includes data collection, calculation of the relevant index of each student, generation of the index matrix of the relevant index of each student and calculation of the isolation index of each student according to the index matrix. The related index includes: interpersonal relationship index obtained from the cartoon data, economy calculated from the family income data. Index, sports index from sports data, social index from social activity participation statistics, and online behavior index from online data. The interpersonal relationship index, economic index, caring index, social participation index, sports index and Internet accessibility index are used to compose matrix A, and the principal component analysis method is used to calculate the loneliness index.
【技术实现步骤摘要】
一种基于数据挖掘的学生孤僻程度预测方法
本专利技术属于大数据应用领域,具体涉及一种基于数据挖掘的学生孤僻程度预测方法。
技术介绍
大学生作为一个特殊的社会文化群体,正处于人生发展的重要时期,有孤僻感的大学生不能与人保持正常的人际交往,是不健康的社会行为模式,是需要矫正的自我心理状态。本方法提供一种基于数据挖掘计算学生孤僻程度的方法,对孤僻程度较高的学生,给学校提供孤僻预警,同时给出与孤僻学生联系较为紧密的几个联系人,方便学校对孤僻学生进行及时、针对性的关怀。通常学校采取思政指导教师来负责学生的思想工作,在学生中指派若干助手负责盯控学生思想动态,对学生的孤僻程度无法量化。
技术实现思路
本专利技术的目的就在于为了合理量化学生孤僻程度,而提出一种基于数据挖掘的学生孤僻程度预测方法。本专利技术通过以下技术方案来实现上述目的:一种基于数据挖掘的学生孤僻程度预测方法,包括数据采集、计算每个学生的相关指数、将学生的相关指数生成指数矩阵并根据指数矩阵计算每个学生的孤僻指数;通过分析学生一卡通刷卡数据、门禁数据,挖掘学生行为的频繁模式,提取学生行为的关联规则,给出学生与群体的人际关系指数。人际关系指数越高的,孤僻程度越低。人际关系指数越低的,孤僻程度则越高。通过分析学生的家庭信息、消费数据,挖掘因家庭社会经济地位较低等造成的自觉低人一等,对集体没有认同感和归属感,没有自信,挖掘缺乏父母关爱造成的没有安全感,从而造成的孤僻。通过调研分析学生的校园活动、社会公益活动参与情况,热爱集体活动的学生孤僻指数相对较低。通过分析学生运动打卡数据,挖掘不爱运动的学生,认为运动指数较低的学生孤 ...
【技术保护点】
1.一种基于数据挖掘的学生孤僻程度预测方法,包括数据采集、计算每个学生的相关指数、将学生的相关指数生成指数矩阵并根据指数矩阵计算每个学生的孤僻指数;其中相关指数包括:由一卡通数据得到的人际关系指数,由家庭收入数据计算得到的经济指数,由运动数据得到的运动指数,由社会活动参与统计数据得到社交指标,由上网数据统计得到的上网行为指数。
【技术特征摘要】
1.一种基于数据挖掘的学生孤僻程度预测方法,包括数据采集、计算每个学生的相关指数、将学生的相关指数生成指数矩阵并根据指数矩阵计算每个学生的孤僻指数;其中相关指数包括:由一卡通数据得到的人际关系指数,由家庭收入数据计算得到的经济指数,由运动数据得到的运动指数,由社会活动参与统计数据得到社交指标,由上网数据统计得到的上网行为指数。2.根据权利要求1所述的一种基于数据挖掘的学生孤僻程度预测方法,其特征在于,其中数据采集具体为:从一卡通数据中筛选近一个完整月的消费数据,提取学号、消费地点、刷卡机编号三个字段,以及近一个月的门禁刷卡记录,提取学号、刷卡机编号、刷卡时间三个字段;从家庭信息表提取学号、家庭收入、是否单亲、是否孤儿、是否留守儿童四个字段;从社会活动参与主统计数据中提取学号、活动总次数;从运动打卡数据中提取学号、每次运动的时长;从上网行为数据库中提取学号、上网时长、每次网络搜索的关键词。3.根据权利要求2所述的一种基于数据挖掘的学生孤僻程度预测方法,其特征在于,计算人际关系指数的方法为:将一卡通数据按刷卡机编号、刷卡时间以天为单位进行切片,切片后计算该切片数据内每一个学生刷卡时,与另一个学生在1分钟内且操作顺序相邻的频率即支持度:规则s1→s2的支持度等于s1,s2共同出现的次数σ与总事务数N比值设置阈值T1,删除小于阈值的支持度数据,满足最小支持度阈值的所有项集称作频繁项集,产生频繁项集;评判结果的可靠性,使用置信度进行度量,置信度计算公式:输出结果为学号、同时刷卡的学号、两个学生之间的置信度3个字段,设置阈值T2,置信度高于T2则认为是学生的亲密联系人,将每位学生的亲密联系人置信度累加,得到该学生的人际关系指标绝对值;将人际关系指标绝对值进行归一化,计算方法为:其中max为所有学生中最高的人际关系指标绝对值,min为所有学生最低的人际关系指标绝对值,x为该学生人际关系指标绝对值,x’即为计算结果,人际关系指数,接近1则表示人际关系差。4.根据权利要求2所述的一种基于数据挖掘的学生孤僻程度预测方法,其特征在于,计算经济指数的方法为:设定权值w1、w2,家庭贫困程度f=家庭收入*w1+近一个月的一卡通消费总金额*w2,对贫困指标进行归一化贫困指标数值越大,越贫...
【专利技术属性】
技术研发人员:陈岩,
申请(专利权)人:北京桃花岛信息技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。