一种大学生学习时间分配的数据分析方法及装置制造方法及图纸

技术编号:37442443 阅读:16 留言:0更新日期:2023-05-06 09:14
本发明专利技术公开了一种大学生学习时间分配的数据分析方法及装置,包括以下步骤:以匿名方式收集大学生数据并进行数据预处理,所述大学生数据包括个人信息情况、学习时间统计及其他活动时间,并构建BP神经网络。通过数据集训练和测试,得到BP神经网络的最终模型,大学生用户将个人信息情况和其他活动时间统计输入到最终模型中,得到模拟的学习时间统计。将模拟学习时间和历史收集的大学生数据集平均学习时间对比,若高于平均学习时间,给出良好评价;若低于平均学习时间,则针对于此用户的个人信息情况和其他活动时间反馈建议,希望能帮助该用户提升学习时间。用户提升学习时间。用户提升学习时间。

【技术实现步骤摘要】
一种大学生学习时间分配的数据分析方法及装置


[0001]本专利技术涉及数据分析
,特别涉及一种大学生学习时间分配的数据分析方法及装置。

技术介绍

[0002]随着经济和科技的快速发展,人类的生活工作节奏加快,往往面临着时间分配压力问题。同时,我国高等教育需要高质量发展,大学生学习质量也成为近年来高等教育研究热点之一。而大学生的学习时间分配行为直接影响个人学习成绩和学习质量,间接影响学校的教学质量,进而影响高等教育质量。由此提出,在高等教育领域,通过研究大学生学习时间分配情况对高等教育发展有一定参考价值和理论意义。
[0003]数据分析是指用适当的统计分析方法对大量数据进行分析,提取其中有用信息并形成结论,辅助决策。而目前关于大学生学习时间分配的研究大都集中在定性分析上,定量分析尤其是基于统计数据的分析方法极少。其次相关研究关于影响因素的选取较为单一,可能存在考虑不全面的情况。

技术实现思路

[0004]本专利技术的目的在于提供一种大学生学习时间分配的数据分析方法及装置。
[0005]一种大学生学习时间分配的数据分析方法,所述方法包括:
[0006]以匿名方式收集大学生数据并进行数据预处理,所述大学生数据包括个人信息情况、其他活动时间及学习时间统计;
[0007]利用PCA方法将预处理后的个人信息情况和其他活动时间统计数据降维,并将个人信息情况和其他活动时间统计中各影响因子按照重要性排序,得到排序后的影响因子;
[0008]构建BP神经网络,将排序后的影响因子作为BP神经网络的输入层,将预处理后的学习时间统计作为BP神经网络的输出层,BP神经网络的隐含层为输入层和输出层的中间层,分析输入对输出的影响;通过数据集训练和测试,得到BP神经网络的最终模型;
[0009]将大学生用户将个人信息情况和其他活动时间统计经数据预处理和PCA降维后输入到最终模型中,得到模拟的学习时间统计;
[0010]将模拟学习时间和收集的大学生数据集历史平均学习时间对比,若高于平均学习时间,给出良好评价;若低于平均学习时间,则针对于此大学生的个人信息情况和其他活动时间反馈建议。
[0011]进一步的,所述提取个人信息情况、学习时间统计及其他活动时间统计,具体包括:
[0012]个人信息情况:省市地区、户口性质、是否为休假日、兄弟姐妹数量、性别、出生年、民族、家庭社会地位、在校月开支、亲密关系状况、朋友数量、身高、体重、近视度数、学习态度、综测成绩;
[0013]在个人信息情况中,兄弟姐妹数量、朋友数量、在校月开支、出生年、身高、体重、近
视度数、综测数据在单位一致的前提下直接量化;将户口性质赋值0、1,入校前为非农业户口赋值0,入校前为农业户口赋值1;将家庭社会地位赋值1~5,被调查者所认为的家庭在当地的社会经济地位,上层=5,中上层=4,中层=3,中下层=2,下层=1;将亲密关系赋值0、1,“有恋人”赋值1,“无恋人”赋值0;将性别赋值0、1,“男性”赋值1,“女性”赋值0;将学习态度赋值1~5,非常喜欢=5,喜欢=4,一般=3,较不喜欢=2,不喜欢=1;将是否为休假日赋值0、1,“工作日”赋值1,“休息日”赋值0;
[0014]其他活动时间统计:个人活动、家庭活动、娱乐活动、体育活动、社交活动,将这五类活动一周内所花费的时间分别统计,单位为小时;
[0015]在其他活动时间统计中,个人活动包括睡觉休息、饮食活动及个人卫生活动;家庭活动包括家务劳动活动、照顾家人及陪伴家人活动;娱乐活动包括使用媒体活动、业余爱好及游戏活动、外出娱乐活动;体育活动包括体育锻炼与健身活动;社交活动包括与他人聊天、参加聚会活动;
[0016]学习时间统计:学校教育活动、远程教育学习活动、完成课后作业或复习预习功课等、业余学习与非正规教育;
[0017]将学校教育活动、远程教育学习活动、完成课后作业或复习、预习功课等活动以及业余学习与非正规教育活动这四类活动一周内所花费的总时间统计为大学生学习时间,单位为小时。
[0018]进一步的,所述数据预处理,具体包括:
[0019]删除异常数据,有缺失的数据赋值为当前变量的平均数或众数;
[0020]将个人信息情况、学习时间统计及其他活动时间统计都进行标准化处理,消除因度量标准不同而带来的影响。
[0021]进一步的,所述利用PCA方法将预处理后的个人信息情况和其他活动时间统计数据降维,具体包括:
[0022]构造标准化处理后的个人信息情况和其他活动时间统计的协方差矩阵,并计算特征值和相应的特征向量;
[0023]计算个人信息情况和其他活动时间统计中各影响因子特征值的方差贡献率;所述特征值的方差贡献率指当前特征值与所有特征值和的比值,比值越高,影响因子重要性越高;根据个人信息情况和其他活动时间统计中不同影响因子的方差贡献率进行影响因子重要性排序;
[0024]计算个人信息情况和其他活动时间统计中影响因子特征值的累计贡献率;所述累计贡献率为方差贡献率依次相加得到;选取在降维后的累计贡献率不低于90%的主成分作为新的影响因子。
[0025]进一步的,所述构建BP神经网络,具体还包括:BP神经网络初始化、计算BP神经网络信号的正向传播、计算BP神经网络误差的反向传播、修正BP神经网络权值和计算BP神经网络全局误差。
[0026]进一步的,所述BP神经网络初始化,具体包括:
[0027]创建BP神经网络的权重矩阵,包括输入层和隐含层之间的权重矩阵以及隐含层和输出层之间的权重矩阵,初始化权重,在(

0.2,0.2)之间随机取值;
[0028]针对BP神经网络第k个样本,输入向量x(k)=(x1(),x2(),

,x
n
()),第k个样本期
望输出向量d(k)=(d1(),d2(),

,d
q
()),式中,k为样本个数;n为输入神经元个数,x
n
()为第n个神经元输入;q为输出层神经元个数,d
q
()为第q个神经元输出。
[0029]进一步的,所述计算BP神经网络信号的正向传播,具体包括:
[0030]计算BP神经网络隐含层各神经元的输入h
h
(),通过激活函数f(x)计算输出h
h
();计算输出层各神经元的输入yi
o
(),通过线性函数g(x)计算输出输出yo
o
();
[0031][0032]h
h
()=f(h
h
())h=1,2,

p
[0033][0034]yo
o
()=g(yi
o
())=1,2,

q
[0035]式中,w
ih
为输入层和隐含层之间的权值;b
k<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大学生学习时间分配的数据分析方法,其特征在于,所述方法包括:以匿名方式收集大学生数据并进行数据预处理,所述大学生数据包括个人信息情况、其他活动时间及学习时间统计;利用PCA方法将预处理后的个人信息情况和其他活动时间统计数据降维,并将个人信息情况和其他活动时间统计中各影响因子按照重要性排序,得到排序后的影响因子;构建BP神经网络,将排序后的影响因子作为BP神经网络的输入层,将预处理后的学习时间统计作为BP神经网络的输出层,BP神经网络的隐含层为输入层和输出层的中间层,分析输入对输出的影响;通过数据集训练和测试,得到BP神经网络的最终模型;将大学生用户将个人信息情况和其他活动时间统计经数据预处理和PCA降维后输入到最终模型中,得到模拟的学习时间统计;将模拟学习时间和收集的大学生数据集历史平均学习时间对比,若高于平均学习时间,给出良好评价;若低于平均学习时间,则针对于此大学生的个人信息情况和其他活动时间反馈建议。2.根据权利要求1所述的一种大学生学习时间分配的数据分析方法,其特征在于,所述提取个人信息情况、学习时间统计及其他活动时间统计,具体包括:个人信息情况:省市地区、户口性质、是否为休假日、兄弟姐妹数量、性别、出生年、民族、家庭社会地位、在校月开支、亲密关系状况、朋友数量、身高、体重、近视度数、学习态度、综测成绩;在个人信息情况中,兄弟姐妹数量、朋友数量、在校月开支、出生年、身高、体重、近视度数、综测数据在单位一致的前提下直接量化;将户口性质赋值0、1,入校前为非农业户口赋值0,入校前为农业户口赋值1;将家庭社会地位赋值1~5,被调查者所认为的家庭在当地的社会经济地位,上层=5,中上层=4,中层=3,中下层=2,下层=1;将亲密关系赋值0、1,“有恋人”赋值1,“无恋人”赋值0;将性别赋值0、1,“男性”赋值1,“女性”赋值0;将学习态度赋值1~5,非常喜欢=5,喜欢=4,一般=3,较不喜欢=2,不喜欢=1;将是否为休假日赋值0、1,“工作日”赋值1,“休息日”赋值0;其他活动时间统计:个人活动、家庭活动、娱乐活动、体育活动、社交活动,将这五类活动一周内所花费的时间分别统计,单位为小时;在其他活动时间统计中,个人活动包括睡觉休息、饮食活动及个人卫生活动;家庭活动包括家务劳动活动、照顾家人及陪伴家人活动;娱乐活动包括使用媒体活动、业余爱好及游戏活动、外出娱乐活动;体育活动包括体育锻炼与健身活动;社交活动包括与他人聊天、参加聚会活动;学习时间统计:学校教育活动、远程教育学习活动、完成课后作业或复习预习功课等、业余学习与非正规教育;将学校教育活动、远程教育学习活动、完成课后作业或复习、预习功课等活动以及业余学习与非正规教育活动这四类活动一周内所花费的总时间统计为大学生学习时间,单位为小时。3.根据权利要求1所述的一种大学生学习时间分配的数据分析方法,其特征在于,所述数据预处理,具体包括:删除异常数据,有缺失的数据赋值为当前变量的平均数或众数;
将个人信息情况、学习时间统计及其他活动时间统计都进行标准化处理,消除因度量标准不同而带来的影响。4.根据权利要求1所述的一种大学生学习时间分配的数据分析方法,其特征在于,所述利用PCA方法将预处理后的个人信息情况和其他活动时间统计数据降维,具体包括:构造标准化处理后的个人信息情况和其他活动时间统计的协方差矩阵,并计算特征值和相应的特征向量;计算个人信息情况和其他活动时间统计中各影响因子特征值的方差贡献率;所述特征值的方差贡献率指当前特征值与所有特征值和的比值,比值越高,影响因子重要性越高;根据个人信息情况和其他活动时间统计中不同影响因子的方差贡献率进行影响因子重要性排序;计算个人信息情况和其他活动时间统计中影响因子特征值的累计贡献率;所述累计贡献率为方差贡献率依次相加得到;选取在降维后的累计贡献率不低于90%的主成分作为新的影响因子。5.根据权利要求1所述的一种大学生学习时间分配的数据分析方法,其特征在于,所述构建BP神经网络,具体还包括:BP神经网络初始化、计算BP神经网络信号的正向传播、计算BP神经网络误差的反向传播、修正BP神经网络权值和计算BP神经网络全局误差。6.根据权利要求5所述的一种大学生学习时间分配的数据分析方法,其特征在于,所述BP神经网络初始化,具体包括:创建BP神经网络的权重矩阵,包括输入层和隐含层之间的权重矩阵以及隐含层和输出层之间的权重矩阵,初始化权重,在(

0.2,0.2)之间随机取值;针对BP神经网络第k个样本,输入向量x(k)=(x1(k),x2(k),

,x
n
(k)),第k个样本期望输出向量d(k)=(d1(k),d2(k),

,d
q
(k)),式中,k为样本个数;n为输入神经元个数,x
n
(k)为...

【专利技术属性】
技术研发人员:许鸿文谢树康陈雯张志鹏
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1