一种基于分段式损失函数的学生体能分数预测方法技术

技术编号:30271581 阅读:14 留言:0更新日期:2021-10-09 21:27
本发明专利技术公开了一种基于分段式损失函数的学生体能分数预测方法:步骤S1,采集第一时间段内学生体能预测所需数据D

【技术实现步骤摘要】
一种基于分段式损失函数的学生体能分数预测方法


[0001]本专利技术属于人工智能领域,涉及一种基于分段式损失函数的预测学生体能预测方法、存储介质和系统、存储介质和系统。

技术介绍

[0002]学生体能反应了一个学生的身体素质,学生体质健康问题一直受到国家的重视。学校和家长往往重视孩子的学习而忽视了对学生身体健康。目前,很多学校会每年对学生体能进行测试,了解学生体能状态。现有技术中对学生体能测试场采用以下方法:在肺活量、50米跑、坐位体前屈、一分钟跳绳、折返跑、仰卧起坐、台阶试验、引体向上、立定跳远和球类等项目之中选择多项测试,综合每项测试的成绩,给出学生体能综合评分。专利技术人发现,目前的学生体能测试方法至少存在以下问题:第一,需要学生进行多项测试,耗时耗力;第二,学校只能每年对学生进行一次体能测试,不能及时观测到学生当前体能状态,无法及时提醒体能近期有所下降的同学保持健康生活状态,积极进行体育锻炼;第三,常规的预测算法无法对维度数量多、密度差异大、易导致模型过拟合严重的数据进行处理,准确有效地获得学生体能数据预测情况。
[0003]XGBoost是由陈天奇提出的一种梯度学习算法,有较好的泛化性能。XGBoost是在GBDT算法上进行改进,提高了算法性能和运算速度。XGBoost采用CART树作为基学习器,在性能、速度和防止过拟合方面做出了以下改进:(1)性能:XGBoost对损失函数引入了二阶泰勒展开,并且支持自定义函数,只要能满足二阶连续可导的函数就可以作为损失函数,二阶泰勒展开可以更逼近真实损失函数。此外,XGBoost为了最小化均方差,通过采用特征预排序+缓存、分位点近似法和并行查找找到最佳分割点。(2)速度:传统的Boosting算法不能并行式计算,因此速度较慢。XGBoost支持并行化。在训练之前,预先对数据进行排序,保存为block结构,迭代过程反复利用这个结构。在进行节点分裂时,需要计算每个特征的增益,选择增益大的特征做分裂,那么各个特征的增益计算可以并行。(3)防止过拟合:XGBoost在目标函数中引入了L1、L2正则化,控制模型复杂度;引入shrinkage算法,在每一次迭代完成以后引入shrinkage系数,削弱每棵树和叶子对结果的影响;对特征进行列采样,不仅能防止过拟合,还可以提升运算速度。

技术实现思路

[0004]本专利技术实施方式的目的在于针对现有的学生体能检测方法存在的无法有效处理维度数量多、密度差异大、易导致模型过拟合严重的数据,进而难以及时预测学生体能状态的技术问题,提供一种基于分段式损失函数的学生体能分数预测方法。
[0005]一种基于分段式损失函数的学生体能分数预测方法,包括以下步骤:步骤S1,采集第一时间段内学生体能预测所需数据D
11
、数据D
12
和数据D
13
,第二时间段内学生体能预测所需的数据D
22
和数据D
23
,所述数据D
11
、数据D
12
、数据D
22
为高密度数据,所述数据D
13
、数据D
23
是稀疏数据;
步骤S2,对所述步骤S1采集的数据D
13
、数据D
23
进行填充,获得数据D
14
、数据D
24
;步骤S3,采用数据D
11
、数据D
12
、数据D
14
构造第一时间段特征模块,采用数据D
22
、数据D
24
构造第二时间段特征模块;步骤S4,基于所述步骤S3中的第一时间段特征模块和第二时间段特征模块,采用XGBoost建模,预测学生在第二时间段的体能分数;其中,所述损失函数为基于超参数的大小切分的分段函数。
[0006]优选的,所述分段式损失函数l1(y, f(x))为:其中δ为超参数,f(x)表示体能分数预测值,y表示体能分数真实值。
[0007]优选的,所述数据D
11
包括体能评估数据、健康数据,所述数据D
12
、所述数据D
22
包括课程数据、疾病数据,所述数据D
13
、所述数据D
23
包括饮食数据、运动数据、睡眠数据;所述第一时间段早于所述第二时间段。
[0008]优选的,所述数据D
11
中的体能评估数据包括体能测试类型、各体能测试类型体能测试得分,健康数据包括学生年龄、BMI、代谢综合症分类、肥胖分类、近视、散光、配镜情况;所述数据D
12
中的课程数据包括体育课次数、文化课次数、体育课分数、文化课平均分数;所述数据D
12
中的疾病数据均包括是否患病、患病频率、患病严重程度、疾病类型、学生缺勤频率和缺勤天数;所述数据D
13
中的饮食数据均包括平均每天摄入能量、学生所需能量,运动数据均包括平均每天运动量、运动时长、参加学校课间运动次数,睡眠数据均包括平均每天睡眠时长;所述数据D
22
中的课程安排数据包括体育课次数、文化课次数;所述数据D
22
中的疾病数据均包括是否患病、患病频率、患病严重程度、疾病类型、学生缺勤频率和缺勤天数;所述数据D
23
中的饮食数据均包括平均每天摄入能量、学生所需能量,运动数据均包括平均每天运动量、运动时长、参加学校课间运动次数,睡眠数据均包括平均每天睡眠时长。
[0009]一种基于分段式损失函数的学生体能分数预测方法,包括以下步骤:步骤S1,采集第一时间段内学生体能预测所需数据D
11
、数据D
12
和数据D
13
,第二时间段内学生体能预测所需的D
22
和数据D
23
,所述数据D
11
、数据D
12
、数据D
22
为高密度数据,所述数据D
13
、数据D
23
是稀疏数据;步骤S2,对所述步骤S1采集的数据D
13
、数据D
23
进行填充,获得数据D
14
、数据D
24
;步骤S3,采用数据D
11
、数据D
12
、数据D
14
构造第一时间段特征模块,采用数据D
22
、数据D
24
构造第二时间段特征模块;步骤S4,基于所述步骤S3中的第一时间段特征模块和第二时间段特征模块,采用XGBoost建模,预测学生在第二时间段的体能分数;其中,所述损失函数为基于超参数的大小切分的分段函数与正则项的组合。
[0010]优选的,所述分段式损失函数l2(y, f(x))为:
;其中,δ为超参数,f(x)表示体能分数预测值,y表示体能分数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分段式损失函数的学生体能分数预测方法,其特征在于,包括以下步骤:步骤S1,采集第一时间段内学生体能预测所需数据D
11
、数据D
12
和数据D
13
,第二时间段内学生体能预测所需的数据D
22
和数据D
23
,所述数据D
11
、数据D
12
、数据D
22
为高密度数据,所述数据D
13
、数据D
23
是稀疏数据;步骤S2,对所述步骤S1采集的数据D
13
、数据D
23
进行填充,获得数据D
14
、数据D
24
;步骤S3,采用数据D
11
、数据D
12
、数据D
14
构造第一时间段特征模块,采用数据D
22
、数据D
24
构造第二时间段特征模块;步骤S4,基于所述步骤S3中的第一时间段特征模块和第二时间段特征模块,采用XGBoost建模,预测学生在第二时间段的体能分数;其中,所述分段式损失函数为基于超参数切分的,在不同区间侧重均方根误差或绝对平均误差的分段函数。2.根据权利要求1所述的基于分段式损失函数的学生体能分数预测方法,其特征在于:所述分段式损失函数l1(y, f(x))为:其中δ为超参数,f(x)表示体能分数预测值,y表示体能分数真实值。3.根据权利要求1所述的基于分段式损失函数的学生体能分数预测方法,其特征在于:所述数据D
11
包括体能评估数据、健康数据,所述数据D
12
、所述数据D
22
包括课程数据、疾病数据,所述数据D
13
、所述数据D
23
包括饮食数据、运动数据、睡眠数据;所述第一时间段早于所述第二时间段。4.根据权利要求3所述的基于分段式损失函数的学生体能分数预测方法,其特征在于:所述数据D
11
中的体能评估数据包括体能测试类型、各体能测试类型体能测试得分,健康数据包括学生年龄、BMI、代谢综合症分类、肥胖分类、近视、散光、配镜情况;所述数据D
12
中的课程数据包括体育课次数、文化课次数、体育课分数、文化课平均分数;所述数据D
12
中的疾病数据均包括是否患病、患病频率、患病严重程度、疾病类型、学生缺勤频率和缺勤天数;所述数据D
13
中的饮食数据均包括平均每天摄入能量、学生所需能量,运动数据均包括平均每天运动量、运动时长、参加学校课间运动次数,睡眠数据均包括平均每天睡眠时长;所述数据D
22
中的课程安排数据包括体育课次数、文化课次数;所述数据D
22
中的疾病数据均包括是否患病、患病频率、患病严重程度、疾病类型、学生缺勤频率和缺勤天数;所述数据D
23
中的饮食数据均包括平均每天摄入能量、学生所需能量,运动数据均包括平均每天运动量、运动时长、参加学校课间运动次数,睡眠数据均包括平均每天睡眠时长。5.一种基于分段式损失函数的学生体能分数预测方法,其特征在于,包括以下步骤:步骤S1,采集第一时间段内学生体能预测所需数据D
11
、数据D
12
和数据D
13
,第二时间段内学生体能预测所需的D
22...

【专利技术属性】
技术研发人员:吴和俊王敏康王玲傅天涯
申请(专利权)人:杭州华网信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1