【技术实现步骤摘要】
大数据驱动的学生有氧能力分群方法
本专利技术涉及大数据驱动的学生有氧能力分群方法,具体涉及大数据背景下的学生有氧能力数据两阶段分群方法,尤其涉及对具有多维时间序列,在时间维度上非等长的有氧能力数据,提出非等长的多变量时间序列分群聚类方法。
技术介绍
从1985年起,我国进行了6次全国范围的青少年体质健康调查。调查显示,中国青少年的体质在持续下降。由于长期缺乏锻炼,超重和肥胖现象严重,近视发生率继续增加,血压调节机能不良比较普遍,一些常见的中老年人病症(如冠心病、高血压等),近年来也时常出现在有的青少年身上。据调查资料显示,从1985年到2005年春秋段的学生,大学生的耐力体质还在持续下降,而7至18岁的学生耐力正慢慢回升。2012年下半年,接连发生的多起青少年中长跑猝死事件,如上海东华大学一名大三学生,在测试1000米时忽然晕倒,不治身亡;2013年、2014年相继在湖北、浙江发生类似案例。致使多所学校取消了运动会的中长跑项目。这类事件引起社会各界对学生体质下降问题的广泛关注,如何遏制青少年体质持续下降,促进学生健康成长,是学校体育的当务之急。面对海量的学生运动有氧能力数据,合理的分析、挖掘学生,对学生健康状况进行一定的了解,定制合理的运动方案,是防止运动中突发事件产生、提高学生体质健康的一种重要手段。数据分析中的聚类方法是通过无监督的方式将相似性高的个体聚成簇,以此区分个体差异。通过对有氧能力数据进行聚类分析,可以找出不同的学生群体,针对不同的群体运用不同的运动方案,可以有效的促进学生的体质健康,防止突发事件的产生。因此,对学生有氧能力数据进行聚类分群具 ...
【技术保护点】
大数据驱动的学生有氧能力分群方法,采用两阶段法对学生生理数据进行分群处理,其特征在于第一阶段使用隐马尔可夫模型将每条学生生理数据作为观察序列进行建模,获得在此观察序列下的状态转化序列,计算出概率转化矩阵,即学生有氧能力模型;第二阶段将第一阶段得到的学生有氧能力模型加载进内存,采用层次聚类算法对学生有氧能力进行分群处理。
【技术特征摘要】
1.大数据驱动的学生有氧能力分群方法,采用两阶段法对学生生理数据进行分群处理,其特征在于第一阶段使用隐马尔可夫模型将每条学生生理数据作为观察序列进行建模,获得在此观察序列下的状态转化序列,计算出概率转化矩阵,即学生有氧能力模型;第二阶段将第一阶段得到的学生有氧能力模型加载进内存,采用层次聚类算法对学生有氧能力进行分群处理。2.根据权利要求1所述的大数据驱动的学生有氧能力分群方法,其特征在于第一阶段包含:通过训练来求解HMM的模型参数,利用得到的参数和观察序列求解HMM的预测问题,得到的学生有氧能力模型记为P1,P2,……,PN,N是状态总数;第二阶段包括将一条观察序列记为O=(o1,o2,o3,…,oT),ot表示t时刻观察序列的观察值,设其对应的状态转化序列为Q=(q1,q2,q3,…,qT),qt表示t时刻状态转化序列的状态值,具体的分群方法包括如下步骤:步骤1第一阶段有氧能力模型生成:1.1)初始化HMM参数λ=(A,B,π)和状态空间S,相应状态数N,其中状态转换矩阵A=(aij)N×N,其中1≤i,j≤N,aij表示从状态i转化为状态j的概率;不同状态下观察值的概率分布矩阵B=(bj(ot))N×T,其中1≤j≤N,1≤t≤T,bj(ot)表示状态j的概率密度函数;设状态j的观察数据ot服从高斯分布,则bj(ot)=N(ot;μj,Σj),μj表示状态j所对应的观察数据的高斯分布的均值,Σj表示状态j所对应的观察数据的高斯分布的协方差矩阵;其中π为初始概率向量;S={s1,s2,s3,…,sN};1.2)使用所有的观察序列,通过期望最大化算法,即EM算法求得全体学生生理的HMM参数λ=(A,B,π);1.3)根据观察序列和模型参数,使用维特比算法,即Viterbi算法预测每条有氧能力数据的状态序列Q,对于λ=(A,B,π),观测序列为O=(o1,o2,o3,…,oT)预测问题,求解得到每个学生的状态转化序列;1.4)根据状态转换序列求得概率转化向量,即学生有氧能力模型;步骤2)第二阶段层次聚类:2.1)每个学生有氧能力模型初始化为一个类,C={c1,c2,…,cn};2.2)计算类间距离:有氧能力模型之间距离计算采用Kullback-Lieber方法;计算所有ci,cj的Kullback-Lieber距离KL(ci,cj),其中i>j,i,j=1,2,…,n;2.3)合并Kullback-Lieber距离最小,即相似度最高的两个类ci,cj形成新类cij,将C中的ci,cj替换为cij,如果C中只剩一个元素则停止计算,否则返回步骤2.2继续计算。3.根据权利要求2所述的大数据驱动的学生有氧能力分群方法,其特征在于步骤1.2中,全体学生生理的HMM参数λ通过期望最大化EM算法来求解,对于一条观察序列,使用EM算法在计算机上运行以下步骤:A1.将一条学生有氧能力数据记为O=(o1,o2,…,oT),假设其对应的状态序列,即隐变量为Q=(q1,q2,q3,……,qT),初始参数求在观察数据和初始参数下的隐变量的概率A2.EM算法的E步:求出E步的G函数它表示在参数下的观察序列O和状态序列Q概率的对数似然函数对参数λ和观察序列O下的状态序列Q的数学期望;A3.EM算法的M步:极大化G函数,求出模型参数A、B、π;A4.迭代计算步骤A2、A3,直到...
【专利技术属性】
技术研发人员:杨良怀,王海龙,柳乔凡,周君来,周雷,李海鹏,范玉雷,龚卫华,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。