一种面向儿童的阶段性身高预测方法技术

技术编号:29255965 阅读:17 留言:0更新日期:2021-07-13 17:27
一种面向儿童的阶段性身高预测方法,包括:步骤1将数据进行归类;步骤2对kmeans聚类算法改进,并分类;步骤3计算检测者到每个类聚类中心的相似度距离,找出最相似的那一类;步骤4计算检测者到该类每个数据的相似度距离,找出最接近的3条数据,取平均值。一般的儿童的阶段性身高预测需要长时间的观测。但是这种方法耗时,无法跟上儿童身体素质的提升。本发明专利技术提出一种面向儿童的阶段性身高预测方法,利用kmeans聚类算法,结合大量横向儿童数据,构成儿童阶段性身高预测方法。

【技术实现步骤摘要】
一种面向儿童的阶段性身高预测方法
本专利技术涉及儿童阶段性身高预测方法。
技术介绍
儿童青少年阶段性身高是评估儿童青少年生长发育情况的一项重要指标,一直是国家、医生和家长关心的重点。通过对儿童青少年阶段性身高的预测,能其生长发育阶段出现的异常情况进行及时干预,还能使儿童青少年在成长过程中养成良好的生活习惯。但是阶段性身高预测存在需要长时间观测、数据难以获得、准确度不高等难点。因此,如何提高儿童阶段性预测身高的准确率是值得深入研究的重要问题。本专利技术将基于kmeans聚类算法,提出一种面向儿童的阶段性身高预测方法,能够及时发现青少年儿童在生长发育期间出现的身高问题。
技术实现思路
本专利技术要克服现有技术的上述缺点,提供一种面向儿童的阶段性身高预测方法。本专利技术解决技术问题采用如下技术方案:一种面向儿童的阶段性身高预测方法,包括以下步骤:步骤1:将数据进行归类;步骤2:对kmeans聚类算法改进,并分类;步骤3:计算检测者到每个类聚类中心的相似度距离,找出最相似的那一类;步骤4:计算检测者到该类每个数据的相似度距离,找出最接近的3条数据,取平均值。优选地,步骤1具体包括:将数据按照男生和女生分成两个组别,在每个组别中依照骨龄进行归类。优选地,步骤2具体包括:1)使用肘部法则和轮廓系数相结合的方法确定k值。肘部法则计算公式如下:其中,SSE表示的是所有样本的聚类误差,Ci表示第i个簇,p表示的是Ci中的样本点,mi表示的是Ci的质心,k表示类别数量。轮廓系数的公式如下表示:其中,S(j)表示轮廓系数,a(j)表示第j个样本到同一簇内其他点不相似程度的平均值,b(j)表示第j个样本到其他簇的平均不相似程度的最小值。S(j)越接近1,说明样本聚类效果越好。选择一个变化率急剧下降的点作为最优k值。选择方式以肘部法则为主,肘部法则无法确定,再辅以轮廓系数确定,选择最大时的轮廓系数作为k值。2)获取检测者的体成分信息(当前身高,当前体重,年龄,骨龄),作为其中一个聚类中心。举例说明,假设检测者的性别为男,骨龄在6.0~6.9之间,那么属于该检测者的骨龄段为男性数据集中骨龄范围为[6.0,6.9]之间的数据集合。F={H,W,A,BA}(3-3)其中,F表示第一个质心,H表示检测者的当前身高,W表示检测者的当前体重,A表示检测者的年龄,BA表示检测者的骨龄。在相应的骨龄段,利用马氏距离来计算被检测者和该骨龄段所有数据的体成分相似度。距离越小,表示相似度越高。其中,DM表示马氏距离,S表示协方差矩阵,x为样本集的变量,μ为每种变量的均值。利用公式(3-5)选取k-1个最不相似的数据作为剩下的聚类中心。Kt=(1,2,3,。。。,k-1)=argmaxt=(1,2,3,。。。,k-1)DM(3-5)其中,Kt表示第t个质心,DM表示马氏距离。2)根据检测者的骨龄,将该骨龄所属的骨龄段进行分类。优选地,步骤3具体包括:1)使用公式(4-1)计算检测者到每个类聚类中心的距离。其中,Similarv表示检测者与第v个数据的相似度距离,BA表示检测者的骨龄,BAv表示数据集中第v条数据的骨龄,H表示检测者的当前身高,Hv数据集中第v条数据的身高,A表示检测者的年龄,Av表示数据集中第v条数据的年龄,W表示检测者的当前体重,Wv表示数据集中第v条数据的体重。2)选择相似度距离最小的三条数据。步骤4具体包括:1)根据公式(5-1)将选取到的三条数据取平均值。(BAny,Hny,Any,Wny)=(Y(ba)avg,Y(h)avg,Y(a)avg,Y(w)avg)(5-1)其中,BAny表示下一年检测者的骨龄,Hny表示下一年检测者的身高,Any表示下一年检测者的年龄,Wny表示下一年检测者的体重,Y(ba)avg表示三条数据中骨龄的平均值,Y(h)avg表示三条数据身高的平均值,Y(a)avg表示三条数据中年龄的平均值,Y(w)avg表示三条数据中体重的平均值。2)重复以上步骤,直到检测者年龄超过18岁,这时检测者当前年龄到成年的阶段性身高就都可以表示出来。本专利技术具有如下有益效果:(1)对kmeans聚类算法改进,使其适用阶段性身高预测。(2)儿童阶段性身高的准确率提高。附图说明图1是本专利技术的流程图。图2是本专利技术其中一个男生预测结果。图3是本专利技术其中一个女生预测结果。具体实施方式下面结合附图对本专利技术的技术方案作进一步阐述。一种面向儿童的阶段性身高预测方法,包括以下步骤:步骤1:将数据进行归类;步骤2:对kmeans聚类算法改进,并分类;步骤3:计算检测者到每个类聚类中心的相似度距离,找出最相似的那一类;步骤4:计算检测者到该类每个数据的相似度距离,找出最接近的3条数据,取平均值。步骤1具体包括:将数据按照男生和女生分成两个组别,在每个组别中依照骨龄进行归类。步骤2具体包括:1)使用肘部法则和轮廓系数相结合的方法确定k值。肘部法则计算公式如下:其中,SSE表示的是所有样本的聚类误差,Ci表示第i个簇,p表示的是Ci中的样本点,mi表示的是Ci的质心,k表示类别数量。轮廓系数的公式如下表示:其中,S(j)表示轮廓系数,a(j)表示第j个样本到同一簇内其他点不相似程度的平均值,b(j)表示第j个样本到其他簇的平均不相似程度的最小值。S(j)越接近1,说明样本聚类效果越好。选择一个变化率急剧下降的点作为最优k值。选择方式以肘部法则为主,肘部法则无法确定,再辅以轮廓系数确定,选择最大时的轮廓系数作为k值。2)获取检测者的体成分信息(当前身高,当前体重,年龄,骨龄),作为其中一个聚类中心。举例说明,假设检测者的性别为男,骨龄在6.0~6.9之间,那么属于该检测者的骨龄段为男性数据集中骨龄范围为[6.0,6.9]之间的数据集合。F={H,W,A,BA}(3-3)其中,F表示第一个质心,H表示检测者的当前身高,W表示检测者的当前体重,A表示检测者的年龄,BA表示检测者的骨龄。在相应的骨龄段,利用马氏距离来计算被检测者和该骨龄段所有数据的体成分相似度。距离越小,表示相似度越高。其中,DM表示马氏距离,S表示协方差矩阵,x为样本集的变量,μ为每种变量的均值。利用公式(3-5)选取k-1个最不相似的数据作为剩下的聚类中心。Kt=(1,2,3,。。。,k-1)=argmaxt=(1,2,3,。。。,k-1)DM(3-5)其中,Kt表示第t个质心,DM表示马氏距离。2)根据检测者的骨龄,将该骨龄所属的骨龄段进行分类。本文档来自技高网...

【技术保护点】
1.一种面向儿童的阶段性身高预测方法,其特征在于,包括以下步骤:/n步骤1:将数据进行归类;/n步骤2:对kmeans聚类算法改进,并分类;/n步骤3:计算检测者到每个类聚类中心的相似度距离,找出最相似的那一类;/n步骤4:计算检测者到该类每个数据的相似度距离,找出最接近的3条数据,取平均值。/n

【技术特征摘要】
1.一种面向儿童的阶段性身高预测方法,其特征在于,包括以下步骤:
步骤1:将数据进行归类;
步骤2:对kmeans聚类算法改进,并分类;
步骤3:计算检测者到每个类聚类中心的相似度距离,找出最相似的那一类;
步骤4:计算检测者到该类每个数据的相似度距离,找出最接近的3条数据,取平均值。


2.根据权利要求1所述的一种面向儿童的阶段性身高预测方法,其特征在于,所述的步骤1具体包括:
将数据按照男生和女生分成两个组别,在每个组别中依照骨龄进行归类。


3.根据权利要求1所述的一种面向儿童的阶段性身高预测方法,其特征在于,所述的步骤2具体包括:
21)使用肘部法则和轮廓系数相结合的方法确定k值。肘部法则计算公式如下:



其中,SSE表示的是所有样本的聚类误差,Ci表示第i个簇,p表示的是Ci中的样本点,mi表示的是Ci的质心,k表示类别数量;
轮廓系数的公式如下表示:



其中,S(j)表示轮廓系数,a(j)表示第j个样本到同一簇内其他点不相似程度的平均值,b(j)表示第j个样本到其他簇的平均不相似程度的最小值。S(j)越接近1,说明样本聚类效果越好;
选择一个变化率急剧下降的点作为最优k值。选择方式以肘部法则为主,肘部法则无法确定,再辅以轮廓系数确定,选择最大时的轮廓系数作为k值;
22)获取检测人的体成分信息(当前身高,当前体重,年龄,骨龄),作为其中一个聚类中心;
F={H,W,A,BA}(3-3)
其中,F表示第一个质心,H表示检测人的当前身高,W表示检测人的当前体重,A表示检测人的年龄,BA表示检测人的骨龄;
在相应的骨龄段,利用马氏距离来计算检测者和该骨龄段所有数据的体成分相似度,距离越小,表示...

【专利技术属性】
技术研发人员:毛科技华子雯汪敏豪徐瑞吉赵小敏
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1