The invention discloses a method and a system, height forecast includes: basic data A, access to the specified age range of minors and the height data; among them, the basic data including but not limited to: gender, age, location, weight, diet, sleep habits, exercise habits, parents' height on the basis of B; and data acquisition for feature selection, to extract the key features of the data significantly affected the height; C, to extract the key features of the data and the corresponding height data clustering, growth curve model and constructed in each group of different gender different age range of minors; D, according to the growth curve model to forecast data of minors characteristics of height choice the corresponding groups in the corresponding gender and age range; and the input In order to get the predictive value of their adult height, the invention can be applied to real-time assessment and interpretation of adolescents' growth and development, investigation and analysis of nutritional health status of adolescents, and personalized recommendation of children's dietary habits and habits.
【技术实现步骤摘要】
一种身高预测方法及系统
本专利技术涉及医疗健康行业的数据挖掘技术应用领域,特别涉及一种身高预测方法及系统。
技术介绍
身高是评价青少年儿童生长发育健康状况的敏感而又重要的指标。通常情况下,身高顺利增长,说明孩子的营养良好,并且没有受到慢性疾病的干扰。随着科学技术的进步,人们对青少年儿童身高发育的认识越来越深入。在一系列青少年成长健康问题中,青少年身高问题是大家最为关注的。青少年儿童身高受到包括体重、饮食、运动、营养的摄入、睡眠的质量以及各种疾病因素的影响,但是对青少年儿童身高影响最大的还是遗传因素,也就是父母的身高对孩子的成年身高起到决定性作用。目前,对孩子成年身高进行预测较为准确的方法是进行纵向研究。通过限定研究地区以及孩子的身体状况,连续采集孩子的体重数据、父母的身高数据、孩子的骨龄数据,最后建立一个身高预测的线性模型:Y=β0+βRL*RL+βW*W+βMPS*MPS+βSA*SA该模型包含的变量分别有:现在的身高(RL)、现在的体重(W)、父母平均身高(MPS)、现在的骨龄(SA)。其中βRL,βW,βMPS,βSA,β0分别是和上述因素相对应的模型系数, ...
【技术保护点】
一种身高预测方法,其特征在于,包括:A、获取指定年龄区间的未成年人及18岁成年人的基础数据及其当前身高数据;其中,所述基础数据包括:性别、年龄、地域、体重、饮食习惯、睡眠习惯、运动习惯、父母的身高;B、对获取的所述基础数据进行特征选择,以提取对身高影响显著的关键特征数据;C、对提取的所述关键特征数据及其对应的身高数据进行聚类分组,并构建每个分组内的不同性别的不同年龄区间的未成年人的生长曲线模型;D、根据待预测身高的未成年人的特征数据选择其对应分组内的对应性别和年龄区间的生长曲线模型;并将其输入到其中,以获取其18岁成年身高的预测值。
【技术特征摘要】
1.一种身高预测方法,其特征在于,包括:A、获取指定年龄区间的未成年人及18岁成年人的基础数据及其当前身高数据;其中,所述基础数据包括:性别、年龄、地域、体重、饮食习惯、睡眠习惯、运动习惯、父母的身高;B、对获取的所述基础数据进行特征选择,以提取对身高影响显著的关键特征数据;C、对提取的所述关键特征数据及其对应的身高数据进行聚类分组,并构建每个分组内的不同性别的不同年龄区间的未成年人的生长曲线模型;D、根据待预测身高的未成年人的特征数据选择其对应分组内的对应性别和年龄区间的生长曲线模型;并将其输入到其中,以获取其18岁成年身高的预测值。2.根据权利要求1所述的方法,其特征在于,所述步骤A的获取方式包括:通过网络问卷或者纸质问卷的形式进行采集和\或通过网络数据库获取现有的指定年龄区间的未成年人及18岁成年人的基础数据及其当前身高数据。3.根据权利要求1所述的方法,其特征在于,所述步骤A还包括:通过箱线图的离群点检测算法对采集的异常的数据进行识别过滤。4.根据权利要求1所述的方法,其特征在于,所述步骤B包括:通过实际预期指标分析法对所述基础数据进行特征选择,以提取对身高影响显著的关键特征数据,包括:B11、获取身高预期值表,包括:根据所述基础数据中的性别、年龄、父母平均身高三个变量将所述未成年人的身高进行第一次分组;并将计算获得的每个组中的未成年人的平均身高或者中位数身高作为身高预期值。B12、在所述第一次分组的基础上,根据待选择的特征类型将所述未成年人的身高进行第二次分组;并计算获得的第二次分组中各个组内的未成年人的实际身高与所述身高预期值的各个比值,通过求平均以获取第二次分组后的各个组内的平均比值;其中,所述待选择的特征类型包括:地域、体重、饮食习惯、睡眠习惯和/或运动习惯;B13、将所述平均比值在一指定区间的待选择的特征类型作为对身高影响显著的关键特征数据。5.根据权利要求1所述的方法,其特征在于,所述步骤B包括:通过带罚回归特征选择法对所述基础数据进行特征选择,以提取对身高影响显著的关键特征数据,包括:B21、将所述基础数据及所述当前身高数据进行处理,包括:将其中的数值变量转换为均值为0方差为1的标准化的数值变量;其中,所述数值变量包括:体重、年龄、父母的身高;以及将其中的分类变量拆分为虚拟变量;其中,所述分类变量包括但不限于:性别、地域、是否足月出生;将处理后的标准化的数值变量及虚拟变量作为待选择的特征;或,所述标准化的数值变量及虚拟变量根据需求两两相乘组合为一待选择的特征;B22、随机抽取所述待选择的特征以及其对应的未成年人的身高数据...
【专利技术属性】
技术研发人员:田勇,
申请(专利权)人:北京好啦科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。