【技术实现步骤摘要】
一种基于机器学习的老年人失能风险预测方法和系统
本专利技术属于大数据的健康状况分析预测领域,具体涉及一种基于机器学习的老年人失能风险预测方法和系统。
技术介绍
随着社会生活水平的提高,人口高龄化、老龄化的加速,失去日常生活能力的老人,即失能老人的数量也逐年增加。失能老人的日常生活需要他人照料,借助外部护理服务来弥补失去的生理机能,这需要大量的社会照料资源。对特定地区老年人群的失能风险进行有效预测,一方面,可以优化社区护理、养老机构、社会和商业保险等资源配置;另一方面,也有助于对老年人的生活状况进行干预,降低其失能风险。目前,对老年人的身体健康状况评估一般限于某种特定疾病,缺乏对失去日常生活能力风险预测的有效方法。
技术实现思路
本专利技术的目的之一在于提供一种基于机器学习的老年人失能风险预测方法,以解决上述
技术介绍
中提出的问题。该方法包括步骤:步骤S1:获取老年人群的特征指标数据,包括基础数据、社会经济数据和病史信息数据,构成样本数据集,并对样本数据集进行预处理及数据编码;所述的特征指标数
【技术保护点】
1.一种基于机器学习的老年人失能风险预测方法,其特征在于,包括以下步骤:/n步骤S1:获取老年人群的特征指标数据,包括基础数据、社会经济数据和病史信息数据,构成样本数据集,并对样本数据集进行预处理及数据编码;/n步骤S2、使用特征选择方法对样本数据集中的特征进行筛选,得到重要特征;/n步骤S3,根据样本数据和筛选出的重要特征建立多层神经网络模型,训练模型;/n步骤S4,获取待测老年人员的特征指标数据,输入到训练好的神经网络模型,得到预测结果。/n
【技术特征摘要】
1.一种基于机器学习的老年人失能风险预测方法,其特征在于,包括以下步骤:
步骤S1:获取老年人群的特征指标数据,包括基础数据、社会经济数据和病史信息数据,构成样本数据集,并对样本数据集进行预处理及数据编码;
步骤S2、使用特征选择方法对样本数据集中的特征进行筛选,得到重要特征;
步骤S3,根据样本数据和筛选出的重要特征建立多层神经网络模型,训练模型;
步骤S4,获取待测老年人员的特征指标数据,输入到训练好的神经网络模型,得到预测结果。
2.根据权利要求1所述的基于机器学习的老年人失能风险预测方法,其特征在于,所述的特征指标数据,具体包括:
基础数据:年龄、性别、体重;
社会经济数据:住房面积、婚姻状况、子女状况、平均每月收入、平均每月医疗花费、是否有医保;
病史信息数据:冠心病史、高血压史、脑梗塞史、脑出血史、肝炎史、输血史、外伤手术史,以及2个生活习惯:吸烟和喝酒。
3.根据权利要求1所述的基于机器学习的老年人失能风险预测方法,其特征在于,筛选特征的方法包括:主成分分析法、互信息法、相关系数法、随机森林模型中的一种或多种。
4.根据权利要求1所述的基于机器学习的老年人失能风险预测方法,其特征在于,所述的步骤S2中采用随机森林模型对样本数据集中的特征进行筛选,包括:
S21:确定特征选择的目标数量m,采用Bagging方法构造随机森林,计算样本数据集中每一个特征指标的重要性,计算方法如下:
1)对于随机森林中的每一颗决策树,使用相应的袋外数据来计算它的袋外数据误差,记为errOOB1;
2)随机地对袋外数据所有样本的特征指标X加入噪声干扰,再次计算它的袋外数据误差,记为errOOB2;
3)计算特征指标X的重要性=∑(errOOB2-errOOB1)/N,其中N表示随机森林中的决策树的数量;
S22:对样本数据集中的特征指标按照特征重要性排序,按照比例剔除重要性低的特征指标,得到新的特征集;
S23:用新的特征集构造新的随机森林,重复步骤S21至步骤S23,直到步骤S23得到的新的特征集中剩下m个特征。
5.根据权利要求1所述的基于机器学习的老年人失能风险预测方法,其特征在于,所述多层神经网络模型包括输入层、隐含层和输出层;所述的输入层采用Relu激活函数,隐含层采用Relu函数,输出层采用Softmax激活函数。
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。