一种基于多模型算法的慢性病风险评估方法及其系统技术方案

技术编号:36341545 阅读:35 留言:0更新日期:2023-01-14 17:54
本发明专利技术涉及慢性病风险评估技术领域,具体涉及一种基于多模型算法的慢性病风险评估方法及其系统,本发明专利技术通过对获取的数据信息进行预处理,将处理后数据发送至梯度决策树模型内进行学习,得到初步的疾病风险预测模型,所得模型能对未知患者五年内慢性病发病情况进行预测,进一步通过LIME算法和SHAP算法对模型预测过程和输出结果进行解释,根据用户特征给出风险因素,以及相应健康建议,使用户对慢性病的风险认知更加清楚,能及时到医院进行检查和接受治疗。接受治疗。接受治疗。

【技术实现步骤摘要】
一种基于多模型算法的慢性病风险评估方法及其系统


[0001]本专利技术涉及慢性病风险评估
,具体的涉及基于多模型算法的慢性病风险评估方法及其系统。

技术介绍

[0002]随着经济的快速发展,人们的生活节奏也明显加快,并随之产生了一系列的不健康生活方式,进而导致心脑血管疾病、糖尿病和恶性肿瘤等慢性病的发病率、患病率和死亡率持续上升。慢性病是一大类受环境因素和遗传因素共同影响的多因素疾病,是由多种危险因素综合作用产生的结果。慢性病起病隐匿,潜伏期长、病情进展快,很多患者难以及时发现及治疗。
[0003]慢性病的治疗需要在日常生活中控制生活习惯,降低慢性病的发病。对于慢性病的发展评估,基本上依靠医生的个人经验,但是慢性病的病情发展由多种因素造成,单纯依靠医生的个人经验,特别是在落后地区医疗资源相对较缺乏的情况下,医生难以对慢性病患者的病情给出较准确的判断并进行针对性的治疗,并且慢性病初期时,慢性病的症状有可能没有展现出来,导致患者对慢性病的风险认知并不清楚,不能及时到医院进行检查和接受治疗。
[0004]因此,如何便捷地检测出用户患慢性病的风险成为亟需解决的问题。

技术实现思路

[0005]本专利技术的目的在于克服以上技术问题提出基于多模型算法的慢性病风险评估方法。
[0006]为实现上述目的,本专利技术采用的技术方案如下:基于多模型算法的慢性病风险评估方法,包括以下方法:
[0007]S1、获取用户的数据信息;
[0008]S2、采用判断模型将获取的数据信息进行分类,分为生活数据、医疗数据和其他数据;
[0009]S3、基于多个质量维度对数据信息进行质量评估,以得到处于预设范围的标准化数据;
[0010]S4、将标准化数据输入至梯度提升决策树模型中进行模型训练,经过多步参数调整,验证模型性能,筛选出性能最佳的疾病风险预测模型;
[0011]S5、基于LIME和SHAP算法对疾病风险预测模型进行结果分析模型训练,得到风险因素分析模型,综合输出评估患慢性病的风险报告。
[0012]进一步的,所述基于多个质量维度对数据信息进行质量评估的方法包括:
[0013]S301、基于多个质量维度对数据信息进行质量评估,将数据质量分为待处理数据和可用数据两类;
[0014]S302、通过填补算法对所述待处理数据进行预处理,得到处于预设范围的标准化
数据。
[0015]进一步的,所述填补算法包括中位数填补、LSTM和CNN时序填补、向后填补和随机森林填补中的一种或多种。
[0016]进一步的,利用SMOTE算法对步骤S3中得到的标准化数据进行正负样本平衡处理。
[0017]进一步的,所述正负样本平衡处理包括用算法删除部分样本,使得数据集正负样本平衡。
[0018]进一步的,所述将标准化数据输入至梯度提升决策树模型中进行训练包括:
[0019]S401、将标准化数据通过梯度提升决策树算法进行维度重要性排序与筛选,并提取主要维度数据;
[0020]S402、将主要维度数据作为梯度提升决策树模型的输入,训练梯度提升决策树模型直至训练误差达到局部最优,得到疾病风险预测模型;
[0021]S403、基于LightGBM算法对疾病风险预测模型进行模型训练,获取慢性病风险概率;
[0022]S404、通过sigmoid概率映射方法将所述慢性病风险概率转化为患慢性病的风险等级。
[0023]进一步的,所述主要维度数据包括饮食组成维度、身体健康维度、运动情况维度和生活习惯维度中的一种或多种。
[0024]进一步的,还包括根据慢性病的风险等级和风险因素溯源推荐相关改善慢性病的健康信息。
[0025]基于多模型算法的慢性病风险评估系统,包括:
[0026]获取模块,用于获取用户的数据信息;
[0027]处理模块,用于将获取的数据信息基于多个质量维度进行质量评估,并输入至梯度提升决策树模型中进行训练,构建得到疾病风险预测模型;
[0028]评估模块,用于根据疾病风险预测模型输出结果,利用LightGBM算法评估慢性病的风险等级,利用LIME和SHAP算法输出风险因素。
[0029]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的基于多模型算法的慢性病风险评估方法。
[0030]由上述对本专利技术的描述可知,与现有技术相比,本专利技术提供的一种基于多模型算法的慢性病风险评估方法具有的有益效果:本专利技术通过对获取的数据信息进行预处理,将处理后数据发送至梯度决策树模型内进行学习,得到初步的疾病风险预测模型,所得模型能对未知患者五年内慢性病发病情况进行预测,进一步通过LIME算法对模型预测过程和输出结果进行解释,根据用户特征给出风险因素,以及相应健康建议,使用户对慢性病的风险认知更加清楚,疾病风险预测模型是实时动态变化的,会根据不同用户身体状况的不同情况做不同结果,能及时到医院进行检查和接受治疗。
附图说明
[0031]图1为本专利技术基于多模型算法的慢性病风险评估方法的流程框图;
具体实施方式
[0032]以下将结合本专利技术实施例中的附图对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0033]需要说明的是,本专利技术的说明书和权利要求书术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0034]如图1所示,基于多模型算法的慢性病风险评估方法,包括以下方法:
[0035]S1、获取用户的数据信息;
[0036]其中,所述数据信息包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值、耐糖量试验值中的一种或多种,根据不同慢病的情况会有收集不同慢病数据,可以是糖尿病、高血压、冠心病以及心力衰竭等不同的慢性疾病,
[0037]S2、采用判断模型将获取的数据信息进行分类,分为生活数据、医疗数据和其他数据;
[0038]其中,所述数据信息包括性别、年龄、是否怀孕、直系亲属中是否有糖尿病患者、体质指数、睡眠时间、饮食习惯、每天运动时间、空腹血糖值、餐后血糖值、血脂值、耐糖量试验值中的一种或多种,根据不同慢病的情况会有收集不同慢病数据,可以是糖尿病、高血压、冠心病以及心力衰竭等不同的慢性疾病。
[0039]S3、基于多个质量维度对数据信息进行质量评估,以得到处于预设范围的标准化数据;
[0040]其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多模型算法的慢性病风险评估方法,其特征在于,包括以下方法:S1、获取用户的数据信息;S2、采用判断模型将获取的数据信息进行分类,分为生活数据、医疗数据和其他数据;S3、基于多个质量维度对数据信息进行质量评估,以得到处于预设范围的标准化数据;S4、将标准化数据输入至梯度提升决策树模型中进行模型训练,经过多步参数调整,验证模型性能,筛选出性能最佳的疾病风险预测模型;S5、基于LIME和SHAP算法对疾病风险预测模型进行结果分析模型训练,得到风险因素分析模型,综合输出评估患慢性病的风险报告。2.根据权利要求1所述的基于多模型算法的慢性病风险评估方法,其特征在于,所述基于多个质量维度对数据信息进行质量评估的方法包括:S301、基于多个质量维度对数据信息进行质量评估,将数据质量分为待处理数据和可用数据两类;S302、通过填补算法对所述待处理数据进行预处理,得到处于预设范围的标准化数据。3.根据权利要求2所述的基于多模型算法的慢性病风险评估方法,其特征在于,所述填补算法包括中位数填补、LSTM和CNN时序填补、向后填补和随机森林填补中的一种或多种。4.根据权利要求1所述的基于多模型算法的慢性病风险评估方法,其特征在于,利用SMOTE算法对步骤S3中得到的标准化数据进行正负样本平衡处理。5.根据权利要求4所述的基于多模型算法的慢性病风险评估方法,其特征在于,所述正负样本平衡处理包括用算法删除部分样本,使得数据集正负样本平衡。6.根据权利要求1所述的基于多模型算法的慢性病风险评估方法,其特征在于...

【专利技术属性】
技术研发人员:游海涛王琳林书田洪晶瑾
申请(专利权)人:易联众云链科技福建有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1