一种基于机器学习的心衰患者生存预测方法技术

技术编号:29215401 阅读:16 留言:0更新日期:2021-07-10 00:53
本发明专利技术涉及机器学习技术领域,具体涉及一种基于机器学习的心衰患者生存预测方法,包括对患者生命体特征数据进行预处理,利用机器学习算法对特征数据的特征集进行选择优化;进行相关特征提取和分类,构建特征集;经过训练得到最优的特征组合结果,并进行归一化;将特征集作为机器学习模型的输入,利用机器学习模型进行学习,经过训练和预测,得到结果与进行传统生物传统的单变量生物统计分析进行交叉验证,综合得出心衰患者生存概率;本发明专利技术通过获取到所需要的数据后通过机器学习模型进行对心衰患者的生存概率进行预测,通过识别出生存率偏低的患者帮助卫生保健提供者将资源和服务直接提供给这些患者,以进行更好的干预,提高患者生存率。高患者生存率。高患者生存率。

【技术实现步骤摘要】
一种基于机器学习的心衰患者生存预测方法


[0001]本专利技术涉及机器学习
,具体涉及一种基于机器学习的心衰患者生存预测方法。

技术介绍

[0002]全球每年约有1700万人死于心血管疾病,主要表现为心肌梗死和心力衰竭。当心脏不能泵出足够的血液来满足身体的需要时,就会发生心力衰竭。可用的患者电子医疗记录量化症状、身体特征和临床实验室测试值,可用于执行生物统计分析,以突出模式和相关性,否则医生无法检测到。尤其是机器学习,它可以根据患者的数据预测其生存状况,并能从他们的医疗记录中提取出最重要的特征。因此,设计了一种基于机器学习的心衰患者生存预测模型。该模型不仅可以提高诊断效率,还能为医生提供更加客观、准确的诊断结果,因而具有重要的临床应用价值。
[0003]患有心力衰竭的患者症状和体征各不相同,其诊断依据有患者既往临床病史、目前症状病历、体格检查、X线胸片、静息心电图和彩色超声心电图等。近年来,机器学习技术已经出现,以解决医学领域的许多问题。而且已有研究发现,基于人工智能技术的决策支持模型有助于改善临床实践。

技术实现思路

[0004]本专利技术所要解决的技术问题是:提供一种基于机器学习的心衰患者生存预测模型,通过对心衰患者健康体征的监测,进行心衰患者生存概率的预测,以进行更好的干预,提高患者的生存率基于机器学习的心衰患者生存预测方法。
[0005]为了解决上述技术问题,本专利技术采用的技术方案为:
[0006]一种基于机器学习的心衰患者生存预测方法,包括
[0007]对患者生命体特征数据进行预处理,利用机器学习算法对特征数据的特征集进行选择优化,并测试准确率;
[0008]进行相关特征提取和分类,构建特征集;经过训练得到最优的特征组合结果,并进行归一化;
[0009]将特征集作为机器学习模型的输入,利用机器学习模型进行学习,经过训练和预测,得到结果暂时保留;
[0010]进行传统生物传统的单变量生物统计分析,与通过机器学习分析得到的结果进行交叉验证,综合得出心衰患者生存概率。
[0011]本专利技术的有益效果在于:通过获取到所需要的数据后通过机器学习模型进行对心衰患者的生存概率进行预测,通过识别出生存率偏低的患者帮助卫生保健提供者将资源和服务直接提供给这些患者,以进行更好的干预,提高患者生存率。
附图说明
[0012]图1为本专利技术具体实施方式的一种基于机器学习的心衰患者生存预测方法的预测框架;
[0013]图2为本专利技术具体实施方式的一种基于机器学习的心衰患者生存预测方法的随机森林原理图。
具体实施方式
[0014]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。
[0015]请参照图1以及图2,一种基于机器学习的心衰患者生存预测方法,包括
[0016]对患者生命体特征数据进行预处理,利用机器学习算法对特征数据的特征集进行选择优化,并测试准确率;
[0017]进行相关特征提取和分类,构建特征集;经过训练得到最优的特征组合结果,并进行归一化;
[0018]将特征集作为机器学习模型的输入,利用机器学习模型进行学习,经过训练和预测,得到结果暂时保留;
[0019]进行传统生物传统的单变量生物统计分析,与通过机器学习分析得到的结果进行交叉验证,综合得出心衰患者生存概率。
[0020]进一步的,所述分类通过算法优化,所述算法包括随机森林算法、高斯核函数以及线性回归算法。
[0021]进一步的,在所述随机森林算法中,产生一个独立于以前的随机向量的随机向量θ
k
并将其分发给所有树,每棵树种植用训练集和随机向量θ
k
,从而由输入向量x产生树—结构化分类器集合{h(x,θ
k
),k=1,......};
[0022]在随机森林算法中,泛化误差为:
[0023]PE
*
=P
X,Y
(mg(X,Y)<0)
[0024]其中,下标X和Y是随机向量,表示概率在X,Y空间上,而mg是边缘函数,衡量的是随机向量的平均投票数超过其他任何输出的平均投票数的程度;边界函数定义为:
[0025]mg(X,Y)=av
k
I(h
k
(X)=Y)

max
j≠Y
av
k
I(h
k
(X)=j)
[0026]其中,I(.)为指示函数。
[0027]进一步的,生意上个月随机森林算法初步设定由3棵树组成,每棵树都考虑了5个随机特征;通过插入不同的树和随机特征值,利用分类精度作为拟合函数,得到树和随机特征的最优值。
[0028]进一步的,所述预处理包括去噪、提取相关特征以及对缺失值的处理。
[0029]进一步的,所述归一化采用sigmod函数进行。
[0030]从上述描述可知,本专利技术的有益效果在于:通过获取到所需要的数据后通过机器学习模型进行对心衰患者的生存概率进行预测,通过识别出生存率偏低的患者帮助卫生保健提供者将资源和服务直接提供给这些患者,以进行更好的干预,提高患者生存率。
[0031]实施例一
[0032]一种基于机器学习的心衰患者生存预测方法
[0033](1)对患者生命体征数据进行预处理,包括去噪、提取相关特征。对患者生命体征数据进行预处理,包括去噪、提取相关特征以及对缺失值的处理,同时利用机器学习算法对特征集进行选择优化,并测试准确率为下一步的特征提取和分类做准备;同时进行相关特征提取,构建特征集。经过训练得到最优的特征组合结果,并利用sigmod函数进行归一化。
[0034](2)将处理的特征集作为机器学习模型的输入,利用机器学习模型进行学习,经过训练和预测,得到的数据暂时保留。
[0035](3)进行传统生物传统的单变量生物统计分析,与机器学习得到的结果进行交叉验证。
[0036](4)综合给出患者生存概率。
[0037]其中分类通过随机森林算法、高斯核函数、线性回归算法优化,使分类准确率提高。主要是调整改进随机森林模型的决策数数目和相关参数,以及高斯核函数和线性回归算法中的一些参数以达到最优。
[0038]所述随机森林算法:
[0039]随机森林是一种多树预测器组合的分类方法,每棵树都依赖于随机选择的向量在森林中以相同的方式分布的一个值。在随机森林算法中,产生一个独立于以前的随机向量的随机向量θ
k
并将其分发给所有树,每棵树种植用训练集和随机向量θ
k
,从而由输入向量x产生树—结构化分类器集合{h(x,θ
k
),k=1,......}。在随机森林算法中,泛化误差为:
[0040]PE
*
=P
X,Y
(mg(X,Y)<0)
[0041]其中,下标X和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的心衰患者生存预测方法,其特征在于,包括对患者生命体特征数据进行预处理,利用机器学习算法对特征数据的特征集进行选择优化,并测试准确率;进行相关特征提取和分类,构建特征集;经过训练得到最优的特征组合结果,并进行归一化;将特征集作为机器学习模型的输入,利用机器学习模型进行学习,经过训练和预测,得到结果暂时保留;进行传统生物传统的单变量生物统计分析,与通过机器学习分析得到的结果进行交叉验证,综合得出心衰患者生存概率。2.根据权利要求1所述的基于机器学习的心衰患者生存预测方法,其特征在于,所述分类通过算法优化,所述算法包括随机森林算法、高斯核函数以及线性回归算法。3.根据权利要求2所述的基于机器学习的心衰患者生存预测方法,其特征在于,在所述随机森林算法中,产生一个独立于以前的随机向量的随机向量θ
k
并将其分发给所有树,每棵树种植用训练集和随机向量θ
k
,从而由输入向量x产生树—结构化分类器集合{h(x,θ
k
),k=1,......};在随机森林算法中,泛化误差为:PE

【专利技术属性】
技术研发人员:李灯熬赵菊敏李鑫
申请(专利权)人:太原理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1