【技术实现步骤摘要】
一种基于机器学习的脓毒症休克早期预测系统
[0001]本专利技术属于医疗数据挖掘领域,具体涉及一种基于机器学习的脓毒症早期预测方法。
技术介绍
[0002]脓毒症是一种对生命安全有着严重威胁的疾病,脓毒症是因感染导致的全身炎症反应综合症,是ICU患者常见高危并发症和致死的主要原因之一。全球中每年估计有3000万人患有脓毒症,因脓毒致死人数超过600万人,脓毒症的治疗费用非常高,且面临的风险也非常大。因发病率、致死率高以及昂贵的治疗费用,脓毒症已经成为全球高度关注的公共医疗问题。脓毒症的临床诊断定义从1.0发展到3.0,也在不断变化更新。目前临床上最新定义脓毒症
‑
3是欧洲重症学会于2016年提出的。临床上对脓毒症的发病规律研究已取得一定进展,但脓毒症的发病机制复杂,涉及变量因素较多,诊断准确率还有待提高。有研究表明,脓毒症的早期发现和及时的抗生素治疗对于改善脓毒症患者的结局至关重要,每延迟一小时治疗都会使死亡率增加4%
‑
8%。尽早地发现可能发展成脓毒症的患者并对其给与及时治疗,同时探究与脓毒症发生有着密切关系的关键影响因素对于改善病人预后有着具有重要的研究价值和意义。目前的研究大都从医学角度出发,大部分使用的是基于统计分析以及简单的逻辑回归模型,很少有使用机器学习算法针对患者进行脓毒症的早期预测。现有研究表明脓毒症是远期死亡的主要原因。患者入ICU后的24小时内是非常关键的时刻,大多数病情转变发生在此期间。基于24小时内的临床数据对患者进行脓毒症的早期诊断具有较高的研究价值和意义 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的脓毒症休克早期预测系统,其特征在于,包括;数据提取模块:用于从以往的电子病历记录或者医疗数据集中提取若干个预测特征变量;数据预处理模块:用于对数据提取模块提取的数据进行包括变量筛选、数据填充、异常值处理在内的预处理;预测模型:使用基于改进的融合算法构建预测模型,改进的融合算法通过设置一个联合学习框架,联合学习具体框架包括了随机森林算法、极度随机数算法、引导聚集算法、极端梯度提升算法、直方图算法及梯度提升算法,用于对抗由于缺失数据带来的影响,数据时间过久问题对模型带来的干扰,更符合临场脓毒症休克的预测,数据预处理之后,输入到构建的预测模型中;训练模块:用于对预测模型进行训练,通过训练不断调优优化找到最佳参数;预测模块:预测模型经过训练之后,输入被测者的数据指标进行脓毒症休克早期预测,同时输出每个特征变量的重要性度量值。2.根据权利要求1所述的一种基于机器学习的脓毒症休克早期预测系统,其特征在于,所述数据提取模块:用于从以往的电子病历记录或者医疗数据集中提取若干个预测特征变量,具体包括:提取的预测特征变量包括生命体征变量;实验室测量指标;人口统计学信息。3.根据权利要求1所述的一种基于机器学习的脓毒症休克早期预测系统,其特征在于,所述数据预处理模块用于对数据提取模块提取的数据进行包括变量筛选、数据填充、异常值处理在内的预处理,具体包括:变量筛选,设置缺失率阈值,去除缺失率大于缺失率阈值的变量,同时还进行低方差过滤变量选择,即计算每一个变量所对应的方差,设定方差阈值,变量方差低于方差阈值则过滤,选择剔除零方差特征,方差为0,表示变量取值没任何变化,该变量对于模型而言不具有区分性;缺失值填充,在训练过程中,如果特征f0出现了缺失值,处理步骤如下;1、首先对于f0非缺失的数据,计算出L
split
并比较大小,选出最大的L
split
,确定其为分裂节点(即选取某个特征的某个阈值);2、然后对于f0缺失的数据,将缺失值分别划分到左子树和右子树,分别计算出左子树和右子树的L
split
,选出更大的L
split
,将该方向作为缺失值的分裂方向(记录下来,预测阶段将会使用)。I是指:当前的节点,IL表示当前i节点左边节,IR表示当前节点i右边。gi表示多有节点值的和(近表示左边节点的和,或者右边节点的和),hi表示i所在节点整个平行节点的和(左右都有),拉姆达和伽马是参数,这里分别是0和0.1;异常值处理,处理方法是使用的6σ原则,其中:σ表示的是数据的标准差,如果病人的某项数据在所属数据集中与平均值的偏差超过6倍标准差,即数据值在[U
‑
6σ
‑
U+6σ]之外,其
中:U表示的数据集的平均值,则分别用最小和最大界限值替代;特征提取,对特征变量进行扩展,医学评分系统判断病人的严重程度基于最值计算,从最大值、最小值和平均值三方面进行特征扩展。4.根据权利要求1所述的一种基于...
【专利技术属性】
技术研发人员:潘勇军,许玉琼,何艾莲,陈浩彬,贺梦哲,
申请(专利权)人:南方科技大学医院深圳市南山区西丽人民医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。