一种基于机器学习的脓毒症休克早期预测系统技术方案

技术编号:39040308 阅读:7 留言:0更新日期:2023-10-10 11:53
本发明专利技术请求保护一种基于机器学习的脓毒症休克早期预测系统,属于医疗数据挖掘领域,其包括:数据提取模块:用于从以往的电子病历记录或者医疗数据集中提取若干个预测特征变量;数据预处理模块:用于对数据提取模块提取的数据进行包括变量筛选、数据填充、异常值处理在内的预处理;预测模型:使用基于改进的融合算法构建预测模型,数据预处理之后,输入到构建的预测模型中;训练模块:用于对预测模型进行训练,通过训练不断调优优化找到最佳参数;预测模块:预测模型经过训练之后,输入被测者的数据指标进行脓毒症休克早期预测,同时输出每个特征变量的重要性度量值。本发明专利技术提高了预测精度和准度,提供的数据供辅助医生进行判断。断。断。

【技术实现步骤摘要】
一种基于机器学习的脓毒症休克早期预测系统


[0001]本专利技术属于医疗数据挖掘领域,具体涉及一种基于机器学习的脓毒症早期预测方法。

技术介绍

[0002]脓毒症是一种对生命安全有着严重威胁的疾病,脓毒症是因感染导致的全身炎症反应综合症,是ICU患者常见高危并发症和致死的主要原因之一。全球中每年估计有3000万人患有脓毒症,因脓毒致死人数超过600万人,脓毒症的治疗费用非常高,且面临的风险也非常大。因发病率、致死率高以及昂贵的治疗费用,脓毒症已经成为全球高度关注的公共医疗问题。脓毒症的临床诊断定义从1.0发展到3.0,也在不断变化更新。目前临床上最新定义脓毒症

3是欧洲重症学会于2016年提出的。临床上对脓毒症的发病规律研究已取得一定进展,但脓毒症的发病机制复杂,涉及变量因素较多,诊断准确率还有待提高。有研究表明,脓毒症的早期发现和及时的抗生素治疗对于改善脓毒症患者的结局至关重要,每延迟一小时治疗都会使死亡率增加4%

8%。尽早地发现可能发展成脓毒症的患者并对其给与及时治疗,同时探究与脓毒症发生有着密切关系的关键影响因素对于改善病人预后有着具有重要的研究价值和意义。目前的研究大都从医学角度出发,大部分使用的是基于统计分析以及简单的逻辑回归模型,很少有使用机器学习算法针对患者进行脓毒症的早期预测。现有研究表明脓毒症是远期死亡的主要原因。患者入ICU后的24小时内是非常关键的时刻,大多数病情转变发生在此期间。基于24小时内的临床数据对患者进行脓毒症的早期诊断具有较高的研究价值和意义。此外由于医疗信息数据的隐私性,很多研究的文献数据都是基于特定医院,难以共享,所以导致研究的方法和结果不具备可重复性和可对比性。随着基于数据驱动的智能医疗的到来,越来越多的医务人员也期望利用机器学习的方法开展对医疗数据的挖掘,进而帮助其提高对疾病的深层认知和诊断效率。使用机器学习方法研究预测脓毒症需要克服变量筛选、数据填充、异常值处理,数据少的难点;脓毒症是机体对一种毒素的过度活跃和极端反应感染,这是死亡的主要原因之一,随着医学的发展有很大的改进。脓毒症和败血症仍然是死亡的重要原因,预测急诊科脓毒症发病的诊断ments(EDs)可以让医生做出更及时的治疗措施和提高患者生存率。脓毒症相关器官衰竭快速评估(qSOFA)评分和修正预警评分(MEWS),可用于脓毒症的筛查。脓毒症相关的快速器官衰竭As

评价(qSOFA)评分是一种推荐的床边工具被最近的第三次国际共识所使用,特别工作组在室外识别高危患者重症监护病房(ICU)。然而,也有报道了qSOFA对de

的敏感性有限,在预防败血症方面,qSOFA的使用受到限制。
[0003]脓毒症是由感染引起的全身炎症反应综合征,即感染+SIRS≥2。脓毒性休克(septicshock):在脓毒症基础上,感染持续加重,经过充分容量复苏后仍发生低血压:低血压指收缩压<90mmHg,或下降40mmHg无其他低血压原因可循。
[0004]脓毒症休克是更严重的脓毒症,脓毒症休克的指标变化会更难预测,往往伴随快速的指标变换,所以通过前期大量的

平稳数据

预测马上到来的异常变化数据是更难的。
[0005]机器学习可以充分利用海量数据通过分析分布,在不同的领域发挥巨大的作用,数据本身的分布特征。深入学习了更多的可学习参数,从而有更大的能力,拟合高度非线性模型。在医学领域,机器学习和深度学习也可以充分利用accu对真实数据进行Mulated,进行模型训练,从而提高诊断的准确性和效率。该研究的目的是评估不同种类的机器学习和基于深度学习的筛查脓毒症患者的方法。我们提出一个高效融合方法基于上述模型进行预融合,使用先前的生命体征判断未来是否存在感染性休克。
[0006]为了解决现有技术中ICU患者脓毒症临床诊断困难、准确率不高的问题,本专利技术提出了一种基于机器学习的脓毒症休克的早期预测系统。

技术实现思路

[0007]本专利技术旨在解决以上现有技术的问题。提出了一种基于机器学习的脓毒症休克早期预测系统。本专利技术的技术方案如下:
[0008]一种基于机器学习的脓毒症休克早期预测系统,其包括;
[0009]数据提取模块:用于从以往的电子病历记录或者医疗数据集中提取若干个预测特征变量;
[0010]数据预处理模块:用于对数据提取模块提取的数据进行包括变量筛选、数据填充、异常值处理在内的预处理;
[0011]预测模型:使用基于改进的融合算法构建预测模型,改进的融合算法通过设置一个联合学习框架,联合学习具体框架包括了随机森林算法、极度随机数算法、引导聚集算法、极端梯度提升算法、直方图算法及梯度提升算法,用于对抗由于缺失数据带来的影响,数据时间过久问题对模型带来的干扰,更符合临场脓毒症休克的预测,数据预处理之后,输入到构建的预测模型中;
[0012]训练模块:用于对预测模型进行训练,通过训练不断调优优化找到最佳参数;
[0013]预测模块:预测模型经过训练之后,输入被测者的数据指标进行脓毒症休克早期预测,同时输出每个特征变量的重要性度量值。
[0014]进一步的,所述数据预处理模块用于对数据提取模块提取的数据进行包括变量筛选、数据填充、异常值处理在内的预处理,具体包括:
[0015]变量筛选,设置缺失率阈值,去除缺失率大于缺失率阈值的变量,同时还进行低方差过滤变量选择,即计算每一个变量所对应的方差,设定方差阈值,变量方差低于方差阈值则过滤,选择剔除零方差特征,方差为0,表示变量取值没任何变化,该变量对于模型而言不具有区分性;
[0016]缺失值填充,
[0017]在训练过程中,如果特征f0出现了缺失值,处理步骤如下:
[0018]1、首先对于f0非缺失的数据,计算出L
xplit
并比较大小,选出最大的L
xplit
,确定其为分裂节点(即选取某个特征的某个阈值);
[0019]2、然后对于f0缺失的数据,将缺失值分别划分到左子树和右子树,分别计算出左子树和右子树的L
xplit
,选出更大的L
xplit
,将该方向作为缺失值的分裂方向(记录下来,预测阶段将会使用)。
[0020][0021]I是指:当前的节点,IL表示当前i节点左边节,IR表示当前节点i右边。gi表示多有节点值的和(近表示左边节点的和,或者右边节点的和),hi表示i所在节点整个平行节点的和(左右都有),拉姆达和伽马是参数,这里分别是0和0.1;
[0022]异常值处理,处理方法是使用的6σ原则,其中:σ表示的是数据的标准差,如果病人的某项数据在所属数据集中与平均值的偏差超过6倍标准差,即数据值在[U



U+6σ]之外,其中:U表示的数据集的平均值,则分别用最小和最大界限值替代;
[0023]特征提取,对特征变量进行扩展,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的脓毒症休克早期预测系统,其特征在于,包括;数据提取模块:用于从以往的电子病历记录或者医疗数据集中提取若干个预测特征变量;数据预处理模块:用于对数据提取模块提取的数据进行包括变量筛选、数据填充、异常值处理在内的预处理;预测模型:使用基于改进的融合算法构建预测模型,改进的融合算法通过设置一个联合学习框架,联合学习具体框架包括了随机森林算法、极度随机数算法、引导聚集算法、极端梯度提升算法、直方图算法及梯度提升算法,用于对抗由于缺失数据带来的影响,数据时间过久问题对模型带来的干扰,更符合临场脓毒症休克的预测,数据预处理之后,输入到构建的预测模型中;训练模块:用于对预测模型进行训练,通过训练不断调优优化找到最佳参数;预测模块:预测模型经过训练之后,输入被测者的数据指标进行脓毒症休克早期预测,同时输出每个特征变量的重要性度量值。2.根据权利要求1所述的一种基于机器学习的脓毒症休克早期预测系统,其特征在于,所述数据提取模块:用于从以往的电子病历记录或者医疗数据集中提取若干个预测特征变量,具体包括:提取的预测特征变量包括生命体征变量;实验室测量指标;人口统计学信息。3.根据权利要求1所述的一种基于机器学习的脓毒症休克早期预测系统,其特征在于,所述数据预处理模块用于对数据提取模块提取的数据进行包括变量筛选、数据填充、异常值处理在内的预处理,具体包括:变量筛选,设置缺失率阈值,去除缺失率大于缺失率阈值的变量,同时还进行低方差过滤变量选择,即计算每一个变量所对应的方差,设定方差阈值,变量方差低于方差阈值则过滤,选择剔除零方差特征,方差为0,表示变量取值没任何变化,该变量对于模型而言不具有区分性;缺失值填充,在训练过程中,如果特征f0出现了缺失值,处理步骤如下;1、首先对于f0非缺失的数据,计算出L
split
并比较大小,选出最大的L
split
,确定其为分裂节点(即选取某个特征的某个阈值);2、然后对于f0缺失的数据,将缺失值分别划分到左子树和右子树,分别计算出左子树和右子树的L
split
,选出更大的L
split
,将该方向作为缺失值的分裂方向(记录下来,预测阶段将会使用)。I是指:当前的节点,IL表示当前i节点左边节,IR表示当前节点i右边。gi表示多有节点值的和(近表示左边节点的和,或者右边节点的和),hi表示i所在节点整个平行节点的和(左右都有),拉姆达和伽马是参数,这里分别是0和0.1;异常值处理,处理方法是使用的6σ原则,其中:σ表示的是数据的标准差,如果病人的某项数据在所属数据集中与平均值的偏差超过6倍标准差,即数据值在[U



U+6σ]之外,其
中:U表示的数据集的平均值,则分别用最小和最大界限值替代;特征提取,对特征变量进行扩展,医学评分系统判断病人的严重程度基于最值计算,从最大值、最小值和平均值三方面进行特征扩展。4.根据权利要求1所述的一种基于...

【专利技术属性】
技术研发人员:潘勇军许玉琼何艾莲陈浩彬贺梦哲
申请(专利权)人:南方科技大学医院深圳市南山区西丽人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1