【技术实现步骤摘要】
一种基于机器学习的ICU患者脓毒症风险预测方法及系统
[0001]一种基于机器学习的
ICU
患者脓毒症风险预测方法及系统,用于脓毒症重要特征提取及风险发生预测,属于医学
。
技术介绍
[0002]脓毒症被定义为宿主对感染的有害反应引起的致死性器官功能障碍,是重症监护病房
(ICU)
患者高发病率和死亡率的主要疾病之一
。
全球
ICU
成人脓毒症的发病率约为每
10
万人年
58
例,其中
42
%在出院前死亡,给其家庭和社会造成严重负担
。
脓毒症的特点是起病快,无特异的临床表现,进展快,累及多器官功能障碍,不易逆转
。
早期发现败血症有助于早期治疗,提高危重病人的生存率
。
[0003]迄今为止,一些脓毒症的早期筛查工具被广泛用于
ICU
住院患者,如系统性炎症反应综合征
(SIRS)
标准
、
顺序器官衰竭评估
(SOFA)
标准或快速
SOFA(qSOFA)、
国家预警评分
(NEWS)
或改良的早期预警评分
(MEWS)
和
Logistic
器官功能障碍
(LODS)
评分
。
这些工具的诊断准确性差异很大,大多数具有较差的预测价值
。
拯救脓毒症运动 />2021
年指南建议,与
SIRS、NEWS
或
MEWS
相比,由于
qSOFA
评分的筛查效果不佳,不建议作为脓毒症或感染性休克的单一筛查工具
。
其中
SIRS
标准对诊断脓毒症的特异性较低,许多住院患者符合
SIRS
标准,包括那些没有发生感染的患者
。qSOFA
评分仅包含三个变量,用于快速识别和评估疑似脓毒症患者
。
然而,
qSOFA
评分仅在
ICU
外患者群体中进行验证,不适用于已入住
ICU
的患者
。
与
SIRS
诊断标准相比,
SOFA
评分以降低敏感性为代价缩小了脓毒症人群,由此产生的假阴性可能会延迟疾病的诊断
。
[0004]此外,据报道,一些新的机器学习模型在脓毒症早期预测方面比传统的筛查工具有着更好的敏感性和特异性
。
目前哪种模型对
ICU
患者的早期脓毒症预测效果最好尚无定论
。
此外,目前大多数机器学习的创新都集中在算法和数据集开发上,因此较少关注确保机器学习模型易于临床医生使用
。ML
模型的可重复性
、
可解释性和可比性是临床应用前必须面对的挑战
。
[0005]综上所述,现有技术中存在如下技术问题:
[0006]1.
现有的方法无法有效筛选出临床应用中脓毒症发生的全部重要特征,难以适用于在其他地区获取的
icu
患者数据集,需要后续继续训练及验证,从而造成适用难的问题;
[0007]2.
无法准确预测
ICU
患者脓毒症发生的风险
。
技术实现思路
[0008]本专利技术的目的在于提供一种基于机器学习的
ICU
患者脓毒症风险预测方法及系统,解决现有的方法无法准确的筛选出临床应用中脓毒症发生的重要特征
。
[0009]为了实现上述目的,本专利技术采用的技术方案为:
[0010]一种基于机器学习的
ICU
患者脓毒症风险预测方法,包括如下步骤:
[0011]步骤1:从数据库中获取全身感染或患败血症患者所对应的患者信息,并筛选符合
分析条件的患者所对应的患者信息,并进行预处理;
[0012]步骤2:基于预处理后得到的患者信息构成的数据集对朴素贝叶斯
、
支持向量机和提升树进行训练,训练后分别得到对应的重要特征,并将各重要特征输入
logistic
回归模型,得到预测因子;
[0013]步骤3:基于预测因子构建列线图模型来预测
ICU
患者脓毒症发生的风险
。
[0014]进一步,所述步骤1中符合分析条件的患者所对应的患者信息是指排除未入院的患者
、
曾入住
icu
的患者
、
年龄小于
16
岁的患者后,所得到的患者所对应的患者信息,其中,患者信息包括基本信息
、
生命体征信息
、
其他信息,基本信息包括年龄
、
性别和种族,生命体征信息包括心率
、
平均血压
、
收缩压
、
舒张压
、
呼吸频率
、
体温
、
外周血氧饱和度
、24h
尿量,其他信息包括疾病评估和入院后
24
小时内首次测量的实验室检查结果,疾病评估包括急性生理学评分
III、
序贯器官衰竭评估和
Logistic
器官功能障碍评估,实验室检查结果包括红细胞压积
、
血红蛋白
、
血小板
、
白细胞
、
中性粒细胞绝对值计数
、
中性粒细胞比例
、
淋巴细胞
、
白蛋白
、
阴离子间隙
、
碳酸氢盐
、
血尿素氮
、
肌酐
、
葡萄糖
、
天冬氨酸氨基转移酶
、
丙氨酸氨基转移酶
、
碱性磷酸酶
、
总胆红素
、
国际标准化比值
、
凝血酶原时间和部分凝血活酶时间
。
[0015]进一步,所述步骤1采用移除缺失值或采用
k
近邻插值的方式对符合条件的患者信息进行预处理
。
[0016]进一步,所述步骤2将预处理后得到的数据集按照
7:3
的比例分为训练集和验证集并进行比较,比较后,若显著性概率
P>0.05
,则表示训练集和验证集分配随机性良好,能用于训练和验证,否则重新分配再进行比较,具体为:
[0017]采用非正态分布和正态分布的连续变量分别用中位数和平均值对训练集和验证集之间进行各变量的比较,其中,非正态分布的连续变量采用
Mann
‑
Whitney U
检验进行比较,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种基于机器学习的
ICU
患者脓毒症风险预测方法,其特征在于,包括如下步骤:步骤1:从数据库中获取全身感染或患败血症患者所对应的患者信息,并筛选符合分析条件的患者所对应的患者信息,并进行预处理;步骤2:基于预处理后得到的患者信息构成的数据集对朴素贝叶斯
、
支持向量机和提升树进行训练,训练后分别得到对应的重要特征,并将各重要特征输入
logistic
回归模型,得到预测因子;步骤3:基于预测因子构建列线图模型来预测
ICU
患者脓毒症发生的风险
。2.
根据权利要求1所述的一种基于机器学习的
ICU
患者脓毒症风险预测方法,其特征在于,所述步骤1中符合分析条件的患者所对应的患者信息是指排除未入院的患者
、
曾入住
icu
的患者
、
年龄小于
16
岁的患者后,所得到的患者所对应的患者信息,其中,患者信息包括基本信息
、
生命体征信息
、
其他信息,基本信息包括年龄
、
性别和种族,生命体征信息包括心率
、
平均血压
、
收缩压
、
舒张压
、
呼吸频率
、
体温
、
外周血氧饱和度
、24h
尿量,其他信息包括疾病评估和入院后
24
小时内首次测量的实验室检查结果,疾病评估包括急性生理学评分
III、
序贯器官衰竭评估和
Logistic
器官功能障碍评估,实验室检查结果包括红细胞压积
、
血红蛋白
、
血小板
、
白细胞
、
中性粒细胞绝对值计数
、
中性粒细胞比例
、
淋巴细胞
、
白蛋白
、
阴离子间隙
、
碳酸氢盐
、
血尿素氮
、
肌酐
、
葡萄糖
、
天冬氨酸氨基转移酶
、
丙氨酸氨基转移酶
、
碱性磷酸酶
、
总胆红素
、
国际标准化比值
、
凝血酶原时间和部分凝血活酶时间
。3.
根据权利要求2所述的一种基于机器学习的
ICU
患者脓毒症风险预测方法,其特征在于:所述步骤1采用移除缺失值或采用
k
近邻插值的方式对符合条件的患者信息进行预处理
。4.
根据权利要求3所述的一种基于机器学习的
ICU
患者脓毒症风险预测方法,其特征在于:所述步骤2将预处理后得到的数据集按照
7:3
的比例分为训练集和验证集并进行比较,比较后,若显著性概率
P>0.05
,则表示训练集和验证集分配随机性良好,能用于训练和验证,否则重新分配再进行比较,具体为:采用非正态分布和正态分布的连续变量分别用中位数和平均值对训练集和验证集之间进行各变量的比较,其中,非正态分布的连续变量采用
Mann
‑
Whitney U
检验进行比较,正态分布的连续变量采用学生
t
‑
检验;采用
Pearson
卡方检验比较训练集和验证集中的分类变量,其中,分类变量包括性别
、
种族和是否发生脓毒症
。5.
根据权利要求4所述的一种基于机器学习的
ICU
患者脓毒症风险预测方法,其特征在于:所述步骤2中,基于训练集训练朴素贝叶斯
、
支持向量机和提升树后,分别得到对应的重要矩阵,选择重要矩阵中排名前6位的变量作为重要特征;训练后,朴素贝叶斯得到的重要特征为白蛋白
、
白细胞
、
总胆红素
、
体温
、
天冬氨酸氨基转移酶和淋巴细胞;训练后,支持向量机得到的重要特征为白蛋白
、
白细胞
、
体温
、
淋巴细胞
、
总胆红素和收缩压;训练后,提升树得到的重要特征为白蛋白
、
淋巴细胞
、
凝血酶原时间
、
白细胞
、
总胆红素和体温;并将各重要特征输入
logistic
回归模型,得到的预测因子为白蛋白
、
白细胞
、
淋巴细
胞
、
温度
、
总胆红素
、
凝血酶原时间和收缩压
。6.
根据权利要求5所述的一种基于机器学习的
ICU
患者脓毒症风险预测方法,其特征在于:所述步骤3中,将预测因子输入列线图模型,得到预测概率阈值;基于预测概率阈值建立列线图模型,并在试验组和验证集中通过采用
ROC
曲线
、
偏置校准曲线和
DCA
进行检验来检验列线图的性能,具体通过;若检验通过,基于列线图模型代入
ICU
患者相应的指标进行
...
【专利技术属性】
技术研发人员:唐娟,刘小株,吴莹莹,彭圣贤,邱桂刚,刘悦,
申请(专利权)人:自贡市第一人民医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。