一种心肺复苏结果预测方法技术

技术编号：40195997 阅读：8 留言：0更新日期：2024-01-26 23:59

本发明专利技术涉及一种心肺复苏结果预测方法，包括获取原始数据、数据预处理、划分训练集和测试集、多种单一模型在训练集下进行训练、数据融合输出结果并与单一模型对比、对输出结果进行量化特征的重要性分析。本方法首先采用SMOTE将数据均衡处理，嵌入法Embed进行特征筛选，其次使用四种树模型进行堆叠融合，五折交叉验证网格搜索算法进行参数优化，最后引入SHAP量化特征重要性。结果表明，该模型具有良好的预测效果，准确率、精确率、召回率和f1分数分别达到了0.91、0.93、0.94和0.93，得到了CPR总时间、肾上腺素总剂量、年龄和既往疾病等重要影响因素。预测结果具有可解释性，作为有效的辅助诊断方法。

全部详细技术资料下载

【技术实现步骤摘要】

本专利申请属于疾病诊疗预测，更具体地说，是涉及一种心肺复苏结果预测方法，尤其是一种基于se-stacking算法的心肺复苏结果预测方法。

技术介绍

1、随着人工智能技术的蓬勃发展和大数据时代的来临，医疗领域已然成为了人工智能技术发展较快的一个分支。当研究者们致力于从医疗角度来改善诊断和治疗方法时，人工智能的引入大大推动了传统诊断和治疗方法的发展。其中，机器学习是当前最热门的人工智能技术，以大量的医学数据为基础，各种预测算法被广泛地应用于疾病的诊断与预测。

2、心脏骤停是一种在日常生活中时有出现的危险重症，主要是指流血动力学障碍的心脏跳动工作突然中止。心肺复苏(cardiopulmonary resuscitation，以下简称cpr)是一种对急性心脏骤停患者的一种抢救方案，其根本原理是通过人为影响去促进患者尽快恢复自主呼吸循环系统，达到救治的目的。近年来，将机器学习算法与心肺复苏相结合的研究越来越多，nooraldeen等使用随机森林(randomforestclassifier，rf)算法对16个临床预测因素进行特征重要性评分，认为随机森林在心肺复苏数据集上预测效果良好，并且通过实验摒弃了性别这个传统认为非常重要因素。harford等在采用卷积网络模型对1198例样本，23个特征进行了自主循环恢复后生存预测，受试者工作特征曲线下面积(area undercurve，auc)达到0.908，起到辅助诊疗的效果。lu t c等使用机器学习方法分析了急诊科员外心脏骤停患者的数据，与国家预警得分和统计学方法做了性能方面的对

3、综上，不少国内外学者做了机器学习与cpr的相关研究，但大多使用的单一模型对cpr进行结果预测分析，其在精度、灵敏度等性能指标上仍需一定的提高。单一cpr预测模型在信息利用和分类效果上具有一定的局限性，性能无法满足临床应用要求，缺乏可解释性等问题，因此本专利技术提出了一种改进的堆叠融合(smote-embed-stacking，se-stacking)模型。

技术实现思路

1、本专利技术需要解决的技术问题是提供一种心肺复苏结果预测方法，使用多模型进行进行结果预测分析，使得预测结果具有更高的精度和灵敏度，对医护人员的临床救治工作具有辅助诊疗效果。

2、为了解决上述问题，本专利技术所采用的技术方案是：

3、一种心肺复苏结果预测方法，包括包括如下步骤：

4、s1、获取原始数据，选择原始数据的特征，上述特征包括但不限于性别、年龄、既往疾病、肾上腺素的剂量、cpr开始时间、使用肾上腺素时间、死亡、复苏、cpr总时间；

5、s2、对原始数据进行数据预处理，得到所需的样本集；

6、s3、将样本集按照比例划分为训练集和测试集；

7、s4、使用多种单一模型在训练集下进行训练，并进行超参数优化；

8、s5、使用stacking模型融合方法对多个单一模型进行融合，形成stacking融合模型，对stacking融合模型在测试集下进行测试，测试后输出结果并与单一模型的结果进行对比，以评估stacking融合模型的性能指标；

9、s6、引入模型解释算法(shapley additive explanation，shap)对输出结果进行量化特征的重要性分析。

10、进一步，s2中，对原始数据进行数据预处理是指：

11、s21、缺指标处理：将缺失指标达到半数以上的特征删除，上述特征在实施例中为四个；

12、s22、无异常值存在：对原始数据中的年龄进行众数填补；肾上腺素的剂量选用平均数填补；新增加一个变量，用cpr开始时间和使用肾上腺素时间做差，得到首次使用肾上腺素时间；剔除异常值，确保原始数据中无异常值；

13、s23、类型转换：使用标签编码(label encoder)将死亡与复苏分别转换为0和1；分类型特征使用序数编码(ordinal encoder)转换为数值类型；

14、s24、数据均衡化：使用人工少数类过采样算法(synthetic minority over-sampling technique，smote)方法对原始数据进行数据均衡化；

15、s25、特征筛选：使用embed嵌入法对原始数据的特征进行筛选，保留权重最高的特征。

16、进一步，s3中，将样本集按照7：3的比例划分为训练集和测试集，训练集为70％、测试集为30％。

17、进一步，s4中，单一模型为四种，分别为rf、gbdt、xgboost、lightgbm；超参数优化算法选用网格搜索算法。

18、进一步，s4中，网格搜索算法为交叉验证网格搜索算法，优选5折交叉验证网格搜索算法。

19、进一步，s5中，stacking模型融合方法中的基层分类器为rf、gbdt、xgboost、lightgbm，次分类器为lr模型。

20、进一步，s5中，采用基于混淆矩阵的评估指标，对stacking融合模型的性能指标进行评估。

21、进一步，s6中，shap解释模型认为的特征重要程度排序，前九个特征依次为cpr总时间、肾上腺素总剂量、年龄、既往疾病、心脏骤停至cpr开始总时间、使用肾上腺素时间、是否在监测状态下心脏骤停、是否气道干预、心脏骤停地点。

22、进一步，预测的准确率、精确率、召回率和f1分数均为0.9以上。

23、进一步，预测的准确率、精确率、召回率和f1分数分别为0.91、0.93、0.94和0.93

24、由于采用了上述技术方案，本专利技术取得的有益效果是：

25、本专利技术提出了一种改进的堆叠融合(smote-embed-stacking，se-stacking)模型，首先使用人工少数类过采样算法(synthetic minority over-sampling technique，smote)对数据进行均衡化处理，其次使用嵌入法(embed)对数据进行特征筛选，最后将四种以往学者公认性能较好的机器学习模型进行stacking融合(stacking融合也就是集成学习)，得到性能更好的融合模型来对患者心肺复苏结果进行预测分析，引入可解释算法(shapley additive explanation，shap)来量化模型中各特征变本文档来自技高网...

【技术保护点】

1.一种心肺复苏结果预测方法，其特征在于包括如下步骤：

2.根据权利要求1所述的一种心肺复苏结果预测方法，其特征在于：S2中，对原始数据进行数据预处理是指：

3.根据权利要求2所述的一种心肺复苏结果预测方法，其特征在于：S3中，将样本集按照7：3的比例划分为训练集和测试集，训练集为70％、测试集为30％。

4.根据权利要求3所述的一种心肺复苏结果预测方法，其特征在于：S4中，单一模型为四种，分别为RF、GBDT、XGBoost、LightGBM；超参数优化算法选用网格搜索算法。

5.根据权利要求4所述的一种心肺复苏结果预测方法，其特征在于：S4中，网格搜索算法为交叉验证网格搜索算法。

6.根据权利要求5所述的一种心肺复苏结果预测方法，其特征在于：S5中，Stacking模型融合方法中的基层分类器为RF、GBDT、XGBoost、LightGBM，次分类器为LR模型。

7.根据权利要求6所述的一种心肺复苏结果预测方法，其特征在于：S5中，采用基于混淆矩阵的评估指标，对Stacking融合模型的性能指标进行评估。

8.根据权利要求7所述的一种心肺复苏结果预测方法，其特征在于：S6中，SHAP解释模型认为的特征重要程度排序，前九个特征依次为CPR总时间、肾上腺素总剂量、年龄、既往疾病、心脏骤停至CPR开始总时间、使用肾上腺素时间、是否在监测状态下心脏骤停、是否气道干预、心脏骤停地点。

9.根据权利要求1-8任一项所述的一种心肺复苏结果预测方法，其特征在于：预测的准确率、精确率、召回率和f1分数均为0.9以上。

10.根据权利要求9所述的一种心肺复苏结果预测方法，其特征在于：S6中，预测的准确率、精确率、召回率和f1分数分别为0.91、0.93、0.94和0.93。

...

【技术特征摘要】

1.一种心肺复苏结果预测方法，其特征在于包括如下步骤：

2.根据权利要求1所述的一种心肺复苏结果预测方法，其特征在于：s2中，对原始数据进行数据预处理是指：

3.根据权利要求2所述的一种心肺复苏结果预测方法，其特征在于：s3中，将样本集按照7：3的比例划分为训练集和测试集，训练集为70％、测试集为30％。

4.根据权利要求3所述的一种心肺复苏结果预测方法，其特征在于：s4中，单一模型为四种，分别为rf、gbdt、xgboost、lightgbm；超参数优化算法选用网格搜索算法。

5.根据权利要求4所述的一种心肺复苏结果预测方法，其特征在于：s4中，网格搜索算法为交叉验证网格搜索算法。

6.根据权利要求5所述的一种心肺复苏结果预测方法，其特征在于：s5中，stacking模型融合方法中的基层分类器为rf、gbdt、xgboost...

【专利技术属性】
技术研发人员：张瑛琪，冯航测，宋雨佳，
申请(专利权)人：河北医科大学第一医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人