System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种心肺复苏结果预测方法技术_技高网

一种心肺复苏结果预测方法技术

技术编号:40195997 阅读:8 留言:0更新日期:2024-01-26 23:59
本发明专利技术涉及一种心肺复苏结果预测方法,包括获取原始数据、数据预处理、划分训练集和测试集、多种单一模型在训练集下进行训练、数据融合输出结果并与单一模型对比、对输出结果进行量化特征的重要性分析。本方法首先采用SMOTE将数据均衡处理,嵌入法Embed进行特征筛选,其次使用四种树模型进行堆叠融合,五折交叉验证网格搜索算法进行参数优化,最后引入SHAP量化特征重要性。结果表明,该模型具有良好的预测效果,准确率、精确率、召回率和f1分数分别达到了0.91、0.93、0.94和0.93,得到了CPR总时间、肾上腺素总剂量、年龄和既往疾病等重要影响因素。预测结果具有可解释性,作为有效的辅助诊断方法。

【技术实现步骤摘要】

本专利申请属于疾病诊疗预测,更具体地说,是涉及一种心肺复苏结果预测方法,尤其是一种基于se-stacking算法的心肺复苏结果预测方法。


技术介绍

1、随着人工智能技术的蓬勃发展和大数据时代的来临,医疗领域已然成为了人工智能技术发展较快的一个分支。当研究者们致力于从医疗角度来改善诊断和治疗方法时,人工智能的引入大大推动了传统诊断和治疗方法的发展。其中,机器学习是当前最热门的人工智能技术,以大量的医学数据为基础,各种预测算法被广泛地应用于疾病的诊断与预测。

2、心脏骤停是一种在日常生活中时有出现的危险重症,主要是指流血动力学障碍的心脏跳动工作突然中止。心肺复苏(cardiopulmonary resuscitation,以下简称cpr)是一种对急性心脏骤停患者的一种抢救方案,其根本原理是通过人为影响去促进患者尽快恢复自主呼吸循环系统,达到救治的目的。近年来,将机器学习算法与心肺复苏相结合的研究越来越多,nooraldeen等使用随机森林(randomforestclassifier,rf)算法对16个临床预测因素进行特征重要性评分,认为随机森林在心肺复苏数据集上预测效果良好,并且通过实验摒弃了性别这个传统认为非常重要因素。harford等在采用卷积网络模型对1198例样本,23个特征进行了自主循环恢复后生存预测,受试者工作特征曲线下面积(area undercurve,auc)达到0.908,起到辅助诊疗的效果。lu t c等使用机器学习方法分析了急诊科员外心脏骤停患者的数据,与国家预警得分和统计学方法做了性能方面的对比,结果表明rf、梯度提升树(gradient boosting decision tree,gbdt)和极端梯度提升树(extremegradient boosting,xgboost)效果更优。赵小强等使用轻量化梯度提升法(lightgradient boosting machine,lightgbm)建立了心脏病预测模型,认为lightgbm算法相比rf和xgboost算法有更快的速度和更高的精度。贾耀红运用统计学的方法及逻辑回归模型(logistic regression,lr)对急诊心脏骤停患者心肺复苏成功率的影响因素进行了分析。

3、综上,不少国内外学者做了机器学习与cpr的相关研究,但大多使用的单一模型对cpr进行结果预测分析,其在精度、灵敏度等性能指标上仍需一定的提高。单一cpr预测模型在信息利用和分类效果上具有一定的局限性,性能无法满足临床应用要求,缺乏可解释性等问题,因此本专利技术提出了一种改进的堆叠融合(smote-embed-stacking,se-stacking)模型。


技术实现思路

1、本专利技术需要解决的技术问题是提供一种心肺复苏结果预测方法,使用多模型进行进行结果预测分析,使得预测结果具有更高的精度和灵敏度,对医护人员的临床救治工作具有辅助诊疗效果。

2、为了解决上述问题,本专利技术所采用的技术方案是:

3、一种心肺复苏结果预测方法,包括包括如下步骤:

4、s1、获取原始数据,选择原始数据的特征,上述特征包括但不限于性别、年龄、既往疾病、肾上腺素的剂量、cpr开始时间、使用肾上腺素时间、死亡、复苏、cpr总时间;

5、s2、对原始数据进行数据预处理,得到所需的样本集;

6、s3、将样本集按照比例划分为训练集和测试集;

7、s4、使用多种单一模型在训练集下进行训练,并进行超参数优化;

8、s5、使用stacking模型融合方法对多个单一模型进行融合,形成stacking融合模型,对stacking融合模型在测试集下进行测试,测试后输出结果并与单一模型的结果进行对比,以评估stacking融合模型的性能指标;

9、s6、引入模型解释算法(shapley additive explanation,shap)对输出结果进行量化特征的重要性分析。

10、进一步,s2中,对原始数据进行数据预处理是指:

11、s21、缺指标处理:将缺失指标达到半数以上的特征删除,上述特征在实施例中为四个;

12、s22、无异常值存在:对原始数据中的年龄进行众数填补;肾上腺素的剂量选用平均数填补;新增加一个变量,用cpr开始时间和使用肾上腺素时间做差,得到首次使用肾上腺素时间;剔除异常值,确保原始数据中无异常值;

13、s23、类型转换:使用标签编码(label encoder)将死亡与复苏分别转换为0和1;分类型特征使用序数编码(ordinal encoder)转换为数值类型;

14、s24、数据均衡化:使用人工少数类过采样算法(synthetic minority over-sampling technique,smote)方法对原始数据进行数据均衡化;

15、s25、特征筛选:使用embed嵌入法对原始数据的特征进行筛选,保留权重最高的特征。

16、进一步,s3中,将样本集按照7:3的比例划分为训练集和测试集,训练集为70%、测试集为30%。

17、进一步,s4中,单一模型为四种,分别为rf、gbdt、xgboost、lightgbm;超参数优化算法选用网格搜索算法。

18、进一步,s4中,网格搜索算法为交叉验证网格搜索算法,优选5折交叉验证网格搜索算法。

19、进一步,s5中,stacking模型融合方法中的基层分类器为rf、gbdt、xgboost、lightgbm,次分类器为lr模型。

20、进一步,s5中,采用基于混淆矩阵的评估指标,对stacking融合模型的性能指标进行评估。

21、进一步,s6中,shap解释模型认为的特征重要程度排序,前九个特征依次为cpr总时间、肾上腺素总剂量、年龄、既往疾病、心脏骤停至cpr开始总时间、使用肾上腺素时间、是否在监测状态下心脏骤停、是否气道干预、心脏骤停地点。

22、进一步,预测的准确率、精确率、召回率和f1分数均为0.9以上。

23、进一步,预测的准确率、精确率、召回率和f1分数分别为0.91、0.93、0.94和0.93

24、由于采用了上述技术方案,本专利技术取得的有益效果是:

25、本专利技术提出了一种改进的堆叠融合(smote-embed-stacking,se-stacking)模型,首先使用人工少数类过采样算法(synthetic minority over-sampling technique,smote)对数据进行均衡化处理,其次使用嵌入法(embed)对数据进行特征筛选,最后将四种以往学者公认性能较好的机器学习模型进行stacking融合(stacking融合也就是集成学习),得到性能更好的融合模型来对患者心肺复苏结果进行预测分析,引入可解释算法(shapley additive explanation,shap)来量化模型中各特征变本文档来自技高网...

【技术保护点】

1.一种心肺复苏结果预测方法,其特征在于包括如下步骤:

2.根据权利要求1所述的一种心肺复苏结果预测方法,其特征在于:S2中,对原始数据进行数据预处理是指:

3.根据权利要求2所述的一种心肺复苏结果预测方法,其特征在于:S3中,将样本集按照7:3的比例划分为训练集和测试集,训练集为70%、测试集为30%。

4.根据权利要求3所述的一种心肺复苏结果预测方法,其特征在于:S4中,单一模型为四种,分别为RF、GBDT、XGBoost、LightGBM;超参数优化算法选用网格搜索算法。

5.根据权利要求4所述的一种心肺复苏结果预测方法,其特征在于:S4中,网格搜索算法为交叉验证网格搜索算法。

6.根据权利要求5所述的一种心肺复苏结果预测方法,其特征在于:S5中,Stacking模型融合方法中的基层分类器为RF、GBDT、XGBoost、LightGBM,次分类器为LR模型。

7.根据权利要求6所述的一种心肺复苏结果预测方法,其特征在于:S5中,采用基于混淆矩阵的评估指标,对Stacking融合模型的性能指标进行评估。

8.根据权利要求7所述的一种心肺复苏结果预测方法,其特征在于:S6中,SHAP解释模型认为的特征重要程度排序,前九个特征依次为CPR总时间、肾上腺素总剂量、年龄、既往疾病、心脏骤停至CPR开始总时间、使用肾上腺素时间、是否在监测状态下心脏骤停、是否气道干预、心脏骤停地点。

9.根据权利要求1-8任一项所述的一种心肺复苏结果预测方法,其特征在于:预测的准确率、精确率、召回率和f1分数均为0.9以上。

10.根据权利要求9所述的一种心肺复苏结果预测方法,其特征在于:S6中,预测的准确率、精确率、召回率和f1分数分别为0.91、0.93、0.94和0.93。

...

【技术特征摘要】

1.一种心肺复苏结果预测方法,其特征在于包括如下步骤:

2.根据权利要求1所述的一种心肺复苏结果预测方法,其特征在于:s2中,对原始数据进行数据预处理是指:

3.根据权利要求2所述的一种心肺复苏结果预测方法,其特征在于:s3中,将样本集按照7:3的比例划分为训练集和测试集,训练集为70%、测试集为30%。

4.根据权利要求3所述的一种心肺复苏结果预测方法,其特征在于:s4中,单一模型为四种,分别为rf、gbdt、xgboost、lightgbm;超参数优化算法选用网格搜索算法。

5.根据权利要求4所述的一种心肺复苏结果预测方法,其特征在于:s4中,网格搜索算法为交叉验证网格搜索算法。

6.根据权利要求5所述的一种心肺复苏结果预测方法,其特征在于:s5中,stacking模型融合方法中的基层分类器为rf、gbdt、xgboost...

【专利技术属性】
技术研发人员:张瑛琪冯航测宋雨佳
申请(专利权)人:河北医科大学第一医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1