System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利申请属于疾病诊疗预测,更具体地说,是涉及一种心肺复苏结果预测方法,尤其是一种基于se-stacking算法的心肺复苏结果预测方法。
技术介绍
1、随着人工智能技术的蓬勃发展和大数据时代的来临,医疗领域已然成为了人工智能技术发展较快的一个分支。当研究者们致力于从医疗角度来改善诊断和治疗方法时,人工智能的引入大大推动了传统诊断和治疗方法的发展。其中,机器学习是当前最热门的人工智能技术,以大量的医学数据为基础,各种预测算法被广泛地应用于疾病的诊断与预测。
2、心脏骤停是一种在日常生活中时有出现的危险重症,主要是指流血动力学障碍的心脏跳动工作突然中止。心肺复苏(cardiopulmonary resuscitation,以下简称cpr)是一种对急性心脏骤停患者的一种抢救方案,其根本原理是通过人为影响去促进患者尽快恢复自主呼吸循环系统,达到救治的目的。近年来,将机器学习算法与心肺复苏相结合的研究越来越多,nooraldeen等使用随机森林(randomforestclassifier,rf)算法对16个临床预测因素进行特征重要性评分,认为随机森林在心肺复苏数据集上预测效果良好,并且通过实验摒弃了性别这个传统认为非常重要因素。harford等在采用卷积网络模型对1198例样本,23个特征进行了自主循环恢复后生存预测,受试者工作特征曲线下面积(area undercurve,auc)达到0.908,起到辅助诊疗的效果。lu t c等使用机器学习方法分析了急诊科员外心脏骤停患者的数据,与国家预警得分和统计学方法做了性能方面的对
3、综上,不少国内外学者做了机器学习与cpr的相关研究,但大多使用的单一模型对cpr进行结果预测分析,其在精度、灵敏度等性能指标上仍需一定的提高。单一cpr预测模型在信息利用和分类效果上具有一定的局限性,性能无法满足临床应用要求,缺乏可解释性等问题,因此本专利技术提出了一种改进的堆叠融合(smote-embed-stacking,se-stacking)模型。
技术实现思路
1、本专利技术需要解决的技术问题是提供一种心肺复苏结果预测方法,使用多模型进行进行结果预测分析,使得预测结果具有更高的精度和灵敏度,对医护人员的临床救治工作具有辅助诊疗效果。
2、为了解决上述问题,本专利技术所采用的技术方案是:
3、一种心肺复苏结果预测方法,包括包括如下步骤:
4、s1、获取原始数据,选择原始数据的特征,上述特征包括但不限于性别、年龄、既往疾病、肾上腺素的剂量、cpr开始时间、使用肾上腺素时间、死亡、复苏、cpr总时间;
5、s2、对原始数据进行数据预处理,得到所需的样本集;
6、s3、将样本集按照比例划分为训练集和测试集;
7、s4、使用多种单一模型在训练集下进行训练,并进行超参数优化;
8、s5、使用stacking模型融合方法对多个单一模型进行融合,形成stacking融合模型,对stacking融合模型在测试集下进行测试,测试后输出结果并与单一模型的结果进行对比,以评估stacking融合模型的性能指标;
9、s6、引入模型解释算法(shapley additive explanation,shap)对输出结果进行量化特征的重要性分析。
10、进一步,s2中,对原始数据进行数据预处理是指:
11、s21、缺指标处理:将缺失指标达到半数以上的特征删除,上述特征在实施例中为四个;
12、s22、无异常值存在:对原始数据中的年龄进行众数填补;肾上腺素的剂量选用平均数填补;新增加一个变量,用cpr开始时间和使用肾上腺素时间做差,得到首次使用肾上腺素时间;剔除异常值,确保原始数据中无异常值;
13、s23、类型转换:使用标签编码(label encoder)将死亡与复苏分别转换为0和1;分类型特征使用序数编码(ordinal encoder)转换为数值类型;
14、s24、数据均衡化:使用人工少数类过采样算法(synthetic minority over-sampling technique,smote)方法对原始数据进行数据均衡化;
15、s25、特征筛选:使用embed嵌入法对原始数据的特征进行筛选,保留权重最高的特征。
16、进一步,s3中,将样本集按照7:3的比例划分为训练集和测试集,训练集为70%、测试集为30%。
17、进一步,s4中,单一模型为四种,分别为rf、gbdt、xgboost、lightgbm;超参数优化算法选用网格搜索算法。
18、进一步,s4中,网格搜索算法为交叉验证网格搜索算法,优选5折交叉验证网格搜索算法。
19、进一步,s5中,stacking模型融合方法中的基层分类器为rf、gbdt、xgboost、lightgbm,次分类器为lr模型。
20、进一步,s5中,采用基于混淆矩阵的评估指标,对stacking融合模型的性能指标进行评估。
21、进一步,s6中,shap解释模型认为的特征重要程度排序,前九个特征依次为cpr总时间、肾上腺素总剂量、年龄、既往疾病、心脏骤停至cpr开始总时间、使用肾上腺素时间、是否在监测状态下心脏骤停、是否气道干预、心脏骤停地点。
22、进一步,预测的准确率、精确率、召回率和f1分数均为0.9以上。
23、进一步,预测的准确率、精确率、召回率和f1分数分别为0.91、0.93、0.94和0.93
24、由于采用了上述技术方案,本专利技术取得的有益效果是:
25、本专利技术提出了一种改进的堆叠融合(smote-embed-stacking,se-stacking)模型,首先使用人工少数类过采样算法(synthetic minority over-sampling technique,smote)对数据进行均衡化处理,其次使用嵌入法(embed)对数据进行特征筛选,最后将四种以往学者公认性能较好的机器学习模型进行stacking融合(stacking融合也就是集成学习),得到性能更好的融合模型来对患者心肺复苏结果进行预测分析,引入可解释算法(shapley additive explanation,shap)来量化模型中各特征变本文档来自技高网...
【技术保护点】
1.一种心肺复苏结果预测方法,其特征在于包括如下步骤:
2.根据权利要求1所述的一种心肺复苏结果预测方法,其特征在于:S2中,对原始数据进行数据预处理是指:
3.根据权利要求2所述的一种心肺复苏结果预测方法,其特征在于:S3中,将样本集按照7:3的比例划分为训练集和测试集,训练集为70%、测试集为30%。
4.根据权利要求3所述的一种心肺复苏结果预测方法,其特征在于:S4中,单一模型为四种,分别为RF、GBDT、XGBoost、LightGBM;超参数优化算法选用网格搜索算法。
5.根据权利要求4所述的一种心肺复苏结果预测方法,其特征在于:S4中,网格搜索算法为交叉验证网格搜索算法。
6.根据权利要求5所述的一种心肺复苏结果预测方法,其特征在于:S5中,Stacking模型融合方法中的基层分类器为RF、GBDT、XGBoost、LightGBM,次分类器为LR模型。
7.根据权利要求6所述的一种心肺复苏结果预测方法,其特征在于:S5中,采用基于混淆矩阵的评估指标,对Stacking融合模型的性能指标进行评估。
8.根据权利要求7所述的一种心肺复苏结果预测方法,其特征在于:S6中,SHAP解释模型认为的特征重要程度排序,前九个特征依次为CPR总时间、肾上腺素总剂量、年龄、既往疾病、心脏骤停至CPR开始总时间、使用肾上腺素时间、是否在监测状态下心脏骤停、是否气道干预、心脏骤停地点。
9.根据权利要求1-8任一项所述的一种心肺复苏结果预测方法,其特征在于:预测的准确率、精确率、召回率和f1分数均为0.9以上。
10.根据权利要求9所述的一种心肺复苏结果预测方法,其特征在于:S6中,预测的准确率、精确率、召回率和f1分数分别为0.91、0.93、0.94和0.93。
...【技术特征摘要】
1.一种心肺复苏结果预测方法,其特征在于包括如下步骤:
2.根据权利要求1所述的一种心肺复苏结果预测方法,其特征在于:s2中,对原始数据进行数据预处理是指:
3.根据权利要求2所述的一种心肺复苏结果预测方法,其特征在于:s3中,将样本集按照7:3的比例划分为训练集和测试集,训练集为70%、测试集为30%。
4.根据权利要求3所述的一种心肺复苏结果预测方法,其特征在于:s4中,单一模型为四种,分别为rf、gbdt、xgboost、lightgbm;超参数优化算法选用网格搜索算法。
5.根据权利要求4所述的一种心肺复苏结果预测方法,其特征在于:s4中,网格搜索算法为交叉验证网格搜索算法。
6.根据权利要求5所述的一种心肺复苏结果预测方法,其特征在于:s5中,stacking模型融合方法中的基层分类器为rf、gbdt、xgboost...
【专利技术属性】
技术研发人员:张瑛琪,冯航测,宋雨佳,
申请(专利权)人:河北医科大学第一医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。