一种基于自适应集成学习模型的再入院风险预测方法技术

技术编号：26732543 阅读：36 留言：0更新日期：2020-12-15 14:37

本发明专利技术公开了一种基于自适应集成学习模型的再入院风险预测方法，包括以下步骤：采集患者的基本信息和临床诊疗信息，并构建临床高维特征矩阵以及再住院标签；对临床高维特征矩阵依次进行数据预处理和KPCA降维，得到降维特征集；构建自适应集成学习模型并根据降维特征集和再住院标签对其训练，将待预测患者的降维特征集输入训练完成的自适应集成学习模型中，得到患者的再入院风险预测结果。本发明专利技术提出了一种基于自适应集成学习模型的再入院风险预测方法，通过集成学习模型准确预测患者再入院风险，辅助医生对高风险患者提前采取干预措施，有助于降低患者疾病负担、减轻患者经济负担，有助于降低医院再入院率以及提升医疗服务质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自适应集成学习模型的再入院风险预测方法
本专利技术属于计算机科学领域，具体涉及一种基于自适应集成学习模型的再入院风险预测方法。
技术介绍
再入院率是反映医院医疗质量和管理水平的重要指标，准确预测患者再入院风险，为医生和医院管理者提供辅助决策支撑，从而可以有效降低再入院率。在提高医疗服务质量和降低治疗费用的同时，帮助医院更加有效合理的分配医疗资源。目前，关于再入院风险预测研究仍存在一些问题：再入院风险预测的特征具有高维、非线性的特点，传统的线性降维方式不能取得很好的降维效果。再入院风险预测主流方法分为两种：一是传统的统计学方法，这类方法的预测精度不高；另一种是机器学习算法，在一定程度上解决传统统计学方法预测精度不足的问题，但预测效果仍有待提升。集成学习模型使用多个基模型的预测结果作为训练一个新的元学习器的特征，已经被成功地应用在一些科学领域的预测，并被证明比单个机器学习模型更有效。但在再入院风险预测的研究中，由于缺乏背景知识，集成学习模型很难选择有效的模型组合，进而影响了模型的预测效果。...

【技术保护点】
1.一种基于自适应集成学习模型的再入院风险预测方法，其特征在于，包括以下步骤：/nS1、采集患者的基本信息和临床诊疗信息，并通过基本信息和临床诊疗信息构建临床高维特征矩阵以及再住院标签；/nS2、对临床高维特征矩阵进行数据预处理，并对预处理后的临床高维特征矩阵进行KPCA降维，得到降维特征集；/nS3、构建自适应集成学习模型，并将患者的降维特征集和再住院标签输入自适应集成学习模型进行训练；/nS4、将待预测患者的降维特征集输入训练完成的自适应集成学习模型中，得到患者的再入院风险预测结果。/n

【技术特征摘要】
1.一种基于自适应集成学习模型的再入院风险预测方法，其特征在于，包括以下步骤：
S1、采集患者的基本信息和临床诊疗信息，并通过基本信息和临床诊疗信息构建临床高维特征矩阵以及再住院标签；
S2、对临床高维特征矩阵进行数据预处理，并对预处理后的临床高维特征矩阵进行KPCA降维，得到降维特征集；
S3、构建自适应集成学习模型，并将患者的降维特征集和再住院标签输入自适应集成学习模型进行训练；
S4、将待预测患者的降维特征集输入训练完成的自适应集成学习模型中，得到患者的再入院风险预测结果。

2.根据权利要求1所述的基于自适应集成学习模型的再入院风险预测方法，其特征在于，所述步骤S3中构建自适应集成学习模型的具体步骤为：
C1、选择备选基模型和元学习器；
C2、通过遗传算法自适应地选择不同元学习器对应的基模型，构建3个最优集成模型；
C3、以权重投票机制为基础，并通过粒子群优化算法调整3个集成模型的权重，获取自适应集成学习模型。

3.根据权利要求2所述的基于自适应集成学习模型的再入院风险预测方法，其特征在于，所述步骤C1中备选基模型包括支持向量机、逻辑斯特回归、贝叶斯模型、分类和回归树、梯度提升决策树、极端随机树、随机森林、卷积神经网络、多层感知机、极端梯度提升、引导聚集算法和自适应增强算法；
所述步骤C1中元学习器包括线性模型LogisticRegression、树模型ClassificationandRegressionTree和深度学习模型Multi-layerPerceptron。

4.根据权利要求3所述的基于自适应集成学习模型的再入院风险预测方法，其特征在于，所述步骤C2包括以下分步骤：
C2.1、对所有备选基模型进行离散化，采用二进制编码方法对离散化后的备选基模型进行编码，并初始化，随机生成M个编码个体；
C2.2、对每个编码个体所对应的基模型和元学习器所构建的集成学习模型进行训练，采用AUC作为适应度函数，并计算训练后每个编码个体的适应度值；
C2.3、将编码个体的适应度值与总群体的适应度值的比值作为选择最优基模型组合的准则，剔除适应度比值较小的N个编码个体；
C2.4、随机添加N个编码个体到现有群体中；
C2.5、设置交叉概率为0.6，从现有群体的每个编码个体中随机抽取两个基模型作为交叉点，并进行交叉操作；
C2.6、设置变异概率为0.1，并对现有群体中每个编码个体进行变异操作；
...

【专利技术属性】
技术研发人员：邱航，张振，郑鑫，胡智栩，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人