The present invention discloses a sepsis mortality prediction system based on integrated model, which includes: an input device for acquiring the measured values of the sepsis-related detection items of the tested person; a processor connected with an input device, which is used to process the data acquired by the input device and output the predicted values of sepsis mortality; and a processor which includes a data preprocessing module and a multi-dimensional module. Feature selection module, integrated model building module and integrated model prediction module; data preprocessing doorway preprocessing data, multi-dimensional feature selection module for feature selection after preprocessing, screening out important features, importing important features into the integrated model of integrated model building module, training the integrated model, using the trained set. The model is used to predict and predict the mortality rate of sepsis, and the present invention makes the physiological indexes of sepsis patients relate to the mortality rate and has high test accuracy.
【技术实现步骤摘要】
基于集成模型的脓毒症死亡率预测系统
本专利技术涉及医疗数据挖掘领域,特别是涉及基于集成模型的脓毒症死亡率预测系统。
技术介绍
脓毒症是机体对感染的反应失调而导致的危及生命的器官功能障碍,是重症监护室的常见疾病及其患者死亡的主要原因之一,而且发病率和死亡率仍呈上升趋势。据统计,每年全球新增数百万脓毒症患者,其中超过四分之一的患者死亡。虽然全世界范围内的医学人士和专家都在积极进行临床研究,但是对于脓毒症临床指标的选取以及死亡率预测仍然缺乏有效的手段。选取合适的特征并进行死亡率预测是该疾病预后的一项重要工作,预测准确性越高,越有利于医生做出精准的临床决策,从而可以提高诊疗的效率。目前,基于数据挖掘和机器学习相关理论,探索基于脓毒症多维临床指标的死亡率预测系统尚未出现。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供了基于集成模型的脓毒症死亡率预测系统,基于加权投票的随机森林、GBDT和逻辑回归的集成模型,使得脓毒症病患的各项生理指标与死亡率建立联系,具有测试准确度高的有益效果。本专利技术所采用的技术方案是:基于集成模型的脓毒症死亡率预测系统,包括:输入器,用于获取被测者脓毒症相关检测项目的测量值;处理器,与输入器相连,所述处理器用于对输入器获取的数据进行处理,输出脓毒症死亡率的预测值;所述处理器,包括:数据预处理模块、多维特征选择模块、集成模型构建模块和集成模型预测模块;所述数据预处理模块,用于对被测者脓毒症相关检测项目测量值的噪声数据或缺失数据进行清洗,对清洗后的数据进行数据转换和归一化处理;所述多维特征选择模块,用于建立与被测者脓毒症相关检测项目测量值 ...
【技术保护点】
1.基于集成模型的脓毒症死亡率预测系统,其特征是,包括:输入器,用于获取被测者脓毒症相关检测项目的测量值;处理器,与输入器相连,所述处理器用于对输入器获取的数据进行处理,输出脓毒症死亡率的预测值;所述处理器,包括:数据预处理模块、多维特征选择模块、集成模型构建模块和集成模型预测模块;所述数据预处理模块,用于对被测者脓毒症相关检测项目测量值的噪声数据或缺失数据进行清洗,对清洗后的数据进行数据转换和归一化处理;所述多维特征选择模块,用于建立与被测者脓毒症相关检测项目测量值相对应特征项,将特征项作为第一样本,通过基于改进的随机森林算法对所述第一样本进行特征选择,得到被测者脓毒症相关检测项目测量值的若干个主特征子集,将若干个主特征子集构成的样本集合作为第二样本;所述集成模型构建模块,对随机森林、梯度提升树GBDT和逻辑回归三个基分类器,采用加权投票融合的方法,构建集成模型;所述集成模型预测模块,将第二样本随机分为训练集和预测集,利用训练集对集成模型进行训练,然后利用预测集对训练好的集成模型进行测试,输出脓毒症死亡率预测值。
【技术特征摘要】
1.基于集成模型的脓毒症死亡率预测系统,其特征是,包括:输入器,用于获取被测者脓毒症相关检测项目的测量值;处理器,与输入器相连,所述处理器用于对输入器获取的数据进行处理,输出脓毒症死亡率的预测值;所述处理器,包括:数据预处理模块、多维特征选择模块、集成模型构建模块和集成模型预测模块;所述数据预处理模块,用于对被测者脓毒症相关检测项目测量值的噪声数据或缺失数据进行清洗,对清洗后的数据进行数据转换和归一化处理;所述多维特征选择模块,用于建立与被测者脓毒症相关检测项目测量值相对应特征项,将特征项作为第一样本,通过基于改进的随机森林算法对所述第一样本进行特征选择,得到被测者脓毒症相关检测项目测量值的若干个主特征子集,将若干个主特征子集构成的样本集合作为第二样本;所述集成模型构建模块,对随机森林、梯度提升树GBDT和逻辑回归三个基分类器,采用加权投票融合的方法,构建集成模型;所述集成模型预测模块,将第二样本随机分为训练集和预测集,利用训练集对集成模型进行训练,然后利用预测集对训练好的集成模型进行测试,输出脓毒症死亡率预测值。2.如权利要求1所述的基于集成模型的脓毒症死亡率预测系统,其特征是,所述脓毒症相关检测项目,包括:ICU停留ID、患者ID、住院ID、性别、入院时间、出院时间、年龄、种族、首次ICU类型、是否在入院时死亡、是否在入院30天内死亡、吸入氧气浓度、血氧饱和度、序贯器官衰竭评分、全身炎症反应综合评分、脓毒症确诊时间、乳酸清除率、用药时间、是否进行机械通气、治疗开始时间或治疗结束时间。3.如权利要求1所述的基于集成模型的脓毒症死亡率预测系统,其特征是,所述数据预处理模块,包括:数据筛选单元,用于对被测者脓毒症相关检测项目测量值进行筛选,对乳酸清除率测量缺失值进行填充,对测量噪音值进行剔除,测量噪音值主要包括记录错误的测量指标、单位不统一的测量指标、ICU停留ID、患者ID或住院ID;数据转换单元,用于对经筛选、填充和剔除后的被测者脓毒症相关检测项目测量值进行格式转换;数据归一化单元,用于采用被测者脓毒症相关检测项目测量值的最大值和最小值对格式转换后的被测者脓毒症相关检测项目测量值进行归一化处理。4.如权利要求1所述的基于集成模型的脓毒症死亡率预测系统,其特征是,所述多维特征选择模块包括:所述欠采样单元,在n条记录的脓毒症数据集中,引入区间参数m和n,在区间之间产生变量a,以有放回的形式随机从大类样本训练集中抽取n×a个大类实例,从小类样本训练集中抽取n×(1-a)个小类实例,所述大类实例是指存活样本;所述...
【专利技术属性】
技术研发人员:王红,刘海燕,王露潼,房有丽,狄瑞彤,周莹,王倩,宋永强,张伟,胡斌,
申请(专利权)人:山东师范大学,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。