一种脓毒血症的数据处理系统技术方案

技术编号:21868842 阅读:34 留言:0更新日期:2019-08-17 07:51
本发明专利技术公开了一种脓毒血症的数据处理系统,包括模型训练单元,根据重症医学数据库提供的病患数据训练得到识别模型并保存于存储单元;预测单元,采用识别模型识别输出表示识别结果;模型训练单元包括:数据预处理模块,对取自重症医学数据库中的病患数据进行预处理,得到预处理病患数据;数据分离模块,将预处理病患数据分离为最终被诊断为脓毒血症的正向训练数据以及最终被诊断为非脓毒血症的反向训练数据;训练数据整合模块,整合成训练数据集;模型训练模块,根据训练数据集训练得到识别模型。本发明专利技术的有益效果是:减轻人为判定因素的影响,更容易挖掘数据的潜在特征,有效提升脓毒血症的预测精度。

A Data Processing System for Sepsis

【技术实现步骤摘要】
一种脓毒血症的数据处理系统
本专利技术涉及病患数据处理
,尤其涉及一种脓毒血症的数据处理系统。
技术介绍
在现代社会,近几年,大量的医疗数据被保存下来,然而由于医疗数据的敏感性、特异性、结构化数据和非结构化数据并存的现像,绝大多数的医疗数据并不能被直接允许用来数据分析。这些种种问题,导致了基于病情诊断的数据预处理环节显得尤为重要。本专利技术是基于MIMICIII数据库的研究,具有一定的ICU医疗数据库的通用性。脓毒血症(Sepsis)是一种常见的全身多系统感染反应,在病人住院时,常作为并发症导致生命危险。其中,在ICU重症监护室病房,脓毒血症是患者死亡的主要原因之一。而且随着时间推移,病患脓毒血症的恶化,将会引起各处器官功能障碍,并导致死亡率大幅上升。因此,针对脓毒血症的检测,和提早预知,防止其恶化,是提高患者生存率的重要方式。脓毒症发生率高,全球每年有超过1800万严重脓毒症病例,美国每年有75万例脓毒症患者,并且这一数字还以每年1.5%~8.0%的速度上升。脓毒症的病情凶险,病死率高,全球每天约14,000人死于其并发症,美国每年约21.5万人死亡。据国外流行病学调查显示,脓毒症的病死率已经超过心肌梗死,成为重症监护病房内非心脏病人死亡的主要原因。近年来,尽管抗感染治疗和器官功能支持技术取得了长足的进步,脓毒症的病死率仍高达30%~70%。脓毒症治疗花费高,医疗资源消耗大,严重影响人类的生活质量,已经对人类健康造成巨大威胁。早介入,早预防,因此,提前预测患者在未来N小时内患脓毒症的概率十分重要。现有的预测方式大多是基于统计学,可解释性虽好,但是往往预测效果不佳。
技术实现思路
根据现有技术中存在的上述问题,现提供一种脓毒血症的数据处理系统的技术方案,旨在减轻人为判定因素的影响,更容易挖掘数据的潜在特征,有效提升脓毒血症的预测精度。上述技术方案具体包括:一种脓毒血症的数据处理系统,其中,所述数据处理系统包括:模型训练单元,连接外部的重症医学数据库,用于根据所述重症医学数据库提供的病患数据,对一预设结构的神经网络模型进行训练得到一用于预测脓毒血症的识别模型;存储单元,连接所述模型训练单元,用于保存所述识别模型;预测单元,连接所述存储单元,用于根据外部输入的病患数据,采用训练形成的所述识别模型进行识别,以输出识别结果,所述识别结果用于表示对应所述病患数据的患者在预设时段内得脓毒血症的概率;所述模型训练单元具体包括:数据预处理模块,用于对取自所述重症医学数据库中的所述病患数据进行预处理,得到预处理病患数据;数据分离模块,连接所述数据预处理模块,用于根据SIRS指标,将所述预处理病患数据分离为最终被诊断为脓毒血症的正向训练数据以及最终被诊断为非脓毒血症的反向训练数据;训练数据整合模块,连接所述数据分离模块,用于将所述正向训练数据和所述反向训练数据整合成训练数据集;模型训练模块,连接所述训练数据整合模块,用于根据所述训练数据集训练得到所述识别模型。优选的,该数据处理系统,其中,所述数据预处理模块包括:数据脱敏部件,用于对提取于所述重症医学数据库中的所述病患数据进行脱敏操作,以筛除所述病患数据中的敏感信息;第一筛选部件,连接所述数据脱敏部件,用于在脱敏后的所述病患数据中,采用第一筛选规则筛选得到第一预处理数据;第二筛选部件,连接所述第一筛选部件,用于在所述第一预处理数据中,采用第二筛选规则筛选得到第二预处理数据;第三筛选部件,连接所述第二筛选部件,用于在所述第二预处理数据中,采用脓毒血症相关的筛选规则筛选得到所述预处理数据。优选的,该数据处理系统,其中,所述敏感信息包括所述病患数据相关的患者的联系方式,和/或年龄,和/或就诊时间。优选的,该数据处理系统,其中,所述第一筛选规则为:筛选得到有过mICU住院史且住院时长大于一预设时段的所述病患数据并作为所述第一预处理数据。优选的,该数据处理系统,其中,所述第二筛选规则为:筛选得到第一次住院时,住院年龄处于一预设年龄段内的所述病患数据并作为所述第二预处理数据。优选的,该数据处理系统,其中,所述神经网络模型为具有残差结构的卷积神经网络模型,所述卷积神经网络模型采用一维卷积核。优选的,该数据处理系统,其中,所述神经网络模型的网络深度为12层。优选的,该数据处理系统,其中,采用交叉熵损失函数作为所述神经网络模型的优化目标函数。上述技术方案的有益效果是:提供一种脓毒血症的数据处理系统,能够减轻人为判定因素的影响,更容易挖掘数据的潜在特征,有效提升脓毒血症的预测精度。附图说明图1是本专利技术的较佳的实施例中,一种脓毒血症的数据处理系统的总体结构示意图;图2是本专利技术的较佳的实施例中,模型训练单元的结构示意图;图3是本专利技术的较佳的实施例中,数据预处理模块的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。下面结合附图和具体实施例对本专利技术作进一步说明,但不作为本专利技术的限定。根据现有技术中存在的上述问题,现提供一种脓毒血症的数据处理系统,该数据处理系统具体要来对病患在最近几小时内是否产生脓毒血症进行预测。该数据处理系统A具体如图1中所示,包括:模型训练单元1,连接外部的重症医学数据库B,用于根据重症医学数据库B提供的病患数据,对一预设结构的神经网络模型进行训练得到一用于预测脓毒血症的识别模型;存储单元2,连接模型训练单元1,用于保存识别模型;预测单元3,连接存储单元2,用于根据外部输入的病患数据,采用训练形成的识别模型进行识别,以输出识别结果,识别结果用于表示对应病患数据的患者在预设时段内得脓毒血症的概率;则进一步地,如图2中所示,上述模型训练单元1具体包括:数据预处理模块11,用于对取自重症医学数据库中的病患数据进行预处理,得到预处理病患数据;数据分离模块12,连接数据预处理模块11,用于根据SIRS指标,将预处理病患数据分离为最终被诊断为脓毒血症的正向训练数据以及最终被诊断为非脓毒血症的反向训练数据;训练数据整合模块13,连接数据分离模块12,用于将正向训练数据和反向训练数据整合成训练数据集;模型训练模块14,连接训练数据整合模块13,用于根据训练数据集训练得到识别模型。具体地,重症医学数据库(MIMICIII数据库)是由麻省理工学院计算生理学实验室开发的公开可用数据集,其中收录了大量的住院相关数据,相比较一般的医疗数据库来说具有更普遍的ICU医疗数据的通用性。本实施例中,通过连接MIMICIII数据库,数据处理系统能够收集到更多更全面的病患数据。本实施例中,数据预处理模块11对收集到的病患数据进行预处理,以将原始数据处理成初步的预处理数据。随后数据分离模块12将上述预处理数据按照SIRS指标分离形成最终被诊断为脓毒血症的正向训练数据以及最终被诊断为非脓毒血症的反向训练数据。由于SIRS指标中不包括格拉斯哥昏迷指数,因此采用SIRS指标而非SOFA或者QSOFA评分,有本文档来自技高网
...

【技术保护点】
1.一种脓毒血症的数据处理系统,其特征在于,所述数据处理系统包括:模型训练单元,连接外部的重症医学数据库,用于根据所述重症医学数据库提供的病患数据,对一预设结构的神经网络模型进行训练得到一用于预测脓毒血症的识别模型;存储单元,连接所述模型训练单元,用于保存所述识别模型;预测单元,连接所述存储单元,用于根据外部输入的病患数据,采用训练形成的所述识别模型进行识别,以输出识别结果,所述识别结果用于表示对应所述病患数据的患者在预设时段内得脓毒血症的概率;所述模型训练单元具体包括:数据预处理模块,用于对取自所述重症医学数据库中的所述病患数据进行预处理,得到预处理病患数据;数据分离模块,连接所述数据预处理模块,用于根据SIRS指标,将所述预处理病患数据分离为最终被诊断为脓毒血症的正向训练数据以及最终被诊断为非脓毒血症的反向训练数据;训练数据整合模块,连接所述数据分离模块,用于将所述正向训练数据和所述反向训练数据整合成训练数据集;模型训练模块,连接所述训练数据整合模块,用于根据所述训练数据集训练得到所述识别模型。

【技术特征摘要】
1.一种脓毒血症的数据处理系统,其特征在于,所述数据处理系统包括:模型训练单元,连接外部的重症医学数据库,用于根据所述重症医学数据库提供的病患数据,对一预设结构的神经网络模型进行训练得到一用于预测脓毒血症的识别模型;存储单元,连接所述模型训练单元,用于保存所述识别模型;预测单元,连接所述存储单元,用于根据外部输入的病患数据,采用训练形成的所述识别模型进行识别,以输出识别结果,所述识别结果用于表示对应所述病患数据的患者在预设时段内得脓毒血症的概率;所述模型训练单元具体包括:数据预处理模块,用于对取自所述重症医学数据库中的所述病患数据进行预处理,得到预处理病患数据;数据分离模块,连接所述数据预处理模块,用于根据SIRS指标,将所述预处理病患数据分离为最终被诊断为脓毒血症的正向训练数据以及最终被诊断为非脓毒血症的反向训练数据;训练数据整合模块,连接所述数据分离模块,用于将所述正向训练数据和所述反向训练数据整合成训练数据集;模型训练模块,连接所述训练数据整合模块,用于根据所述训练数据集训练得到所述识别模型。2.如权利要求1所述的数据处理系统,其特征在于,所述数据预处理模块包括:数据脱敏部件,用于对提取于所述重症医学数据库中的所述病患数据进行脱敏操作,以筛除所述病患数据中的敏感...

【专利技术属性】
技术研发人员:徐胤顾时瑞杨家荣毛晴
申请(专利权)人:上海电气集团股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1