基于机器学习的预测早产儿支气管肺发育不良风险的方法技术

技术编号:35942368 阅读:16 留言:0更新日期:2022-12-14 10:31
本发明专利技术公开了基于机器学习的预测早产儿支气管肺发育不良风险的方法,包括步骤一:选择相关历史病历及数据,通过数据集成、结构化、预处理等进行数据处理;步骤二:在医学逻辑监督下提取医学变量;步骤三:通过机器学习的方法训练出效果最佳的多因素预测模型;步骤四:独立验证集中验证、检定模型的性能及阈值;步骤五:与临床辅助决策系统结合,在相应的应用场景中使用模型,传递给用户。本发明专利技术利用医院电子病历信息库,结合机器学习的方法,建立BPD风险预测模型,在院内数据部署软件后,对来院住院的患儿进行实时运算,对早产儿人群中BPD患儿进行提示,供医生进一步进行评估及早期干预,延缓病情进展,改善患者预后。改善患者预后。改善患者预后。

【技术实现步骤摘要】
基于机器学习的预测早产儿支气管肺发育不良风险的方法


[0001]本专利技术涉及数据模型构建方法
,具体是基于机器学习的预测早产儿支气管肺发育不良风险的方法。
[0002]
技术介绍

[0003]支气管肺发育不良(BPD)是早产儿常见的慢性肺部疾病,近年来随着新生儿重症监护技术迅速发展,越来越多的早产儿和极低出生体重儿得以存活,BPD 成为引起早产儿疾病和死亡的重要原因。支气管肺发育不良 (BPD) 是与极早产相关的最常见并发症,患病率为 11%

50%。在小于 34 周妊娠的早产儿中,BPD 的发生率高达 13.2%

26.4 %。许多 BPD 婴儿患有气道和肺实质损伤,恢复缓慢。此外,BPD导致肺发育可塑性、损伤和修复,影响儿童的肺功能和生活质量长达十年,负担沉重。已经确定了几个个体风险因素,一些研究探讨了发生 BPD 和严重 BPD 的多种风险因素。然而,并非所有与早产儿 BPD 相关的因素婴儿已得到很好的描述,新生儿重症监护病房 (NICU) 迫切需要对 BPD 进行早期预警,以便新生儿科医生为被确定为 BPD 高风险的新生儿提供治疗。
[0004]BPD 的发生与患儿胎龄、体重、性别、败血症、呼吸窘迫、机械通气等危险因素有关,不同国家、地域新生儿 BPD 发生的危险因素不完全相同,这可能与医疗水平、种族等有关。因此,在建立 BPD 风险预测模型时,需要先进行病例对照研究筛选出与 BPD 相关的独立危险因素;其次根据相应的独立危险因素计算出对BPD 发生的相对危险度,然后依据计算出的相对危险度推导出预测模型;最后为了验证模型的可复制性(内部有效性)和通用性(外部有效性),还应该对预测模型进行内部验证、外部验证,内部验证即在现有的标本中随机抽取部分样本检验模型的预测效能,外部验证即需要在其他样本中检验模型的预测效能,但外部验证常需进行多中心研究,实施难度大。
[0005]由于BPD均发生在早产儿特别是出生胎龄小于32周的极早产儿,而对于BPD的诊断是根据出生后28天时,新生儿对氧气的依赖性进行诊断,即无法脱离氧气的,才诊断为BPD。由于BPD的诊断在早产儿满月的时候才能明确,因此,对BPD尽早预警,在特定高风险早产儿中,及早警示医师,有助于改变治疗策略,改善预后。虽然临床上也采用了多种方法来预防和治疗 BPD,但收效甚微。其主要原因是缺乏在生命的早期阶段来准确预测 BPD 发生的技术和能力,从而失去对其早期预防和治疗的最佳时机。因此,专利技术一种预测早产儿支气管肺发育不良风险的方法是亟需解决的问题。
[0006]
技术实现思路

[0007]本专利技术的目的在于提供一种基于机器学习的预测早产儿支气管肺发育不良风险的方法,以解决上述
技术介绍
中提出的问题。
[0008]为实现上述目的,本专利技术提供如下技术方案:基于机器学习的预测早产儿支气管
肺发育不良风险的方法,包括如下步骤:步骤一:选择相关历史病历及数据,通过数据集成、结构化、预处理等进行数据处理;步骤二:在医学逻辑监督下提取医学变量;步骤三:通过机器学习的方法训练出效果最佳的多因素预测模型;步骤四:独立验证集中验证、检定模型的性能及阈值;步骤五:与临床辅助决策系统结合,在相应的应用场景中使用模型,传递给用户。
[0009]进一步地,所述步骤二:在医学逻辑监督下提取医学变量,具体包括诊断、病史、检验、检查、主诉、体征、医嘱,并通过在相应合适的时间窗内进行统计学适当地聚合、衍生,最终形成具有一定代表力的变量。
[0010]进一步地,所述提取医学变量是通过机器学习训练系统,自动从数千个刻画患者信息的特征池中,自动筛选预预测效果最佳,且表现稳定的优质特征,得到各种医学变量。
[0011]进一步地,所述步骤三:通过机器学习的方法训练出效果最佳的多因素预测模型中,参与实验的算法包括但不限于xgboost、scorecard、neural network、svm、logistic regression、decision tree、random forest算法。
[0012]与现有技术相比,本专利技术的有益效果是:本专利技术利用医院电子病历信息库,结合机器学习的方法,建立 BPD 风险预测模型,在院内数据部署软件后,对来院住院的患儿进行实时运算,对早产儿人群中 BPD 患儿进行提示,供医生进一步进行评估及早期干预,延缓病情进展,改善患者预后。不仅如此,本专利技术还对模型预测影响因素做了相应的分析,从而更好地辅助临床医生进行诊疗。
[0013]附图说明
[0014]图1为本专利技术基于机器学习的预测早产儿支气管肺发育不良风险的方法流程图。
[0015]图2为本专利技术基于机器学习的预测早产儿支气管肺发育不良风险的方法中变量筛选示意图。
[0016]图3为本专利技术基于机器学习的预测早产儿支气管肺发育不良风险的方法预测模型计算机程序示例图。
[0017]具体实施方式
[0018]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0019]实施例1S1设置数据研究样本数据收集从研究的数据样本中,根据病例报告表 (CRF) 从 EMR 系统获得临床数据。CRF由五个模块组成,包括怀孕和出生史、出生后的早期治疗、实验室检查结果、影像学结果。完整
的CRF表含有93个变量的临床数据。 而候选预测变量从CRF中的变量中进行选择。此外,计算机自动从医院数据系统提取的数据,由儿科医生根据原始数据进行质量评估检查,确保数据采集的准确性。
[0020]根据每个候选预测参数至少 10~20 个事件的原则,计划选用15个左右的临床特征纳入预测模型。因此,估计用于训练模型的数据集,至少需要300名BPD患者的数据才能满足在不同时间点(即 72 小时、7 天和 14 天)开发预测模型进行稳健建模的最小样本量要求。当然,数据集中的阳性样本量可以大于这个示例,包括500例,1000例,甚至更多。
[0021]变量选择由于变量不是正态分布的,连续数据和分类数据分别由具有四分位距 (IQR) 的中位数和具有比例的频率表示。t检验用于比较连续变量,Wilcoxon秩和检验用于比较分类变量。为了探索BPD的预测因素,首先通过嵌入随机森林的证据权重方法筛选候选变量。每个变量通过随机森林的分析获得若干个节点,分析每个变量的权重指标,将低于一定阈值的权重指标放弃。获得候选变量。然后,临床专家结合已发表的文献和他们的经验对变量进行回顾。根据专家的意见和上述变量分析的权重,主要从关键的临床状态选择合适的临床特征:胎龄、出生体重,5分钟Apgar评分、肺表面活性物质的使用、机械通气与否、动脉导管未闭、实验室检查结果中的血细胞计数和血气分析结果。
[0022]基于机器学习算法训练预测模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于机器学习的预测早产儿支气管肺发育不良风险的方法,其特征在于:包括如下步骤:步骤一:选择相关历史病历及数据,通过数据集成、结构化、预处理等进行数据处理;步骤二:在医学逻辑监督下提取医学变量;步骤三:通过机器学习的方法训练出效果最佳的多因素预测模型;步骤四:独立验证集中验证、检定模型的性能及阈值;步骤五:与临床辅助决策系统结合,在相应的应用场景中使用模型,传递给用户。2.根据权利要求1所述的基于机器学习的预测早产儿支气管肺发育不良风险的方法,其特征在于,所述步骤二:在医学逻辑监督下提取医学变量,具体包括诊断、病史、检验、检查、主诉、体征、医嘱,并通过在相应合适的时间窗内进行统计学适当地聚合、衍生,最终形成具有一定代表力的变量。3.根据权利要求2所述的基于机器学习的预测早产儿支气管肺发育不良风险的方法,其特征在于,所述提取医学变量是通过机器学习训练系统,自动从数千个刻画患者信息的特征池中,...

【专利技术属性】
技术研发人员:汤梁峰张晓波何雯曹云冯瑞周建国张澜孙司琦
申请(专利权)人:复旦大学附属儿科医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1