一种危重症生存概率预测模型训练及预测方法技术

技术编号:38849357 阅读:19 留言:0更新日期:2023-09-17 09:58
本发明专利技术公开了一种危重症生存概率预测模型训练及预测方法,该方法包括获取奥密克戎患者患病数据;对患病数据进行处理,得到格式统一的患病数据;从患病数据中筛选出重症指标;对重症指标进行数据填充,并对数据填充后的所有重症指标进行归一化处理;以归一化处理后的重症指标为输入样本,以出院状态为输出样本,构建样本数据集;构建长短期记忆模型,模型包括依次连接的时间感知长短期记忆单元、全连接层以及激活层;利用样本数据集对模型进行训练,得到目标长短期记忆模型。本发明专利技术避免了不重要指标对模型准确度的影响,解决了传统模型无法适用于患者项目检查时间间隔不固定的场景。景。景。

【技术实现步骤摘要】
一种危重症生存概率预测模型训练及预测方法


[0001]本专利技术属于人工智能
,尤其涉及一种危重症生存概率预测模型训练方法、预测方法、设备及存储介质。

技术介绍

[0002]这类患者往往存在基础疾病或因年迈导致基础免疫力低,奥密克戎病毒可诱发其基础疾病复发而导致患者危重甚至死亡。因此,提早数天预测感染患者的生命危险,不仅可以提早识别高风险患者,为医务工作者留出宝贵的抢救时间;而且可以根据患者风险情况合理地分配医疗资源,缓解病毒爆发期医疗资源挤兑造成的种种问题。
[0003]对于奥密克戎感染患者的生命危险判断,基于传统诊疗方法,医生往往只能凭借自身的诊疗经验、患者当前状态及指标状况,对患者当前的生命危险进行粗略判断。这种判断往往带有主观性,且仅判断患者当前的生命危险也具有局限性,不具备提早数天预判并救治的能力。随着现代医学检查的增多,检查项目日益增加,患者每天产生的各项检测指标可能达百个,相较于人工智能,人类不具备挖掘高维度指标间联系以及患者入院以来指标变化趋势的能力,这也是医务人员难以客观地预测患者生命危险的原因之一。
[0004]随着医疗系统信息化的普及,就医患者的每次检查结果、用药、治疗都会保存在医院的电子病历中,这些海量数据为搭建人工智能模型,以分析患者特点,预测患者生命危险提供了数据基础。然而,患者的指标维度极广,有近百个。但在医疗场景中数据总量相较于数据维度往往是不足的,如果将所有维度数据输入人工智能模型,一个是对于生命危险不重要的指标会对模型准确性造成影响,更重要的是可能会让模型有欠拟合的风险。因此,筛选出对生命危险有意义的重症指标,对于模型训练及模型准确度有重大意义。
[0005]COX回归模型,又称比例风险回归模型(proportional hazards model),简称COX模型,是一种传统机器学习模型,该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。由于上述优良特性,该模型自问世以来,在医学随访研究中得到广泛的应用,是迄今生存分析中应用最多的多因素分析方法。
[0006]相较于传统的机器学习模型(如COX模型),神经网络模型对于患者生命风险分析更具有优势。这是因为传统机器学习模型往往具有算法设计上的局限性,且没有合适的机器学习模型分析患者的体征时序变化特点,也就难以分析患者病情是否恶化。因此人工智能模型中的长短期记忆模型(Long short

term memory)比机器学习模型更适合用于时序信息分析;然而长短期记忆模型假定输入的时序间隔固定,这并不符合医疗场景中实际情况,这是由于患者做检查的时间间隔不固定导致的。

技术实现思路

[0007]本专利技术的目的在于提供一种危重症生存概率预测模型训练及预测方法,以解决不重要指标对预测模型准确度造成影响,可能存在欠拟合问题,以及长短期记忆模型无法适
用于患者项目检查时间间隔不固定的场景。
[0008]本专利技术是通过如下的技术方案来解决上述技术问题的:
[0009]一种危重症生存概率预测模型训练方法,所述方法包括以下步骤:
[0010]获取N名奥密克戎患者的患病数据,所述患病数据包括奥密克戎患者从入院时间到预测时间所做的检查项目数据、出院时间以及出院状态;其中,所述预测时间等于出院时间与预测天数之差,每个检查项目至少包括两个检测指标;
[0011]对所有奥密克戎患者的患病数据进行处理,得到格式统一的N条患病数据,每名奥密克戎患者对应一条患病数据;
[0012]从每条患病数据中筛选出重症指标;
[0013]对每名奥密克戎患者的重症指标进行数据填充,并对数据填充后的每名奥密克戎患者的所有重症指标进行归一化处理;
[0014]以每名奥密克戎患者从入院时间到预测时间的归一化处理后的重症指标为输入样本,以对应奥密克戎患者的出院状态为输出样本,构建样本数据集;
[0015]构建长短期记忆模型,所述长短期记忆模型包括依次连接的时间感知长短期记忆单元、全连接层以及激活层;所述时间感知长短期记忆单元的输出表达式为:
[0016]H
t
=O
t
×
tanh(C
t
),O
t
=sigmoid(W
io
×
x
t
+W
ho
×
H
t
‑1+b
o
)
[0017][0018][0019]其中,H
t
为单个输入样本中最后一天t的重症指标作为输入时,时间感知长短期记忆单元的输出;O
t
为单个输入样本中最后一天t的重症指标作为输入时,时间感知长短期记忆单元的输出门结果;C
t
为调整后的当前记忆;W
io
为输出门与输入门的权重矩阵;x
t
为输入数据;W
ho
为隐藏层与输出门的权重矩阵;H
t
‑1为单个输入样本中最后一天t的前一天的重症指标作为输入时,时间感知长短期记忆单元的输出;b
o
为输出门的偏置参数;为调整后的之前记忆;I
t
为时间感知长短期记忆单元输入门结果;G
t
为时间感知长短期记忆单元cell state单元状态;为之前的长期记忆;为调整后的短期记忆;C
t
‑1为之前记忆;为调整前的短期记忆;g(Δ
t
)为间隔天数对短期记忆的削减程度;W
d
为权重矩阵;b
d
为偏置参数;Δ
t
为输入样本中的间隔天数;Δ
T
为间隔天数Δ
t
的阈值;
[0020]利用所述样本数据集对所述长短期记忆模型进行训练,得到目标长短期记忆模型。
[0021]进一步地,所述从每条患病数据中筛选出重症指标的具体实现过程为:
[0022]对每名奥密克戎患者的每个检测指标进行归一化处理;
[0023]构建COX回归模型,以N名奥密克戎患者归一化处理后的所有检测指标作为所述COX回归模型的输入数据,以出院状态以及每个检测指标的检测时间与出院时间之间的天数作为标签,得到所述COX回归模型预测的每个检测指标与生存概率风险的权重以及每个检测指标与生存概率风险的不相关概率;
[0024]保留同时满足以下条件的检测指标作为重症指标:
[0025]条件A:(HR
i
|≥|HR
T
|)∩(P
i
≥P
T
),其中,HR
i
为第i个检测指标与生存概率风险的权
重,HR
T
为权重阈值,P
i
为第i个检测指标与生存概率风险的不相关概率,P
T
为不相关概率阈值本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种危重症生存概率预测模型训练方法,其特征在于,所述方法包括以下步骤:获取N名奥密克戎患者的患病数据,所述患病数据包括奥密克戎患者从入院时间到预测时间所做的检查项目数据、出院时间以及出院状态;其中,所述预测时间等于出院时间与预测天数之差,每个检查项目至少包括两个检测指标;对所有奥密克戎患者的患病数据进行处理,得到格式统一的N条患病数据,每名奥密克戎患者对应一条患病数据;从每条患病数据中筛选出重症指标;对每名奥密克戎患者的重症指标进行数据填充,并对数据填充后的每名奥密克戎患者的所有重症指标进行归一化处理;以每名奥密克戎患者从入院时间到预测时间的归一化处理后的重症指标为输入样本,以对应奥密克戎患者的出院状态为输出样本,构建样本数据集;构建长短期记忆模型,所述长短期记忆模型包括依次连接的时间感知长短期记忆单元、全连接层以及激活层;所述时间感知长短期记忆单元的输出表达式为:H
t
=O
t
×
tanh(C
t
),O
t
=sigmoid(W
io
×
x
t
+W
ho
×
H
t
‑1+b
o
))其中,H
t
为单个输入样本中最后一天t的重症指标作为输入时,时间感知长短期记忆单元的输出;O
t
为单个输入样本中最后一天t的重症指标作为输入时,时间感知长短期记忆单元的输出门结果;C
t
为调整后的当前记忆;W
io
为输出门与输入门的权重矩阵;x
t
为输入数据;W
ho
为隐藏层与输出门的权重矩阵;H
t
‑1为单个输入样本中最后一天t的前一天的重症指标作为输入时,时间感知长短期记忆单元的输出;b
o
为输出门的偏置参数;为调整后的之前记忆;I
t
为时间感知长短期记忆单元输入门结果;G
t
为时间感知长短期记忆单元cell state单元状态;为之前的长期记忆;为调整后的短期记忆;C
t
‑1为之前记忆;为调整前的短期记忆;g(Δ
t
)为间隔天数对短期记忆的削减程度;W
d
为权重矩阵;b
d
为偏置参数;Δ
t
为输入样本中的间隔天数;Δ
T
为间隔天数Δ
t
的阈值;利用所述样本数据集对所述长短期记忆模型进行训练,得到目标长短期记忆模型。2.根据权利要求1所述的危重症生存概率预测模型训练方法,其特征在于,所述从每条患病数据中筛选出重症指标的具体实现过程为:对每名奥密克戎患者的每个检测指标进行归一化处理;构建COX回归模型,以N名奥密克戎患者归一化处理后的所有检测指标作为所述COX回归模型的输入数据,以出院状态以及每个检测指标的检测时间与出院时间之间的天数作为标签,得到所述COX回归模型预测的每个检测指标与生存概率风险的权重以及每个检测指标与生存概率风险的不相关概率;保留同时满足以下条件的检测指标作为重症指标:条件A:(|HR
i
|≥|HR
T
|)∩(P
i
≥P
T
),其中,HR
i
为第i个检测指标与生存概率风险的权重,HR
T
为权重阈值,P
i
为第i个检测指标与生存概率风险的不相关概率,P
T
为不相关概率阈值;
条件B:其中,c
i
为第i个检测指标的数据完整性,d
ji
为第j个奥密克戎患者的第i个检测指标的检测天数,D为N名奥密克戎患者的住院天数之和,c
T
为数据完整性阈值;条件C:II
k
≥II
T
,其中,II
k
为第k个检查项目中满足条件A和条件B的检测指标数,即第k个检查项目的纳入指标数,II
T
为纳入指标数阈值,II
T
≥...

【专利技术属性】
技术研发人员:吕丰钱信宇吴帆周杰钰张永敏张尧学钱招昕张丽娜王占稳左志红
申请(专利权)人:中南大学湘雅医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1