当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于多模态电子病历数据的院内死亡风险预测方法技术

技术编号:39734851 阅读:19 留言:0更新日期:2023-12-17 23:37
本发明专利技术公开了一种基于多模态电子病历数据的院内死亡风险预测方法,包括获取

【技术实现步骤摘要】
一种基于多模态电子病历数据的院内死亡风险预测方法


[0001]本专利技术属于医疗大数据
,具体涉及一种基于多模态电子病历数据的院内死亡风险预测方法


技术介绍

[0002]医疗健康的主要开销之一是重症监护室
(ICU)
的重症护理,重症护理的一个重要内容是预防患者死亡

随着电子病历数据
(EMR)
系统的广泛使用,医院收录了患者在
ICU
住院期间产生的大量
EMR
数据,这些数据一部分来自于对患者不同的生命信号的监测,包括心率

体温

血压

反映患者群体特征的人口学统计数据,它们通常以结构化数据的形式记录在
EMR
数据中,另外还有一部分来自于专业医务人员在患者住院期间记录的非结构化的临床文本数据,如图1所示为患者的多模态
EMR
数据示意图;充分利用
EMR
数据可以用于预测患者在
ICU
住院期间的健康状况,有助于管理医本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于多模态电子病历数据的院内死亡风险预测方法,包括如下步骤:
S1.
获取
ICU
患者的历史电子病历数据集;
S2.
采用步骤
S1
获取的数据集,通过预处理的方式构建多模态数据集,并划分为训练数据集

验证数据集和测试数据集;
S3.
基于多模态特征提取模块和特征融合与预测模块,构建院内死亡风险预测初步模型;
S4.
采用步骤
S2
得到的训练数据集对步骤
S3
得到的院内死亡风险预测初步模型进行训练,并采用验证数据集和测试数据集进行验证和测试,得到院内死亡风险预测模型;
S5.
获取待预测目标的病历数据,并输入到步骤
S4
得到的院内死亡风险预测模型,得到待预测目标的院内死亡风险预测结果
。2.
根据权利要求1所述的一种基于多模态电子病历数据的院内死亡风险预测方法,其特征在于步骤
S1
所述的获取
ICU
患者的历史电子病历数据集,具体包括:选择在
ICU
住院时间超过
48
小时的患者的病历数据和患者住院后前
48
小时的所有临床笔记;将患者划分为正样本和负样本,选择
ICU
住院死亡的患者为正样本,其他为负样本
。3.
根据权利要求2所述的一种基于多模态电子病历数据的院内死亡风险预测方法,其特征在于步骤
S2
所述的采用步骤
S1
获取的数据集,通过预处理的方式构建多模态数据集,并划分为训练数据集

验证数据集和测试数据集,具体包括:
(2

1)
结构化的临床序列数据:对于每位患者,从他们的电子病历中选择重要的临床变量作为输入预测模型的临床时序变量,并抽取人口学数据作为输入预测模型的静态变量,统一定义为结构化的序列数据;将结构化的序列数据按照设定的比例随机划分为结构化训练数据集

结构化验证数据集

结构化测试数据集;
(2

2)
非结构化的临床文本数据:对于非结构化的临床样本数据,选取患者住院后前若干个小时的所有临床笔记,并按照时间先后顺序排列,将患者住院前的临床文本作为初始临床笔记加入到临床文本中;对每条临床笔记进行了初步预处理;将患者的临床文本数据按照步骤
(2

1)
中设定的比例随机划分为对应的临床文本训练数据集

临床文本验证数据集和临床文本测试数据集;
(2

3)
选择步骤
(2

1)
中的结构化临床序列数据集和步骤
(2

2)
中的临床文本数据集,进行一一对应,构建最终的多模态数据集;划分多模态数据集为训练数据集

验证数据集和测试数据集,训练数据集包括结构化训练数据集

临床文本训练数据集;验证数据集包括结构化验证数据集

临床文本验证数据集;测试数据集包括结构化测试数据集

临床文本测试数据集
。4.
根据权利要求3所述的一种基于多模态电子病历数据的院内死亡风险预测方法,其特征在于步骤
S3
所述的基于多模态特征提取模块和特征融合与预测模块,构建院内死亡风险预测初步模型,具体包括:
(3

1)
将步骤
S2
得到的结构化训练数据集中的数据输入到
Multi

Modal EMR
预测模型的序列特征提取模块,获取序列特征和序列上下文表征;
(3

2)
将步骤
S2
得到的临床文本训练数据集中的数据输入到
Multi

Modal EMR
预测模
型的文本特征提取模块,获取临床文本特征;
(3

3)
采用多模态特征提取模块对步骤
(3

1)
获取的序列特征和序列上下文表征与步骤
(3

2)
获取的临床文本特征进行学习处理,获取最终的多模态特征;
(3

4)
将步骤
(3

3)
获取得到多模态特征输入到特征融合与预测模块,获取患者的全面表征,并预测患者的死亡风险
。5.
根据权利要求4所述的一种基于多模态电子病历数据的院内死亡风险预测方法,其特征在于步骤
(3

1)
所述的将步骤
S2
得到的结构化训练数据集中的数据输入到
Multi

Modal EMR
预测模型的序列特征提取模块,获取序列特征和序列上下文表征;具体包括:基于局部和全局时序表征学习与人口统计学数据嵌入方法构建序列特征提取模块;模块通过
LGTRL

DE
方法学习
EMR
的序列特征和序列上下文表征,采用下述公式表示
LGTRL

DE
方法的计算过程:
z

[u1,u2,...,u
t
,...,u
T
]

LGTRL

DE([x1,x2,...,x
t
,...,x
T
]

[s1,s2,...,s
m
,...,s
M
]

θ
)
其中,表示通过学习得到的序列特征向量;
n
series
表示序列嵌入维度的大小;表示序列上下文矩阵,简化为
U

θ
表示
LGTRL

DE
中所有的可学习参数
。6.
根据权利要求5所述的一种基于多模态电子病历数据的院内死亡风险预测方法,其特征在于步骤
(3

2)
所述的将步骤
S2
得到的临床文本训练数据集中的数据输入到
Multi

Modal EMR
预测模型的文本特征提取模块,获取临床文本特征;具体包括:所述的文本特征提取模块采用在
MIMIC

III
数据集和
PubMed
文章上预训练好的
Word2Vec
模型作为初始化模型,采用原始临床文本数据通过文本特征提取模块将
N
个笔记拼接后输入到
Word2Vec
模型,获取词嵌入矩阵,采用下述公式表示计算过程:其中,表示拼接处理;表示
Word2Vec
模型学习获得的词嵌入矩阵,
Len
表示
Word2Vec
模型的字典大小,是临床文本中的词数,每个词被嵌入到长度为
200
的一维向量空间中;基于获取的词嵌入矩阵,采用不同核大小的一维卷积层并行学习不同粒度水平的文本语义信息;每个卷积层的输出采用
ReLU
激活函数和最大池化操作,用于减少维度并得到文本语义特征;将不同粒度水平的文本语义特征拼接起来,得到患者的临床文本特征
e
;采用下述公式表示计算过程:下述公式表示计算过程:其中,表示步长为
1、
卷积核大小为
k、
带有
ReLU
激活函数和最大池化操作的一维卷积神经网络;
k1、k2、k3均设定为固定值;...

【专利技术属性】
技术研发人员:王建新邹梦洁匡湖林安莹
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1