一种预警模型训练方法、系统及应用方法、系统技术方案

技术编号:37551006 阅读:15 留言:0更新日期:2023-05-15 07:36
本发明专利技术公开了一种预警模型训练方法、系统及应用方法、系统,涉及计算机及电子病历挖掘领域,训练方法包括获取训练样本集;提取每一医学事件对应的特征向量,得到事件特征向量;提取每一医学事件对应的时间戳,得到时间特征向量;将每一组事件特征向量和对应的时间特征向量进行合并,得到若干组合并后的特征向量;基于TransformerEncoder结构构建预警模型;按时间戳的顺序将患者住院过程的电子病历数据对应的若干组合并后的特征向量分别输入预警模型;根据预警模型的输出和对应的诊断结果,确定损失函数;根据损失函数优化预警模型的参数,以对预警模型进行训练,得到训练好的预警模型。本发明专利技术能够及时、准确地得到预警信息。准确地得到预警信息。准确地得到预警信息。

【技术实现步骤摘要】
一种预警模型训练方法、系统及应用方法、系统


[0001]本专利技术涉及计算机及电子病历挖掘领域,特别是涉及一种预警模型训练方法、系统及应用方法、系统。

技术介绍

[0002]随着人民生活水平日益提高和科学技术的发展,人们对预测模型(predictive models)表现的预期也在提高。在时间序列预测领域,人们不再只满足于预测的准确性,预测的及时性开始得到更多的重视。实际上,及时预测的重要性可以体现在人民生活的方方面面:尽早地、准确地知道未来的天气变化可以给人们的出行规划带来更多灵活性;尽早地、准确地预测未来的股市走势可以给人们带来更大的机会窗口;在临床医学领域,尽早地发现、诊断疾病为提前干预提供了条件,对保障患者的生命、提升患者的生活质量以及降低整个社会的医学成本都有极大的现实意义。
[0003]然而,在现实世界中,时间序列数据普遍含有几个以下特点,使得传统的统计学方法在这个领域举步维艰。一,数据来源多样,传统的统计学方法难以考虑到数据结构与信息的异质性;二,数据非常高维度;三,数据含有丰富的长期依赖关系(long

term dependencies)且依赖关系的时间不均一;四,信息在时间上分布高度不均;五,每个序列的长度不一定一致;六,特征交互(feature interactions)关系未知且难以做出准确的假设。很长的一段时间内,为了分析高维复杂的时间序列,科学家需要对数据做出不完全反应现实的强假设。而模型的精度也差强人意。
[0004]由于人工智能方法强大的特征提取能力与其灵活性,基于深度学习方法分析高维复杂的时间序列的新方法不绝于耳,其模型表现也屡次被证明大大优于传统的统计学方法与机器学习方法。通常,此类方法基于循环神经网络(Recurrent Neural Network,RNN),例如长短期记忆模型(Long Short

Term Memory,LSTM),门基循环单元(Gated Recurrent Unit,GRU)以及他们的变型。这类方法可以很好地解决上述数据问题之一、二、五、六点,但是无法规避数据问题之三、四两点。首先,循环神经网络容易忘记较早前的信息。换句话说,较早的信息对于当下的决策只有非常微弱、甚至近乎零影响。然而医学数据通常含有极长的长期依赖关系:比如一名高血压患者利用多种手段长期地控制住了病情。虽然高血压相当一段时间无复发,但是病史中对于高血压的记录对当下患者其他病情的判断仍有极大的参考价值。其次,循环神经网络不能考虑到相邻事件的时间分布。对于电子病历来说,记录频次(record frequency)为重要信息:高频次的记录说明了医生在积极干预或者积极收集信息以作出诊断。故高频次的记录反映了患者病情不稳定或有新发展。相反,低频次记录反映了患者病情稳定。由此例可以看出将事件的时间分布纳入模型对预测有积极意义。循环神经网络由于无法考虑时间分布,为了规避这个问题,它们通常把某个时间跨度下的所有事件归纳为一个大事件(例如把一天均分为4个长度为6小时的时间段,把每个六小时内发生的所有事件整合为一个大事件)以得到一个时间分布均匀的序列。这种处理方法有两个缺点,一是丢弃了频次信息;二是预测点变得稀疏(以上个例子为例,模型一天只有四个预
测点),大大打击了及时预测的能力。
[0005]因此,如何在每个新信息出现的当下都可以实时分析,得到及时、准确地分析结果,成为本领域亟需解决的技术问题。

技术实现思路

[0006]本专利技术的目的是提供一种预警模型训练方法、系统及应用方法、系统,本专利技术能够及时、准确地得到预警信息,进而为医生提供有利的帮助。
[0007]为实现上述目的,本专利技术提供了如下方案:
[0008]一种预警模型训练方法,所述训练方法包括以下步骤:
[0009]获取训练样本集;所述训练样本集包括患者住院过程的电子病历数据和对应的诊断结果,所述电子病历数据包括若干个医学事件,以及每一所述医学事件对应的时间戳,所述医学事件为每一条被电子病历系统记录的信息,所述诊断结果为确诊或非确诊;
[0010]提取每一所述医学事件对应的特征向量,得到事件特征向量;
[0011]提取每一所述医学事件对应的时间戳,得到时间特征向量;
[0012]将每一组所述事件特征向量和对应的所述时间特征向量进行合并,得到若干组合并后的特征向量;
[0013]基于Transformer Encoder结构构建预警模型;
[0014]按时间戳的顺序将所述患者住院过程的电子病历数据对应的若干组合并后的特征向量分别输入所述预警模型;
[0015]根据所述预警模型的输出和所述患者住院过程的电子病历数据对应的诊断结果,确定损失函数;
[0016]根据所述损失函数优化所述预警模型的参数,以对所述预警模型进行训练,得到训练好的预警模型。
[0017]可选的,所述提取每一所述医学事件对应的特征向量,得到事件特征向量,具体包括:
[0018]判断所述医学事件是否为实验室报告之外的事件,得到判断结果;所述实验室报告之外的事件包括个人信息、体温、影像学检查、手术信息和用药信息;
[0019]若所述判断结果为是,则采用以下公式计算所述医学事件的事件特征向量:
[0020]F
c
=Wc
[0021]其中,F
c
为事件特征向量,W为Embedding层的参数,c为医学事件对应的高维稀疏向量;
[0022]若所述判断结果为否,则采用以下公式计算所述医学事件的事件特征向量:
[0023]F
c
=σ(W[F
test_item
|F
result
]+b)
[0024]其中,F
c
为事件特征向量,W为Embedding层的参数,σ为leaky ReLU层的参数,F
test_item
为实验室检测项目的向量表示,F
result
为实验室检测项目结果的向量表示,b为线性变换的参数。
[0025]可选的,所述提取每一所述医学事件对应的时间戳,得到时间特征向量,具体包括:
[0026]对每一所述医学事件的时间戳进行编码,得到与所述事件特征向量相同维度的时
间特征向量。
[0027]可选的,所述损失函数的计算公式为:
[0028]L=0.05
×
L
(1)
+0.2
×
L
(2)
+L
(3)
+0.0001
×
L
reg
[0029]其中,L为损失函数,L
(1)
为第1层transformer模块的mini

batch的损失函数,L
(2)
为第2层transformer模块的mini

batch的损失函数,L
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预警模型训练方法,其特征在于,所述训练方法包括以下步骤:获取训练样本集;所述训练样本集包括患者住院过程的电子病历数据和对应的诊断结果,所述电子病历数据包括若干个医学事件,以及每一所述医学事件对应的时间戳,所述医学事件为每一条被电子病历系统记录的信息,所述诊断结果为确诊或非确诊;提取每一所述医学事件对应的特征向量,得到事件特征向量;提取每一所述医学事件对应的时间戳,得到时间特征向量;将每一组所述事件特征向量和对应的所述时间特征向量进行合并,得到若干组合并后的特征向量;基于Transformer Encoder结构构建预警模型;按时间戳的顺序将所述患者住院过程的电子病历数据对应的若干组合并后的特征向量分别输入所述预警模型;根据所述预警模型的输出和所述患者住院过程的电子病历数据对应的诊断结果,确定损失函数;根据所述损失函数优化所述预警模型的参数,以对所述预警模型进行训练,得到训练好的预警模型。2.根据权利要求1所述的一种预警模型训练方法,其特征在于,所述提取每一所述医学事件对应的特征向量,得到事件特征向量,具体包括:判断所述医学事件是否为实验室报告之外的事件,得到判断结果;所述实验室报告之外的事件包括个人信息、体温、影像学检查、手术信息和用药信息;若所述判断结果为是,则采用以下公式计算所述医学事件的事件特征向量:F
c
=Wc其中,F
c
为事件特征向量,W为Embedding层的参数,c为医学事件对应的高维稀疏向量;若所述判断结果为否,则采用以下公式计算所述医学事件的事件特征向量:F
c
=σ(W[F
test_item
|F
result
]+b)其中,F
c
为事件特征向量,W为Embedding层的参数,σ为leaky ReLU层的参数,F
test_item
为实验室检测项目的向量表示,F
result
为实验室检测项目结果的向量表示,b为线性变换的参数。3.根据权利要求1所述的一种预警模型训练方法,其特征在于,所述提取每一所述医学事件对应的时间戳,得到时间特征向量,具体包括:对每一所述医学事件的时间戳进行编码,得到与所述事件特征向量相同维度的时间特征向量。4.根据权利要求1所述的一种预警模型训练方法,其特征在于,所述损失函数的计算公式为:L=0.05
×
L
(1)
+0.2
×
L
(2)
+L
(3)
+0.0001
×
L
reg
其中,L为损失函数,L
(1)
为第1层transformer模块的mini

batch的损失函数,L
(2)
为第2层transformer模块的mini

batch的损失函数,L
(3)
为第3层transformer模块的mini

batch的损失函数,L
reg
为L2正则化;第l层transformer模块的mini

batch的损失函数的计算公式
为:L
(l)
为第l层transformer模块的mini

batch的损失函数,l=1,2,3,B为mini

batch中的样本数量,y
p
为患者的真实的标签,为预警模型的预测,N

p
为不同时间戳的数量。5.一种预警模型应用方法,其特征在于,所述应用方法包括以下步骤:获取患者当前住院过程的电子病历数据,所述电子病历数据包括若干个医学事件,以及每一所述医学事件对应的时间戳,所述医学事件为每一条被电子病历系统记录的信息;将所述患者当前住院过程的电子病历数据按时间戳的顺序输入预警模型,得到预测结果,所述预警模型为根据权利要求1

4任一项所述的一种预警模型训练方法训练好的模型;判断所述预测结果是否超过预设阈值;若是,则发出预警信号。6.一种预警模型训练系统,其特征在于,所述训练系统包括:训练样本集获取单元,用于获取训练样本集;所述训练样本集包括患者住院过...

【专利技术属性】
技术研发人员:戴璐韬李子孝杨昕沈海鹏王拥军李昊姜勇赵性泉林琳
申请(专利权)人:首都医科大学附属北京天坛医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1