脓毒症实时预警的神经网络模型、方法和电子设备技术

技术编号:37706526 阅读:12 留言:0更新日期:2023-06-01 23:55
本申请公开了一种脓毒症实时预警的神经网络模型、方法和电子设备,采用了一种新的神经网络模型由此进行脓毒血症的预警,该神经网络模型综合了双向时序循环网络和注意力机制,能够将特征缺失值的数值回归预测任务以及序列点结局分类预测任务,在一次训练中同时进行,无需将回归和分类任务拆分成两个独立任务分别独立训练,提高模型开发效率,减轻部署难度;该算法充分利用相同特征在不同时序点的关联性以及不同特征在相同时序点上的关联性,并对这两种关联性进行数学建模,以提高算法预测性能。在正反两个方向分别增加注意力机制模块,大幅消除长序列预测功能丧失的问题。大幅消除长序列预测功能丧失的问题。大幅消除长序列预测功能丧失的问题。

【技术实现步骤摘要】
脓毒症实时预警的神经网络模型、方法和电子设备


[0001]本申请涉及到医学检测
,具体涉及一种脓毒症实时预警的神经网络模型、方法、装置、存储介质和电子设备。

技术介绍

[0002]脓毒症是一种由机体对感染反应异常引起的危及生命的器官功能障碍,在全球范围内,其影响的人群达数百万之多,其中三分之一到六分之一的人死于此病。
[0003]通常使用SIRS、SOFA和qSOFA等临床方法别脓毒症,但存在如下瑕疵:(1)临床方法存在主观误判风险,其准确度与临床医生专业素养及经验强相关;(2)临床方法不具备实时预警功能,临床医生需要一系列复杂的定性及定量记录及检测才能完成一次评估,每日最多可完成2~3次。(3)临床方法不具备早期预警功能,临床方法确定潜在患者为脓毒症患者的时刻落后于患者罹患脓毒症的临界时刻,已经不存在疾病预警期,患者失去规避疾病发生的机会。
[0004]相比临床方法,以机器学习为主导的脓毒症判别算法是一种完全数字驱动的决策系统,一种全天候的实时预警系统,一种可自定义预警期的早期预警系统。Li等在Li X, Xu X, Xie F, Xu X, Sun Y, Liu X, Jia X, Kang Y, Xie L, Wang F, Xie G. A Time

Phased Machine Learning Model for Real

Time Prediction of Sepsis in Critical Care. Crit Care Med. 2020 Oct;48(10):e884

e888. doi: 10.1097/CCM.0000000000004494. PMID: 32931194中使用lightGBM算法可以提前6小时实时预测出患者是否患有脓毒症,性能指标AUC达到0.845。 需要说明的是该方法采用的脓毒症数据集来自真实医疗环境的时序化数据,其多数特征缺失率达80%以上,数据的时序化以及高缺失率是脓毒症数据的显著特点,也是创建机器学习算法的难点。对于时序化数据,lightGBM并不是最佳选择,lightGBM处理时序化样本数据时,默认相同特征在不同时序点上相互独立,这显然与实际不符。另外,在处理缺失值时,该方法并未对空值插值,大量的空值会降低模型预测准确度。在与临床医生探讨中发现,医生不仅关注预测结果,更注重缺失值的估计,某些特定时间戳上的缺失值很可能是造成脓毒症发生的主因。针对该算法存在的问题,Cao等在W. Cao, D. Wang, J. Li, H. Zhou, L. Li, Y. Li, BRITS: Bidirectional recurrent imputation for time series, in: Adv. Neural Inf. Process. Syst.31, 2018, pp. 6774

6784.中提出的BRITS算法可以解决时序化数据插值和时序特征关联性建模等问题。BRITS实质是双向循环神经网络,它认为相同特征在不同时间戳上的值存在关联性,并充分利用这种关系提高了算法预测性能,同时它使用循环神经网络完成缺失值的估计,进一步提高算法预测性能。然而循环神经网络在处理较长序列数据时,容易出现梯度消失,这将导致未来多个时序点上训练停止,失去预测功能。采用双向循环神经网络可以小幅度抵消梯度消失问题,但效果不明显。

技术实现思路

[0005]本申请实施例提供了一种脓毒症实时预警的神经网络模型、方法和电子设备,用于解决现有技术中对脓毒血症预测不准确的技术问题。
[0006]本申请的一个方面,提供了一种脓毒症实时预警的神经网络模型,包括:数据处理模块,用于根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据;编码器模块,用于根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态;注意力机制模块,用于在每个所述顺序方向上根据所有时序点的隐藏状态、所有第一译码器输入进行注意力机制调节获得注意力机制输出;译码器模块,用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;求和模块,用于将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出;回归输出模块,用于根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据;分类输出模块,用于根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果。
[0007]进一步的,在本专利技术中,所述遮蔽数据中第t个时序点的第d个变量的遮蔽值为;所述时间间隔数据中第t个时序点的第d个变量的值为,其中,为第t个时序点的变量观测数据对应的时间戳。
[0008]进一步的,在本专利技术中,所述隐藏状态的获得方法包括:在按照时序点排列的从前向后的顺序上,建立时序点t对应的输出端衰减函数;其中,,H为单个时序点对应隐藏单元的个数,D为所述变量观测数据中变量种类的数量;均为输出端衰减函数的待定系数、且的初始值均由高斯分布抽样确定;为所述时间间隔数据中时序点t的时间间隔向量,;
时序点t对应的隐藏状态;其中,为矩阵取内积符号,代表纵向拼接;,默认初始值由高斯分布抽样确定;,为第t 个序列点对应的遮蔽向量且 ,为sigmoid激活函数;B,C,d均为隐藏状态的待定系数、且B,C,d初始值均由高斯分布抽样确定;为完成最终插值后的值,;在按照时序点排列的从后向前的顺序上,建立时序点t对应的输出端衰减函数;其中,,均为输出端衰减函数H的待定系数、且初始值均由高斯分布抽样确定;按照时序点排列的从前向后的顺序建立时序点t对应的隐藏状态;其中,,默认初始值由高斯分布抽样确定;;均为隐藏状态的待定系数、且初始值均由高斯分布抽样确定。
[0009]进一步的,在本专利技术中,所述每个顺序方向上各有一个注意力机制模块,所述每个注意力机制模块包括第一全连接层、第一softmax层和加权求和模块;所述注意力机制输出的获得方法包括:将所有时序点的隐藏状态、所有时序点的第一译码器的输入,输入至所述第一全连接层获得第一全连接层的输出;将所述第一全连接层的输出,输入至所述第一softmax层后得到所述第一softmax层输出;将所有时序点的隐藏状态和第一全连接层的输出在所述加权求和模块中进行矩阵运算后获得注意力机制输出。
[0010]进一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.脓毒症实时预警的神经网络模型,其特征在于,包括:数据处理模块,用于根据监测得到的每个时序点的变量观测数据,获得每个时序点的遮蔽数据以及每个时序点的时间间隔数据;编码器模块,用于根据所述每个时序点的变量观测数据、所述每个时序点的遮蔽数据、每个时序点的时间间隔数据以及每个时序点的前一时序点的隐藏状态按照时序点排列的从前向后的顺序和按照时序点排列的从后向前的顺序分别获得上述两个顺序方向上每个时序点的隐藏状态;注意力机制模块,用于在每个所述顺序方向上根据所有时序点的隐藏状态、所有第一译码器输入进行注意力机制调节获得注意力机制输出;译码器模块,用于在每个所述顺序方向上根据所述每个时序点的第一译码器输入和每个时序点的第二译码器输入获得每个时序点的译码器输出;在按照时序点排列的从前向后的顺序上,所述每个时序点的第一译码器输入为前一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;在按照时序点排列的从后向前的顺序上,所述每个时序点的第一译码器输入为后一时序点的译码器输出,所述每个时序点的第二译码器输入为所述每个时序点的注意力机制输出;求和模块,用于将所述两个顺序方向上获得的同一时序点的译码器输出进行加权求和获得每个时序点的输出;回归输出模块,用于根据所述每个时序点的输出获得所述每个时序点的插值以代替对应时序点上缺失的变量观测数据;分类输出模块,用于根据所述每个时序点的输出获得所述每个时序点发生脓毒血症的预测分类结果。2.根据权利要求1所述的模型,其特征在于:所述遮蔽数据中第t个时序点的第d个变量的遮蔽值为;所述时间间隔数据中第t个时序点的第d个变量的值为,其中,为第t个时序点的变量观测数据对应的时间戳。3.根据权利要求2所述的模型,其特征在于:所述隐藏状态的获得方法包括:在按照时序点排列的从前向后的顺序上,建立时序点对应的输出端衰减函数;其中,,H为单个时序点对应隐藏单元的个数,D为所述变量观测数据中变量种类的数量;均为输出端衰减函数的待定系数、且的初始值均由高斯分布抽样确定;为所述时间间隔数据中时序点t的时间间隔向量,;时序点t对应的隐藏状态;
其中,为矩阵取内积符号,代表纵向拼接;,默认初始值由高斯分布抽样确定;,为第t 个序列点对应的遮蔽向量且 ,为sigmoid激活函数;B,C,d均为隐藏状态的待定系数、且B,C,d初始值均由高斯分布抽样确定;为完成最终插值后的值,;在按照时序点排列的从后向前的顺序上,建立时序点t对应的输出端衰减函数;其中,均为输出端衰减函数的待定系数、且初始值均由高斯分布抽样确定;按照时序点排列的从前向后的顺序建立时序点t对应的隐藏状态;其中,,默认初始值由高斯分布抽样确定;均为隐藏状态的待定系数、且初始值均由高斯分布抽样确定。4.根据权利要求1所述的模型,其特征在于:所述每个顺序方向上各有一个注意力机制模块,所述每个注意力机制模块包括第一全连接层、第一softmax层和加权求和模块;所述注意力机制输出的获得方法包括:将所有时序点的隐藏状态、所有时序点的第一译码器的输入,输入至所述第一全连接层获得第一全连接层的输出;将所述第一全连接层的输出,输入至所述第一softmax层后得到所述第一softmax层输出;将所有时序点的隐藏状态和第一全连接层的输出在所述加权求和模块中进行矩阵运算后获得注意力机制输出。5.根据权利要求4所述的模型,其特征在于:按照时序点排列的从前向后的顺序上,所述时序点的译码器输出为;其中,,W和b均为译码器输出的待定系数且W和b均使用高斯分布抽样初始化,为按照时序点排列的从前向后的顺序上的时序点t的注意力机制输出,;按照时序点排列的从后向前的顺序上,所述时序点的译码器输出为;其中,均为译码器输出的待定系数且均使用高斯分布抽样初始化,为按照时序点排列的从前向后的顺序上的...

【专利技术属性】
技术研发人员:陈虎涂燕晖姚振杰程海博陈一昕
申请(专利权)人:江苏未来网络集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1