当前位置: 首页 > 专利查询>厦门大学专利>正文

一种基于深度学习的ICU患者电子病历分析方法及系统技术方案

技术编号:29333320 阅读:27 留言:0更新日期:2021-07-20 17:51
本发明专利技术涉及一种基于深度学习的ICU患者电子病历分析方法及系统,包括:接收输入的ICD编码和药物向量,并将ICD编码和药物向量分别输入两个多层感知机,生成两个维度大小相同的隐藏层,并计算出两个隐藏层的相关性;基于初始化的稀疏系数,用KL散度计算稀疏系数和自编码器的中间层激活后神经元的平均激活程度的距离,并放入到损失函数;将隐藏层作为自编码器的中间层,使用一个多层感知机进行解码,输出包括多种药物的药方;基于初始化的加权矩阵,对输出的药方进行加权,将多开的药物作为药物损失放入损失函数。本发明专利技术通过获取患者ICD编码与药方的映射关系,挖掘出药物间的潜在关联,并给出推荐,具有较高的可靠性。

【技术实现步骤摘要】
一种基于深度学习的ICU患者电子病历分析方法及系统
本专利技术涉及信息智能化领域,特别涉及一种基于深度学习的ICU患者电子病历分析方法及系统。
技术介绍
随着当今大数据和医疗病例电子化的推进。越来越多的病人信息和电子病历数据被存入医疗系统和数据库。并且随着人工智能领域的快速发展和服务器算力的不断提高,现在已经有能力去研究这些数据的分布和特征,进而对辅助临床诊断,药方推荐和健康管理等方面提供帮助。最近,电子病历(electronichealthrecord)渐渐成为研究的热点。EHR数据以其丰富的信息量吸引了大量学者对其进行研究,例如,有学者利用EHR数据构建医疗知识图谱。这种图谱将不同情形,数据,进行整理,并开发出智能化医疗诊断和辅助决策这样的系统,供医疗工作者们使用。这样的系统可以记录患者的患病信息和身体状况,甚至可以挖掘其中的病因和潜在的问题。另外,将深度学习和EHR数据结合的研究主要在于以下三个方面:信息提取(informationextraction),表征学习(Representinglearning)和临床预测(clinicalPrediction)。在表征学习中,除了常用的Word2Vec,Glove等NLP中常用的词向量嵌入工具,还有专门针对病人信息进行的嵌入方法,例如Choi等人提出的嵌入结构。对于信息提取方面,由于数据量的巨大,人工处理会耗费大量的时间和成本,在此背景下,针对EHR数据的信息提取工具Valx应运而生。临床预测就是将病人的信息例如体征,检测数据等输入模型,然后模型给出相应的病情诊断,比较著名的模型有DoctorAI。表征学习是将病人的ICD编码和相应的药物做有效的表征,利于模型学习。临床预测是在与以较高的准确率去预测该病人的药方。本文将该工作量化为一个多标记分类问题,旨在根据数据分布特点,利用合理的模型作出可靠的预测。多标记分类模型的发展已经演化出了很多模型,例如经典的BinaryRelevance,他的方法是将数据标记视作独立,用多个二分类器的集成解决问题。ClassifierChain(CC)是将多标记分类问题转化为一个链式分类问题,在一定程度上考虑到了标记之间的依赖性。LabelPowerset(LP)是将所有标签的组合排列出来,将问题转化为一个多分类问题,但是药方数据标签数量巨大,LP的时间复杂度将会难以估量。还有学者提出了基于决策树和支持向量机的多标记分类算法,Multi-labeldecisiontree,Rank-SVM等。另外,还有学者利用RNN探索标记间的相关性。例如GuibinChen等人提出的CNN_RNN网络,用CNN提取图片或文本信息,用RNN考虑标记的相关性并做分类。探索标记间的相关性是多标记分类十分重视的一个方面,该方面处理的好坏会直接影响分类器的性能和效果。传统的多标记分类模型虽然时间复杂度低,但是难以探索标记间隐藏的联系。即使是有些模型考虑到了标记之间的联系,但是其考虑的方式可结实性和合理性欠妥。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种基于深度学习的ICU患者电子病历分析方法及系统,基于电子病历(electronichealthrecord)数据训练出一种准确率高的多标记分类模型,能够输出包括多种药物的药方。本专利技术解决其技术问题所采用的技术方案是:一方面,一种基于深度学习的ICU患者电子病历分析方法,包括:S101,接收输入的ICD编码和药物向量,并将ICD编码和药物向量分别输入两个多层感知机,生成两个维度大小相同的隐藏层,并计算出两个隐藏层的相关性;S102,基于初始化的稀疏系数,用KL散度计算稀疏系数和自编码器的中间层激活后神经元的平均激活程度的距离,并放入到损失函数;S103,将隐藏层作为自编码器的中间层,使用一个多层感知机进行解码,输出包括多种药物的药方;S104,基于初始化的加权矩阵,对输出的药方进行加权,将多开的药物作为药物损失放入损失函数。优选的,所述S101中,ICD编码通过独立热编码one-hot嵌入后再进行词向量嵌入作为输入;所述药物向量为one-hot编码,实现病情到药物的映射。优选的,所述S101中,计算出两个隐藏层的相关性,如下:其中,f1和f2分别表示两个隐藏层的神经网络;X1和X2分别表示两个神经网络的输入;θ1和θ2分别表示两个神经网络的网络参数。优选的,所述S102中,用KL散度计算稀疏系数和自编码器的中间层激活后神经元的平均激活程度的距离,具体如下:其中,AESPARSELoSS表示稀疏系数ρ和自编码器的中间层激活后神经元的平均激活程度的距离;S2表示神经元个数。优选的,所述S104中,药物损失的计算方式如下:WEIGHTLOSS=-Σrelu(output-true_label)其中,Weightloss表示药物损失;relu表示线性整流函数;output表示输出的药方;true_label表示真实的药方标签。优选的,所述损失函数的表示如下:MODELLOSS=α*DCCALOSS+β*AESPARSELOSS+η*WEIGHTLOSS其中,MODELLOSS表示总损失;DCCALOSS表示自编码器的损失;α、β和η分别表示对应的权重系数。另一方面,一种基于深度学习的ICU患者电子病历分析系统,包括:相关性获取模块,接收输入的ICD编码和药物向量,并将ICD编码和药物向量分别输入两个多层感知机,生成两个维度大小相同的隐藏层,并计算出两个隐藏层的相关性;距离获取模块,基于初始化的稀疏系数ρ,用KL散度计算稀疏系数ρ和自编码器的中间层激活后神经元的平均激活程度的距离,并放入到损失函数;药方输出模块,将隐藏层作为自编码器的中间层,使用一个多层感知机进行解码,输出包括多种药物的药方;药方损失获取模块,基于初始化的加权矩阵,对输出的药方进行加权,将多开的药物作为药物损失放入损失函数。根据本专利技术的实施例,本专利技术具有如下有益效果:(1)本专利技术利用疏稀自编码器来挖掘标记之间的多重相关性,稀疏自编码器利用神经元直接探索标记间的相关性,避免了链式结构或RNN结构的局限,并且该方法的时间复杂度远低于训练多个基分类器的时间复杂度,所述疏稀自编码器的损失函数除包括自编码器本身的损失外,还包括用KL散度计算稀疏系数ρ和自编码器的中间层激活后神经元的平均激活程度的距离;(2)本专利技术的基于深度学习的ICU患者病历分析方法使用多标记分类模型,所述多标记分类模型利用深度典型相关分析DCCA和疏稀自编码器同时进行嵌入,学习出一个隐空间LatentSpace(隐藏层),再利用解码器进行解码;这样的好处是可以更为直接的探索标签之间的关系,并且做出分类。还有一个好处是药物的种类过多导致数据非常稀疏,利用疏稀自编码器的嵌入方式便于使输出稀疏化;(3)本专利技术为了切合临床开方的实际情况,优化了损失函数,减少本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的ICU患者电子病历分析方法,其特征在于,包括:/nS101,接收输入的ICD编码和药物向量,并将ICD编码和药物向量分别输入两个多层感知机,生成两个维度大小相同的隐藏层,并计算出两个隐藏层的相关性;/nS102,基于初始化的稀疏系数,用KL散度计算稀疏系数和自编码器的中间层激活后神经元的平均激活程度的距离,并放入到损失函数;/nS103,将隐藏层作为自编码器的中间层,使用一个多层感知机进行解码,输出包括多种药物的药方;/nS104,基于初始化的加权矩阵,对输出的药方进行加权,将多开的药物作为药物损失放入损失函数。/n

【技术特征摘要】
1.一种基于深度学习的ICU患者电子病历分析方法,其特征在于,包括:
S101,接收输入的ICD编码和药物向量,并将ICD编码和药物向量分别输入两个多层感知机,生成两个维度大小相同的隐藏层,并计算出两个隐藏层的相关性;
S102,基于初始化的稀疏系数,用KL散度计算稀疏系数和自编码器的中间层激活后神经元的平均激活程度的距离,并放入到损失函数;
S103,将隐藏层作为自编码器的中间层,使用一个多层感知机进行解码,输出包括多种药物的药方;
S104,基于初始化的加权矩阵,对输出的药方进行加权,将多开的药物作为药物损失放入损失函数。


2.根据权利要求1所述的基于深度学习的ICU患者电子病历分析方法,其特征在于,所述S101中,ICD编码通过独立热编码one-hot嵌入后再进行词向量嵌入作为输入;所述药物向量为one-hot编码,实现病情到药物的映射。


3.根据权利要求1所述的基于深度学习的ICU患者电子病历分析方法,其特征在于,所述S101中,计算出两个隐藏层的相关性,如下:



其中,f1和f2分别表示两个隐藏层的神经网络;X1和X2分别表示两个神经网络的输入;θ1和θ2分别表示两个神经网络的网络参数。


4.根据权利要求1所述的基于深度学习的ICU患者电子病历分析方法,其特征在于,所述S102中,用KL散度计算稀疏系数和自编码器的中间层激活后神经元的平均激活程度的距离,具体如下:






其中,AESPARSELOSS表...

【专利技术属性】
技术研发人员:杨帆梁云帆林开标赖永炫姚毅虹
申请(专利权)人:厦门大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1