一种基于增强图时空卷积网络的处方药预测模型制造技术

技术编号:37154166 阅读:17 留言:0更新日期:2023-04-06 22:14
本发明专利技术属于计算机应用技术领域,公开了一种基于增强图时空卷积网络的处方药预测模型,包括数据预处理模块、医学实体嵌入模块、空间结构增强模块、时序关系递进模块、缓存结构增强模块和模型的训练与优化模块;本发明专利技术可以充分捕捉患者病历数据的结构相关性和时间连续性特征。在结构相关性方面,本发明专利技术提出建立全局性医学实体关系图,应用图注意力神经网络对目标特征进行学习,有效的建立起了各医学实体之间的内部相关性。同时,本发明专利技术将膨胀卷积结合残差链接应用于时序部分,在大幅度降低训练参数的前提下,提高了训练结果的准确率,更好的捕获了时序特征。在此基础上,本发明专利技术又使用了缓存机制来进一步提高了模型的推荐准确率。了缓存机制来进一步提高了模型的推荐准确率。了缓存机制来进一步提高了模型的推荐准确率。

【技术实现步骤摘要】
一种基于增强图时空卷积网络的处方药预测模型


[0001]本专利技术属于计算机应用
,尤其涉及一种基于增强图时空卷积网络的处方药预测模型。

技术介绍

[0002]随着现代医学的不断深入发展,医学大数据的数据量以近乎两年翻一番的速度增长。为了使医学大数据的产生和更新速度迎合现代医疗的实时需要,对医学数据的挖掘应用不可避免成为了当前生物医学大数据的重要研究任务。其中,基于电子病历的处方药预测方法是深度学习和数据挖掘技术在生物医学大数据研究领域的重要应用,它可以根据患者历史的病情变化、诊断过程和推荐用药情况,结合当前的诊断为患者推荐用药。有效的辅助了医生制定安全有效的处方,进一步提高了医药处方的协同性和安全性。但处方药预测由于其复杂的结构相关性和时间连续性,一直是一项具有挑战性的任务。
[0003]1)结构相关性
[0004]患者的历史电子病历可以看作是多段医疗过程的集合。而一次医疗过程又可以看作是一次诊断、治疗、用药推荐的集合。对于每一次医疗过程,它可能诊断出多种并发症,进行多种相关手术,使用多种共性药物,而这其中恰恰存在着内部的相互联系。例如,对于病情特点,消化性溃疡尝尝伴随着胃穿孔,水痘常与丹毒并发。对于药物的使用情况,他汀类与心血管药物配合使用更有助于冠心病的康复等。诊断、治疗、处方中的医学实体不仅自身内部密切相关,整个过程之间同样存在的密切的结构相关性。
[0005]2)时间连续性
[0006]电子病历是用电子设备保存的数字化医疗记录,它详细的保存了患者近些年的病情变化情况和医疗诊断情况。因此在时间层面上可以看作是多段连续的医疗过程,具备时序相关特征。例如,当一位患者患有糖尿病或心脏病等慢性疾病,其诊断和推荐药物不会有太大变化;当诊断为水痘时,在随后的诊断中可能出现丹毒等并发症。许多相关的医疗事件可能作为时间特征出现在患者的记录中。
[0007]现有的处方药预测方法有很多,包括K

means聚类法、关联规则法、本体语言和专家系统。以上方法有的考虑了疾病之间的相似性,有的考虑了药物之间的相互作用,在一定程度上提高了模型的准确性。但是,这些方法没有充分挖掘医学事件之间的内在相关性,忽略了对时间特征的提取。为了更好地表征结构特征和时序特征,GAMENet引入了图卷积网络(GCN)进行结构建模,并使用增强的记忆神经网络(MANN)捕捉数据的时序特征,在处方药预测领域取得了突破。G

Bert提前对电子病历进行了预训练,通过图卷积网络(GCN)得到了医疗实体分类概念的树状图,加强了对结构特征的学习。这些方法在一定程度上捕捉了一些结构特征和时序特征,但它们并没有关注整个医疗过程动态环境中医学事件之间的关系,因此本质上无法描述结构相关性和时间连续性。

技术实现思路

[0008]本专利技术目的在于提供一种基于增强图时空卷积网络的处方药预测模型,以解决上述的技术问题。
[0009]为解决上述技术问题,本专利技术的一种基于增强图时空卷积网络的处方药预测模型的具体技术方案如下:
[0010]一种基于增强图时空卷积网络的处方药预测模型,包括数据预处理模块、医学实体嵌入模块、空间结构增强模块、时序关系递进模块、缓存结构增强模块和模型的训练与优化模块;
[0011]所述数据预处理模块用于对患者的历史就诊数据和当前就诊情况及用药信息进行结构化处理,构建对应电子病历结构化表示;
[0012]所述医学实体嵌入模块用于对诊断数据和手术状况数据进行医学实体嵌入;
[0013]所述空间结构增强模块用于对诊断事件和手术事件分别构建全局的结构相关图矩阵;
[0014]所述时序关系递进模块使用膨胀卷积结合残差网络代替传统的RNN模型;
[0015]所述缓存结构增强模块,将患者的历史数据通过key

value对的形式存储于缓存中,通过基于注意力的相似性算法对得到的表征向量和缓存内容进行比对链接;
[0016]所述模型的训练与优化模块用于训练和优化基于增强图时空卷积网络的处方药预测模型。
[0017]进一步的,所述数据预处理模块包括执行下列步骤的装置:
[0018]获取患者的电子病历数据,并进行结构化处理;
[0019]患者的电子病历数据表示为时序数据的集合患者的电子病历数据表示为时序数据的集合其中,N代表患者总数,T代表患者的最大就诊次数,对于某个患者的第t次就诊其中包括第t次就诊时的诊断数据手术状况数据推荐用药数据经过结构化处理后,已将具体的医学事件名称进行标准化,转换成了ICD

9诊断编码、ICD

9手术编码和ATC药物编码。
[0020]进一步的,所医学实体嵌入模块包括执行下列步骤的装置:
[0021]对于某个患者的第t次就诊其中诊断数据手术状况数据是由上百位的独热编码构成,对分别做词嵌入,得到嵌入矩阵:其中分别表示第t次就诊时诊断和手术的数量,l表示嵌入矩阵的维度,嵌入公式如下:
[0022][0023]其中W
*,e
表示可学习的权重矩阵,表示诊断数据或手术状况数据,经过医疗实体嵌入,将输入x
t
转换成进一步的,所述空间结构增强模块包括执行下列步骤的装置:
[0024]构建医学事件关系图,获取各医学事件的内部相关性,依据正点互信息PPMI原则,
针对给定患者的诊断数据和手术状况数据分别构建诊断关系图矩阵和手术状况关系图矩阵其中N
d
,N
p
表示整个数据集中的诊断事件总数和手术事件总数,对于具体的医学事件i和事件j的相关性,计算公式如下:
[0025][0026]其中,p(i,j)表示医学事件i和事件j同时发生的概率,p(i),p(j)表示事件i,事件j本身发生的概率;
[0027]使用多头图注意力网络捕获医学事件的结构特征,使嵌入后各医学向量表示能包含具有相关关系的其它向量信息,将诊断关系图矩阵G
d
和手术状况关系图矩阵G
p
作为全局权重矩阵,对于中的每一个子事件用多头注意力机制的方式对其进行图变换,得到结构信息更加丰富的向量表示具体计算公式如下:
[0028][0029]其中,表示经过图变换的子事件的向量表示,由链接而成,K表示多头注意力个数,K=3,σ表示一个非线性的激活函数,使用ReLU函数,N
i
表示与i事件存在相关关系的其他医学事件,W
k
,b
k
表示可学习的权重矩阵和偏置,表示第t次就诊的第k个注意力的权重系数,图注意力网络中的权重系数α
ij
的计算公式如下:
[0030][0031]其中,在表示可学习的前馈神经网络训练向量,W表示可学习的权重矩阵,表示事件*对应的特征向量,||表示链接操作;
[0032]舍弃复杂参数再训练方式,通过构建的诊断关系图矩阵和手术状况关系图矩阵作为公式参数,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于增强图时空卷积网络的处方药预测模型,其特征在于,包括数据预处理模块、医学实体嵌入模块、空间结构增强模块、时序关系递进模块、缓存结构增强模块和模型的训练与优化模块;所述数据预处理模块用于对患者的历史就诊数据和当前就诊情况及用药信息进行结构化处理,构建对应电子病历结构化表示;所述医学实体嵌入模块用于对诊断数据和手术状况数据进行医学实体嵌入;所述空间结构增强模块用于对诊断事件和手术事件分别构建全局的结构相关图矩阵;所述时序关系递进模块使用膨胀卷积结合残差网络代替传统的RNN模型;所述缓存结构增强模块,将患者的历史数据通过key

value对的形式存储于缓存中,通过基于注意力的相似性算法对得到的表征向量和缓存内容进行比对链接;所述模型的训练与优化模块用于训练和优化基于增强图时空卷积网络的处方药预测模型。2.根据权利要求1所述的基于增强图时空卷积网络的处方药预测模型,其特征在于,所述数据预处理模块包括执行下列步骤的装置:获取患者的电子病历数据,并进行结构化处理;患者的电子病历数据表示为时序数据的集合n∈[1,N],t∈[1,T],其中,N代表患者总数,T代表患者的最大就诊次数,对于某个患者的第t次就诊其中包括第t次就诊时的诊断数据手术状况数据推荐用药数据经过结构化处理后,已将具体的医学事件名称进行标准化,转换成了ICD

9诊断编码、ICD

9手术编码和ATC药物编码。3.根据权利要求1所述的基于增强图时空卷积网络的处方药预测模型,其特征在于,所医学实体嵌入模块包括执行下列步骤的装置:对于某个患者的第t次就诊其中诊断数据手术状况数据是由上百位的独热编码构成,对分别做词嵌入,得到嵌入矩阵:其中分别表示第t次就诊时诊断和手术的数量,l表示嵌入矩阵的维度,嵌入公式如下:其中W
*,e
表示可学习的权重矩阵,表示诊断数据或手术状况数据,经过医疗实体嵌入,将输入x
t
转换成4.根据权利要求1所述的基于增强图时空卷积网络的处方药预测模型,其特征在于,所述空间结构增强模块包括执行下列步骤的装置:构建医学事件关系图,获取各医学事件的内部相关性,依据正点互信息PPMI原则,针对给定患者的诊断数据和手术状况数据分别构建诊断关系图矩阵和手术状况关系图矩阵其中N
d
,N
p
表示整个数据集中的诊断事件总数和手术事件总数,对于具体的医学事件i和事件j的相关性,计算公式如下:
其中,p(i,j)表示医学事件i和事件j同时发生的概率,p(i),p(j)表示事件i,事件j本身发生的概率;使用多头图注意力网络捕获医学事件的结构特征,使嵌入后各医学向量表示能包含具有相关关系的其它向量信息,将诊断关系图矩阵G
d
和手术状况关系图矩阵G
p
作为全局权重矩阵,对于中的每一个子事件用多头注意力机制的方式对其进行图变换,得到结构信息更加丰富的向量表示具体计算公式如下:其中,表示经过图变换的子事件的向量表示,由链接而成,K表示多头注意力个数,K=3,σ表示一个非线性的激活函数,使用ReLU函数,N
i
表示与i事件存在相关关系的其他医学事件,W
k
,b
k
表示可学习的权重矩阵和偏置,表示第t次就诊的第k个注意力的权重系数,图注意力网络中的权重系数α
ij
的计算公式如下:其中,在表示可学习的前馈神经网络训练向量,W表示可学习的权重矩阵,表示事件*对应的特征向量,||表示链接操作;舍弃复杂参数再训练方式,通过构建的诊断关系图矩阵和手术状况关系图矩阵作为公式参数,将对的计算简化为:其中,G
*,t
(i,*)表示第t次就诊时关系图矩阵中事件i和事件*的相关关系,具体时刻关系图矩阵...

【专利技术属性】
技术研发人员:陈芳妮王建煜张蕾岳魏琦万健张丽娟王海江黄杰
申请(专利权)人:浙江科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1