当前位置: 首页 > 专利查询>山西大学专利>正文

一种基于异构EHR网络表示学习的药物推荐方法及系统技术方案

技术编号:38902646 阅读:10 留言:0更新日期:2023-09-22 14:21
本发明专利技术公开了一种基于异构EHR网络表示学习的药物推荐方法及系统,涉及人工智能及数字医疗技术领域,该方法首先根据EHR历史病历数据集构建与病人、药物相关的关系图,通过复杂关系图表示模型进行信息聚合,将异构EHR网络中的局部和全局结构信息融合到医疗实体向量表示中,提高医疗实体向量表示的质量及EHR历史病历数据集的利用率;接着,应用基于RNN的方法编码病人的时序就诊数据实现药物推荐。系统包括计算机处理器、EHR历史病历数据集存储单元、图数据处理单元、复杂关系图表示模型训练单元及药物推荐单元,通过这个系统能够更好地利用医疗实体间的复杂关系及EHR历史病历数据集的时序性,提高药物推荐的准确性和可靠性。提高药物推荐的准确性和可靠性。提高药物推荐的准确性和可靠性。

【技术实现步骤摘要】
一种基于异构EHR网络表示学习的药物推荐方法及系统


[0001]本专利技术涉及人工智能及数字医疗
,特别涉及一种基于异构EHR网络表示学习的药物推荐方法及系统。

技术介绍

[0002]随着计算机技术迅速发展,硬件性能的提升、存储容量的增加和网络技术的普及,医疗信息化系统逐渐普及,海量的医学数据被记录在电子系统中,如病人的个人信息、诊断记录、处方用药、医疗操作记录、化验检查结果等等,形成了电子健康记录(Electronic Health Record,EHR),提高了医疗信息的可访问性和安全性。EHR数据具有纵向医疗信息全面、数据共享性好的优点,建模EHR中病人信息的药物推荐方法可以根据病人的临床信息预测其所需的药物,辅助医生进行个性化的药物选择,监测疗效并调整治疗方案。然而,基于EHR数据进行病人用药预测的任务仍然面临着许多挑战:(1)病人病历中包含着疾病诊断代码、药物代码、手术治疗代码、生理指标等各种类型的数据,具有数据类型多,概念之间关系繁杂,维度高等特点,传统深度学习方法对这些医学概念的表示存在稀疏性;(2)预测的药物组合中药物相互作用程度严重,用药安全性缺失;(3)病人多次就诊的病历呈现出强烈的非均衡性,大多数方法缺乏对病历时序特性的学习。实际上,EHR数据中诊断、药物等医疗实体中蕴含着丰富的语义信息,医疗实体之间又隐含着不容忽略的关联性,因此,研究人员开始探索如何使用图表示学习方法对EHR数据进行深层次的分析和利用。
[0003]EHR数据主要由病人个人信息、诊断信息和处方信息构成。在图表示学习领域,异构网络可以凭借其建模多类型实体及关系的特性有效地提取这些医疗实体(诊断、药物)的语义信息及医疗实体之间的结构信息。元路径作为异构网络表示学习中有效的工具之一,常用于表示两个节点之间多种不同类型的路径。对于具有特定模式的网络,可以结合特定的领域知识设计元路径来捕获节点之间不同的语义关系,帮助更好地理解和分析节点之间的关联性。具体来说,EHR数据可以构建为一个包含病人、诊断、药物三类节点和病人

诊断、病人

药物两类边的异构EHR网络,根据元路径病人

诊断

病人、病人

药物

病人可以构建出以病人为节点的同构图,根据元路径药物

病人

药物可以构建出以药物为节点的同构图,通过分析病人的病情以及与药物相关的实体关系,图神经网络可以学习到药物与这些实体之间的复杂关联,进而为每个病人提供个性化的药物推荐,更好地满足病人的特定需求。另外,通过图神经网络分析不同药物之间的相互作用以及与病人特征之间的关系,能够识别出可能导致副作用或不良反应之间的药物组合,并提供更安全的药物选择。
[0004]近来,结合图表示学习方法进行药物推荐的方法主要使用循环神经网络来编码时序EHR数据,附加图模型编码药物之间的关系来增强药物表示,而没有对不同医疗实体之间的结构信息加以利用,这导致图表示模型提取到的向量表示缺乏重要的关联信息,造成信息丢失,并且医疗实体间的关系可以帮助模型更好地理解病人的病情和需求,通过考虑病人、诊断、药物之间的关系,推荐系统可以提供更准确、个性化的药物推荐,反之则可能造成推荐结果不够准确,无法满足病人的具体需求,增加病人的治疗风险。因此,如何对EHR数据
中不同医疗实体之间的复杂关系进行有效的提取,是帮助医生提供更个性化的治疗方案,减少药物副作用,实现药物精准推荐的关键问题。

技术实现思路

[0005]本专利技术的目的是,提供一种基于异构EHR网络表示学习的药物推荐方法及系统。通过分析病人、诊断、药物的属性信息及其之间的复杂结构关系,该方法及系统能够捕获医疗实体在异构EHR网络中的语义以及医疗实体之间的关联、交互和影响,学习到更丰富、准确的医疗实体向量表示,帮助理解病人的病情和需求,进而提供更准确、个性化的药物推荐结果,同时避免不适当的药物组合,降低治疗风险。
[0006]使用图表示方法对EHR数据进行分析,通过图卷积操作将关系结构数据转换为低维的向量表示,该分析过程分为两步:(1)使用预处理后的EHR数据集训练一个学习医疗实体向量表示的图表示模型;(2)依据病人时序就诊数据,使用第(1)步中训练得到的图表示模型提取医疗实体的向量表示,并使用该向量表示进行药物推荐。
[0007]为实现上述目的,本专利技术提供如下技术方案:
[0008]本专利技术提供了一种基于异构EHR网络表示学习的药物推荐方法。首先,EHR数据预处理环节依次通过去除缺失值、去除重复值和排序操作对病历数据进行预处理,得到EHR历史病历数据集;接着在复杂关系图表示模型构建和优化环节中,构建并初始化复杂关系图表示模型、学习医疗实体的向量表示、计算损失、训练模型、确定复杂关系图表示模型的参数;获取复杂关系图表示模型构建和优化环节中训练得到的复杂关系图表示模型,进行药物推荐环节为病人推荐药物。本专利技术的主要参数包括:优化器参数、迭代次数,其中优化器参数包括学习率、权重衰减率,迭代次数用于设置复杂关系图表示模型训练的结束条件。该方法包括以下步骤:
[0009]S1、预处理历史病历数据,提取历史病历数据中病人对应的诊断、药物信息,得到EHR历史病历数据集;
[0010]S2、根据步骤S1中得到的EHR历史病历数据集构建异构EHR网络,利用不同类型的元路径构建与病人、药物相关的关系图;构建病人

诊断、病人

药物交互图;
[0011]S3、构建并初始化复杂关系图表示模型;
[0012]S4、使用步骤S1中得到的EHR历史病历数据集通过Adam优化器以随机梯度下降的方式对步骤S3中构建的复杂关系图表示模型进行训练,确定复杂关系图表示模型的训练参数,获取复杂关系图表示模型;
[0013]S5、依据步骤S1中的预处理方法对病人的时序就诊数据进行预处理,使用步骤S4中获取的复杂关系图表示模型,提取医疗实体的向量表示,应用医疗实体的向量表示进行药物推荐。
[0014]进一步,步骤S1具体包括以下步骤:
[0015]S11、基于异构EHR网络表示学习的药物推荐方法中设计了一个复杂关系图表示模型来提取EHR历史病历数据集中医疗实体的向量表示,为了更充分地训练复杂关系图表示模型,本专利技术首先对历史病历数据进行预处理,依次进行去除缺失值、去除重复值和排序操作,得到EHR历史病历数据集,该EHR历史病历数据集中包括病人的诊断过程和用药记录;
[0016]S12、根据预处理得到的EHR历史病历数据集,生成诊断编号与对应ICD

9编码组成
的诊断字典信息、药物编号与对应NDC编码组成的字典信息,另外,将EHR历史病历数据集与药物相互作用知识库(DDIs)相结合,提取出EHR历史病历数据集中所有药物之间存在的相互作用关系。
[0017]进一步,所述步骤S2具体包括以下步骤:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于异构EHR网络表示学习的药物推荐方法,其特征在于,包括以下步骤:S1、预处理病历数据,提取历史病历数据中病人对应的诊断、药物信息,得到EHR历史病历数据集;S2、根据步骤S1中得到的EHR历史病历数据集构建异构EHR网络,利用不同类型的元路径构建与病人、药物相关的关系图;构建病人

诊断、病人

药物交互图;S3、构建并初始化复杂关系图表示模型;S4、使用步骤S1中得到的EHR历史病历数据集通过Adam优化器以随机梯度下降的方式对步骤S3中的复杂关系图表示模型进行训练,确定复杂关系图表示模型的训练参数,获取复杂关系图表示模型;S5、依据步骤S1中的预处理方法对病人的时序就诊数据进行预处理,使用步骤S4中获取的复杂关系图表示模型,提取医疗实体的向量表示,应用医疗实体的向量表示进行药物推荐。2.根权利要求1所述的一种基于异构EHR网络表示学习的药物推荐方法,其特征在于,所述步骤S1具体包括以下步骤:S11、对历史病历数据进行预处理,依次进行去除缺失值、去除重复值和排序操作,得到EHR历史病历数据集,该EHR历史病历数据集中包括病人的诊断过程和用药记录;S12、根据预处理得到的EHR历史病历数据集,生成诊断编号与对应ICD

9编码组成的诊断字典信息、药物编号与对应NDC编码组成的字典信息,另外,将EHR历史病历数据集与药物相互作用知识库相结合,提取出EHR历史病历数据集中所有药物之间存在的相互作用关系。3.根据权利要求2所述的一种基于异构EHR网络表示学习的药物推荐方法,其特征在于,所述步骤S2具体包括以下步骤:S21、将病人、诊断、药物作为节点,病人

诊断关系、病人

药物关系作为连边,将EHR历史病历数据集构建为异构EHR网络,记作其中表示节点集合,表示病人节点集合,表示诊断节点集合,表示药物节点集合,ε表示边集合,包括病人

诊断类型R
d
的连边集合、病人

药物类型R
m
的连边集合;S22、构建与病人、药物相关的关系图:将病人、诊断、药物节点类型分别记作V
p
、V
d
、V
m
,根据元路径病人

诊断

病人构建病人

病人交互图ε
pdp
表示对应的病人

诊断

病人连边集合;根据元路径病人

药物

病人构建病人

病人交互图ε
pmp
表示对应的病人

药物

病人连边集合;根据EHR历史病历数据集判断任意两种药物是否同时存在于同一个药物组合中,即药物共现关系,构建药物共现图其中ε
mpm
表示存在共现关系的药物之间的连边;将步骤S12中提取出的EHR历史病历数据集中所有药物之间存在的相互作用关系,构建药物相互作用图的EHR历史病历数据集中所有药物之间存在的相互作用关系,构建药物相互作用图其中,ε
mm
表示存在相互作用关系的药物之间的连边,以上构建的图G
pdp
、G
pmp
、G
mpm
、G
mm
对应的邻接矩阵为A
pdp
、A
pmp
、A
mpm
、A
mm
;S23、依据异构EHR网络,基于边类型构建病人

诊断交互图其
中,表示包含病人类型节点、诊断类型节点的节点集合,ε
pd
表示病人

诊断连边集合,病人

诊断交互矩阵为A
pd
;基于边类型构建病人

药物交互图G
pm
=(ν
pm

pm
),其中v
pm
表示包含病人类型节点、药物类型节点的节点集合,ε
pm
表示病人

药物连边集合,病人

药物交互矩阵为A
pm
。4.根据权利要求3所述的一种基于异构EHR网络表示学习的药物推荐方法,其特征在于,所述步骤S3具体包括以下步骤:S31、随机初始化病人、诊断、药物节点的向量表示E
(p)
、E
(d)
、E
(m)
,构建局部结构信息聚合网络,具体为:局部结构信息聚合网络为两层轻量型的图卷积网络,以用于编码多种类型节点之间的关系来丰富节点向量表示,对于病人

诊断交互图,首先计算每个病人节点和诊断节点的度,得到度矩阵D
(p)
和D
(d)
,再对病人

诊断交互矩阵A
pd
进行归一化操作,计算方式为对于病人

药物交互图,首先计算每个病人节点和药物节点的度,得到度矩阵D
(p)
和D
(m)
,再对病人

药物交互矩阵A
pm
进行归一化操作,计算方式为进行归一化操作,计算方式为S32、利用步骤S31中构建的局部结构信息聚合网络聚合不同类型的节点信息和结构信息,以递归地方式更新节点的向量表示,对于病人

诊断交互图,其计算方式如式(1)、(2)所示:示:其中,l表示轻量型图卷积网络层的索引,和分别表示第l层的病人和诊断节点的向量表示,当l=0时,上标p
d
表示该病人表示来自病人

诊断交互图,T表示矩阵的转置操作;同理,对于病人

药物交互图,根据式(3)、(4)得到病人、药物的表示:的表示:其中,上标p
m
表示该病人表示是来自病人
‑<...

【专利技术属性】
技术研发人员:白亮张海君杜航原
申请(专利权)人:山西大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1