当前位置: 首页 > 专利查询>之江实验室专利>正文

一种知识与数据协同驱动的不平衡临床数据分类系统技术方案

技术编号:38346585 阅读:8 留言:0更新日期:2023-08-02 09:26
本发明专利技术公开了一种知识与数据协同驱动的不平衡临床数据分类系统,包括:患者图谱构建模块,用于从患者电子病历数据中提取医学概念集合,基于医学概念集合和对应的关系集合构建患者图谱;患者表示获取模块,使用图卷积网络从患者图谱中提取含图结构信息的知识特征,融合知识特征和数据特征,得到患者表示;患者临床分类结果获取模块,将患者表示输入至临床数据分类模型中,所述临床数据分类模型由一个门控网络和多个专家网络组成,将患者表示同时输入到门控网络和各专家网络,其中门控网络为每个专家网络分配不同的患者权重,各专家网络基于患者权重分别输出分类结果;对每个专家网络输出的分类结果进行组合,获得患者临床分类结果。果。果。

【技术实现步骤摘要】
一种知识与数据协同驱动的不平衡临床数据分类系统


[0001]本专利技术属于临床风险预测领域,尤其涉及一种知识与数据协同驱动的不平衡临床数据分类系统、介质。

技术介绍

[0002]近年来,在使用临床数据进行临床风险预测的任务中,通过注意力机制将医学本体的知识注入到深度学习模型中,为输入数据提供补充信息。基于图的注意力模型(Graph

based Attention Model, GRAM)采用循环神经网络(Recurrent neural network, RNN)对临床数据建模,利用医学本体作为知识图谱,通过图注意力机制在训练阶段提供补充信息。诊断预测共注意记忆网络(Co

Attention Memory networks for diagnosis Prediction, CAMP)利用增强RNN模型和知识图谱来提高诊断预测的准确性。然而,这些基于注意力机制的研究仅利用了知识图谱中疾病诊断的层级或分类信息,未能充分利用完整医学知识图谱中所包含的各类医学概念及其复杂关系。同时,在真实的临床场景中,医生需综合患者的症状、体征、检查结果、临床治疗及预后等多维度临床特征进行临床决策,上述研究仅使用疾病诊断,和真实世界的医生决策依据有着很大差异。
[0003]同时,在真实世界临床数据中,临床数据类别不平衡是一个非常普遍的问题。传统的数据不平衡处理方法有重采样(欠采样、过采样)和重加权(采用加权损失函数),但这些方法可能会因为对少数类的过拟合,导致预测结果的不准确。在图分类方面,当前的大多数图神经网络模型(Graph Neural Network, GNN)都忽略了这个问题,在不平衡的临床数据集上进行图分类,少数类的分类结果预测能力远远落后于多数类。除了偏向多数类的学习偏差外,图结构的多样性也会导致临床数据不平衡问题在图分类上更加严重。

技术实现思路

[0004]针对现有技术不足,本专利技术提供了一种知识与数据协同驱动的不平衡临床数据分类系统、介质。
[0005]根据本专利技术实施例的第一方面,提供了一种知识与数据协同驱动的不平衡临床数据分类系统,其特征在于,所述系统包括:
[0006]患者图谱构建模块,用于从患者电子病历数据中提取医学概念集合,基于医学概念集合和对应的关系集合构建患者图谱;
[0007]患者表示获取模块,使用图卷积网络从患者图谱中提取含图结构信息的知识特征,基于注意力机制融合知识特征和数据特征,得到患者表示;其中,数据特征为患者电子病历数据中提取医学概念集合对应的原始取值进行标准化后得到的向量;
[0008]患者临床分类结果获取模块,将患者表示输入至临床数据分类模型中,所述临床数据分类模型由一个门控网络和多个专家网络组成,将患者表示同时输入到门控网络和各专家网络,其中门控网络为每个专家网络分配不同的患者权重,各专家网络基于患者权重分别输出分类结果;对每个专家网络输出的分类结果进行组合,获得患者临床分类结果。
[0009]根据本专利技术实施例的第二方面,提供了一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现以下方法:
[0010]从患者电子病历数据中提取医学概念集合,基于医学概念集合和对应的关系集合构建患者图谱;
[0011]使用图卷积网络从患者图谱中提取含图结构信息的知识特征,基于注意力机制融合知识特征和数据特征,得到患者表示;其中,数据特征为患者电子病历数据中提取医学概念集合对应的原始取值进行标准化后得到的向量;
[0012]将患者表示输入至临床数据分类模型中,所述临床数据分类模型由一个门控网络和多个专家网络组成,将患者表示同时输入到门控网络和各专家网络,其中门控网络为每个专家网络分配不同的患者权重,各专家网络基于患者权重分别输出分类结果;对每个专家网络输出的分类结果进行组合,获得患者临床分类结果。
[0013]根据本专利技术实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现以下方法:
[0014]从患者电子病历数据中提取医学概念集合,基于医学概念集合和对应的关系集合构建患者图谱;
[0015]使用图卷积网络从患者图谱中提取含图结构信息的知识特征,基于注意力机制融合知识特征和数据特征,得到患者表示;其中,数据特征为患者电子病历数据中提取医学概念集合对应的原始取值进行标准化后得到的向量;
[0016]将患者表示输入至临床数据分类模型中,所述临床数据分类模型由一个门控网络和多个专家网络组成,将患者表示同时输入到门控网络和各专家网络,其中门控网络为每个专家网络分配不同的患者权重,各专家网络基于患者权重分别输出分类结果;对每个专家网络输出的分类结果进行组合,获得患者临床分类结果。
[0017]与现有技术相比,本专利技术的有益效果为:本专利技术提供了一种知识与数据协同驱动的不平衡临床数据分类系统,本专利技术结合医学知识图谱和患者临床数据,构建患者图谱,可以有效融合医学知识和电子病历数据,在临床数据不平衡的情况下充分利用完整医学知识图谱中所包含的各类医学概念及其关系信息。本专利技术利用注意力机制有效融合知识特征和数据特征,生成鲁棒的患者表示,用于临床风险预测,提高患者临床分类结果的准确性。
附图说明
[0018]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本专利技术实施例提供的知识与数据协同驱动的不平衡临床数据分类系统的示意图;
[0020]图2为本专利技术实施例提供的患者图谱构建过程的示意图;
[0021]图3为本专利技术实施例提供的图卷积网络结构的示意图;
[0022]图4为本专利技术实施例提供的混合专家网络结构的示意图;
[0023]图5为本专利技术实施例提供的患者图谱的示意图;
[0024]图6为本专利技术实施例提供的一种电子设备的示意图。
具体实施方式
[0025]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0026]需要说明的是,在不冲突的情况下,下述的实施例及实施方式中的特征可以相互组合。
[0027]如图1所示,本专利技术实施例提供了一种知识与数据协同驱动的不平衡临床数据分类系统,所述系统包括:患者图谱构建模块、患者表示获取模块、患者临床分类结果获取模块。
[0028]所述患者图谱构建模块用于从患者电子病历数据中提取医学概念集合,基于医学概念集合和对应的关系集合构建临床数据分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识与数据协同驱动的不平衡临床数据分类系统,其特征在于,所述系统包括:患者图谱构建模块,用于从患者电子病历数据中提取医学概念集合,基于医学概念集合和对应的关系集合构建患者图谱;患者表示获取模块,使用图卷积网络从患者图谱中提取含图结构信息的知识特征,基于注意力机制融合知识特征和数据特征,得到患者表示;其中,数据特征为患者电子病历数据中提取医学概念集合对应的原始取值进行标准化后得到的向量;患者临床分类结果获取模块,将患者表示输入至临床数据分类模型中,所述临床数据分类模型由一个门控网络和多个专家网络组成,将患者表示同时输入到门控网络和各专家网络,其中门控网络为每个专家网络分配不同的患者权重,各专家网络基于患者权重分别输出分类结果;对每个专家网络输出的分类结果进行组合,获得患者临床分类结果。2.根据权利要求1所述的知识与数据协同驱动的不平衡临床数据分类系统,其特征在于,从患者电子病历数据中提取医学概念集合,基于医学概念集合和对应的关系集合构建患者图谱包括:构建医学知识图谱,记为,其中,表示医学概念集合,表示关系集合;使用医学知识图谱中所包含的医学概念作为关注特征,从患者的电子病历数据提取结构化数据,得到患者对应的医学概念集合;从医学知识图谱中提取患者对应的医学概念集合对应的节点及邻居节点和节点之间的关系,标注关系类别,构建患者图谱,;其中, ,,。3.根据权利要求2所述的知识与数据协同驱动的不平衡临床数据分类系统,其特征在于,医学概念包括诊断、药物、实验室检验结果、手术操作;关系包括父子关系、治疗关系、因果关系和相关关系。4.根据权利要求1所述的知识与数据协同驱动的不平衡临床数据分类系统,其特征在于,使用图卷积网络从患者图谱中提取含图结构信息的知识特征,基于注意力机制融合知识特征和数据特征,得到患者表示包括:获取患者图谱对应的节点特征矩阵和患者图谱对应的节点邻接矩阵;将患者电子病历数据中提取医学概念集合对应的原始取值进行标准化后得到的向量记为数据特征;将节点特征矩阵、节点邻接矩阵和数据特征输入至图卷积网络,经多次图卷积层操作后,进行全局平均池化后,得到知识特征;对知识特征和数据特征进行数据拼接,将拼接后的向量输入注意力模块,得到每个特征的注意力权重;将知识特征和数据特征中的每个特征乘以对应的注意力权重后,再次进行数据拼接,得到患者表示。5.根据权利要求4所述的知识与数据协同驱动的不平衡临床数据分类系统,其特征在于,节点特征矩阵的维度为,是患者图谱中节点的数量,是医学知识图谱中节点的数量;节点邻接矩阵的维度为,用患者对应的关系集合中的关系构建。
6.根据权利要求5所述的知识与数据协同驱动的不平衡临床数据分类系统,其特征在于,患者图谱中的每个节点的特征用节点的独热编码来表示。7.根据权利要求1所述的知识与数...

【专利技术属性】
技术研发人员:李劲松池胜强李雪瑶王宇清周天舒
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1