一种知识与数据协同驱动的不平衡临床数据分类系统技术方案

技术编号：38346585 阅读：8 留言：0更新日期：2023-08-02 09:26

本发明专利技术公开了一种知识与数据协同驱动的不平衡临床数据分类系统，包括：患者图谱构建模块，用于从患者电子病历数据中提取医学概念集合，基于医学概念集合和对应的关系集合构建患者图谱；患者表示获取模块，使用图卷积网络从患者图谱中提取含图结构信息的知识特征，融合知识特征和数据特征，得到患者表示；患者临床分类结果获取模块，将患者表示输入至临床数据分类模型中，所述临床数据分类模型由一个门控网络和多个专家网络组成，将患者表示同时输入到门控网络和各专家网络，其中门控网络为每个专家网络分配不同的患者权重，各专家网络基于患者权重分别输出分类结果；对每个专家网络输出的分类结果进行组合，获得患者临床分类结果。果。果。

全部详细技术资料下载

【技术实现步骤摘要】
一种知识与数据协同驱动的不平衡临床数据分类系统

[0001]本专利技术属于临床风险预测领域，尤其涉及一种知识与数据协同驱动的不平衡临床数据分类系统、介质。

技术介绍

[0002]近年来，在使用临床数据进行临床风险预测的任务中，通过注意力机制将医学本体的知识注入到深度学习模型中，为输入数据提供补充信息。基于图的注意力模型（Graph
‑
based Attention Model, GRAM）采用循环神经网络（Recurrent neural network, RNN）对临床数据建模，利用医学本体作为知识图谱，通过图注意力机制在训练阶段提供补充信息。诊断预测共注意记忆网络（Co
‑
Attention Memory networks for diagnosis Prediction, CAMP)利用增强RNN模型和知识图谱来提高诊断预测的准确性。然而，这些基于注意力机制的研究仅利用了知识图谱中疾病诊断的层级或分类信息，未能充分利用完整医学知识图谱中所包含的各类医学概念及其复杂关系。同时，在真实的临床场景中，医生需综合患者的症状、体征、检查结果、临床治疗及预后等多维度临床特征进行临床决策，上述研究仅使用疾病诊断，和真实世界的医生决策依据有着很大差异。
[0003]同时，在真实世界临床数据中，临床数据类别不平衡是一个非常普遍的问题。传统的数据不平衡处理方法有重采样（欠采样、过采样）和重加权（采用加权损失函数），但这些方法可能会因为对少数类的过拟合，导致预测结果的不准确。在图分类方面，...

【技术保护点】

【技术特征摘要】
1.一种知识与数据协同驱动的不平衡临床数据分类系统，其特征在于，所述系统包括：患者图谱构建模块，用于从患者电子病历数据中提取医学概念集合，基于医学概念集合和对应的关系集合构建患者图谱；患者表示获取模块，使用图卷积网络从患者图谱中提取含图结构信息的知识特征，基于注意力机制融合知识特征和数据特征，得到患者表示；其中，数据特征为患者电子病历数据中提取医学概念集合对应的原始取值进行标准化后得到的向量；患者临床分类结果获取模块，将患者表示输入至临床数据分类模型中，所述临床数据分类模型由一个门控网络和多个专家网络组成，将患者表示同时输入到门控网络和各专家网络，其中门控网络为每个专家网络分配不同的患者权重，各专家网络基于患者权重分别输出分类结果；对每个专家网络输出的分类结果进行组合，获得患者临床分类结果。2.根据权利要求1所述的知识与数据协同驱动的不平衡临床数据分类系统，其特征在于，从患者电子病历数据中提取医学概念集合，基于医学概念集合和对应的关系集合构建患者图谱包括：构建医学知识图谱，记为，其中，表示医学概念集合，表示关系集合；使用医学知识图谱中所包含的医学概念作为关注特征，从患者的电子病历数据提取结构化数据，得到患者对应的医学概念集合；从医学知识图谱中提取患者对应的医学概念集合对应的节点及邻居节点和节点之间的关系，标注关系类别，构建患者图谱，；其中，，，。3.根据权利要求2所述的知识与数据协同驱动的不平衡临床数据分类系统，其特征在于，医学概念包括诊断、药物、实验室检验结果、手术操作；关系包括父子关系、治疗关系、因果关系和相关关系。4.根据权利要求1所述的知识与数据协同驱动的不平衡临床数据分类系统，其特征在于，使用图卷积网络从患者图谱中提取含图结构信息的知识特征，基于注意力机制融合知识特征和数据特征，得到患者表示包括：获取患者图谱对应的节点特征矩阵和患者图谱对应的节点邻接矩阵；将患者电子病历数据中提取医学概念集合对应的原始取值进行标准化后得到的向量记为数据特征；将节点特征矩阵、节点邻接矩阵和数据特征输入至图卷积网络，经多次图卷积层操作后，进行全局平均池化后，得到知识特征；对知识特征和数据特征进行数据拼接，将拼接后的向量输入注意力模块，得到每个特征的注意力权重；将知识特征和数据特征中的每个特征乘以对应的注意力权重后，再次进行数据拼接，得到患者表示。5.根据权利要求4所述的知识与数据协同驱动的不平衡临床数据分类系统，其特征在于，节点特征矩阵的维度为，是患者图谱中节点的数量，是医学知识图谱中节点的数量；节点邻接矩阵的维度为，用患者对应的关系集合中的关系构建。
6.根据权利要求5所述的知识与数据协同驱动的不平衡临床数据分类系统，其特征在于，患者图谱中的每个节点的特征用节点的独热编码来表示。7.根据权利要求1所述的知识与数...

【专利技术属性】
技术研发人员：李劲松，池胜强，李雪瑶，王宇清，周天舒，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人