一种基于疾病二分类器的辅助诊断模型的诊断方法技术

技术编号：29931596 阅读：17 留言：0更新日期：2021-09-04 19:00

本发明专利技术公开了一种基于疾病二分类器的辅助诊断模型的诊断方法，包括如下步骤：S1：数据预处理；S2：模型训练；S3：诊断预测。本发明专利技术将诊断预测定义为文本分类任务，即对于一个输入的患者EHR，提取其中的主诉，现病史，影像学等信息，通过训练多个疾病的二分类器（BiLSTM+Self

全部详细技术资料下载

【技术实现步骤摘要】
一种基于疾病二分类器的辅助诊断模型的诊断方法

[0001]本专利技术属于医学
，具体涉及一种基于疾病二分类器的辅助诊断模型的诊断方法。

技术介绍

[0002]随着医疗信息化的发展，电子病历（EHR）的数量和规模不断增加，形成了一个巨大的电子数据库，综合了各种各样的临床信息。因此，利用人工智能方法挖掘EHR数据中的信息已经成为了潜在的有力工具，有助于疾病诊断和管理。作为辅助医生进行临床决策的一个工具，辅助诊断利用机器学习技术从EHR文本中提取患者临床相关信息（主诉，现病史，影像学等），模拟医生的临床推理，以准确预测患者的诊断。
[0003]辅助诊断可视作自然语言处理（NLP）领域的一个任务，相当于一个文本多标签分类问题（输入患者的电子病历，输出患者对应的多个诊断标签），因此目前的辅助诊断模型主要基于多标签分类模型。但多标签分类模型存在类标数量不确定，以及类标之间关系模糊（比如一些疾病之间难以区分）的问题。针对以上的问题，我们提出将一个多标签分类问题转换为多个二分类问题。

技术实现思路

[0004]本专利技术的目的在于提供一种基于疾病二分类器的辅助诊断模型的诊断方法，将一个多标签分类问题转换为多个二分类问题，对于每个疾病，利用BERT+GMM选择合适的负样本，训练多个疾病的二分类器，在进行预测的时候，将患者EHR依次通过这些分类器，将每个分类器输出的标签进行综合得到最终的多标签诊断预测结果，以解决上述
技术介绍
中所提出的问题。
[0005]为实现上述目的，本专利技术提供以下技术方案：一...

【技术保护点】

【技术特征摘要】
1.一种基于疾病二分类器的辅助诊断模型的诊断方法，其特征在于：包括如下步骤：S1：数据预处理，电子病历数据包含完整的临床信息，对电子病历数据进行预处理，形成样本数据集；S2：模型训练：S2.1：对于任意一种个疾病，将该疾病的样本作为分类模型的正样本，并通过BERT+GMM的方式筛选合适的负样本，将样本的临床信息的特征合并，作为模型的输入；S2.2：将原始文本输入词嵌入层，得到词向量；S2.3：将词向量输入双向长短期记忆网络，得到隐状态表示；S2.4：将隐藏状态输入自注意力层，得到整个文本的表示，并通过全连接层输出预测结果；S2.5：模型的输出为softmax之后的结果，...

【专利技术属性】
技术研发人员：叶方全，陈逸龙，
申请(专利权)人：重庆鹏康大数据有限公司广州天鹏计算机科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人