病历质检方法、装置和存储介质制造方法及图纸

技术编号:33303847 阅读:12 留言:0更新日期:2022-05-06 12:12
一种病历质检方法、装置和存储介质,该方法包括:获取待检病历,待检病历包括病历内容和诊断结果,诊断结果包括至少一种疾病的名称;针对病历内容提取特征,得到第一特征;针对诊断结果中包括的每种疾病,获取疾病对应的典型病历的特征,得到第二特征;针对诊断结果中包括的每种疾病,将疾病对应的典型病历的第二特征与第一特征进行相似度计算,以确定疾病是否与病历内容相关,从而确定诊断结果中是否包括与病历内容不相关的疾病名称。本申请以待检病历中的原始诊断结果为依据,获取原始诊断结果中包括的疾病的典型病历,将其与待检病历上的病历内容进行相似性比对,根据比对结果能够自动判断诊断多写情况。自动判断诊断多写情况。自动判断诊断多写情况。

【技术实现步骤摘要】
病历质检方法、装置和存储介质


[0001]本申请涉及智能医疗
,更具体地涉及一种病历质检方法、 装置和存储介质。

技术介绍

[0002]DRGs(Diagnosis Related Groups,疾病诊断相关分组)付费是医 保支付改革的重要手段,其基本思路是根据住院病历的病案首页中的 主要诊断、其他诊断、主要手术、其他手术以及患者的基本信息,为 疾病分到诊断相关分组。根据每个组预设的权重系数,乘上预先制定 的费率,就是医保报销的金额。
[0003][0004][0005]针对诊断多写的质检问题,现有的主流方法是依靠人工质检,原 因是该任务整体上还是比较难的,需要对各类疾病的症状、检查检验、 用药、手术等情况都有基本的认识,还需要翻阅整本住院病历,核查 前后情况,才能得出结论。因此现行质检手段基本是通过科室内三级 诊疗法内部检查,即主治医师、主任医师或副主任医师、科室主任逐 级检查,或者是医院质检科的质检人员进行专门核查。
[0006]人工质检的缺点是显而易见的,首先因为住院病历内容非常多, 因此平均执行一份病历的诊断多写质检大概需要20分钟;其次是需 要质检人对各个科室的疾病都能有基本的了解和认识,因为合并症和 并发症可能脱离于患者所住科室,因此需要质检人员对全科疾病都有 基本认识;最后人工质检容易造成相互包庇的行为,例如若医院主导 的质检,很有可能医生到科室到质检员层级都会有纵容包庇的行为, 反而不客观真实。

技术实现思路

[0007]为了解决上述问题而提出的了本申请。根据本申请一方面,提供 了一种病历质检方法,所述方法包括:获取待检病历,所述待检病历 包括病历内容和诊断结果,所述诊断结果包括至少一种疾病的名称; 针对所述病历内容提取特征,得到第一特征;针对所述诊断结果中包 括的每种疾病,获取所述疾病对应的典型病历的特征,得到第二特征; 针对所述诊断结果中包括的每种疾病,将所述疾病对应的典型病历的 所述第二特征与所述第一特征进行相似度计算,以确定所述疾病是否 与所述病历内容相关,从而确定所述诊断结果中是否包括与所述病历 内容不相关的疾病名称。
[0008]在本申请的一个实施例中所述获取所述疾病对应的典型病历的 特征,得到第二特征,包括:获取所述疾病对应的多个典型病历各自 的特征,得到多个第二特征;所述将所述疾病对应的典型病历的所述 第二特征与所述第一特征进行相似度计算,以确定所述疾病是否与所 述病历内容相关,包括:将所述第一特征与每个所述第二特征进行相 似度计算,得到多个相似度得分;计算所述多个相似度得分的平均值 和/或获取所述多个相似度得分中的最大值;当所述平均值大于第一 阈值和/或所述最大值大于第二阈值时,确定所
述疾病与所述病历内 容相关。
[0009]在本申请的一个实施例中所述方法是基于训练好的神经网络来 执行的,所述神经网络为自监督学习和有监督学习联合训练的端到端 框架,所述自监督学习包括典型病历的特征学习,所述有监督学习包 括典型病历与非典型病历之间的特征相似度学习。
[0010]在本申请的一个实施例中所述神经网络采用焦点损失函数(focalloss)来实现所述联合训练,其中所述焦点损失函数是基于所述自监 督学习和所述有监督学习这两者各自的损失函数和这两者各自的性 能指标而设计的。
[0011]在本申请的一个实施例中所述自监督学习的训练集包括原始样 本、正样本和负样本,其中:所述原始样本包括典型病历样本;所述 正样本包括所述典型病历样本的复制样本;所述负样本包括与所述典 型病历样本对应不同疾病的其他典型病历样本的随机采样样本。
[0012]在本申请的一个实施例中,所述原始样本与所述正样本构成正相 关表证对,所述原始样本与所述负样本构成负相关表正对;所述自监 督学习的损失函数是基于如下原则设计的:使得所述正相关表证对的 表征距离越来越近,所述负相关表征对的表征距离越来越远;所述自 监督学习的性能指标包括所述原始样本与所述正样本的相似度得分 减去所述原始样本与所述负样本的相似度得分的结果。
[0013]在本申请的一个实施例中所述神经网络为带随机丢弃(dropout) 机制的神经网络,所述典型病历样本和所述典型病历样本的复制样本 分别输入到所述神经网络,基于所述随机丢弃机制,得到所述原始样 本和所述正样本。
[0014]在本申请的一个实施例中所述非典型病历对应多种疾病,作为多 个标签,所述有监督学习将所述多种疾病中每种疾病对应的所述典型 病历的原始样本与所述非典型病历的样本进行特征相似性计算,得到 所述非典型病历的样本对应的疾病类型的预测结果;所述有监督学习 的损失函数是基于如下原则设计的:针对所述多个标签中的每个标签: 当所述预测结果正确时,生成第一损失函数值;当所述预测结果错误 时,生成第二损失函数值,所有损失函数值加权求和以用于更新所述 神经网络的参数,其中所述第一损失函数值小于所述第二损失函数值。
[0015]在本申请的一个实施例中所述神经网络为图神经网络,所述图神 经网络基于如下方式为所述病历内容构图:预处理得到所述病历内容 的特征单词,将特征单词表示为节点,将所述特征单词之间的共现关 系表示边,通过点互信息计算得到边上权重,从而得到所述病历内容 的带权图。
[0016]根据本申请另一方面,提供了一种病历质检方法,所述方法包括: 获取待检病历,并将所述待检病历输入到训练好的神经网络,其中, 所述待检病历包括病历内容和诊断结果,所述诊断结果包括至少一种 疾病的名称;所述神经网络为自监督学习和有监督学习联合训练的端 到端框架,所述自监督学习包括典型病历的特征学习,所述有监督学 习包括典型病历与非典型病历之间的特征相似度学习;基于所述神经 网络针对所述病历内容提取特征,并针对所述诊断结果中包括的每种 疾病,将所述疾病对应的典型病历的特征与所述病历内容的特征进行 相似度计算,以确定所述疾病是否与所述病历内容相关,从而确定所 述诊断结果中是否包括与所述病历内容不相关的疾病名称。
[0017]在本申请的一个实施例中,所述神经网络采用焦点损失函数 (focal loss)来实
现所述联合训练,其中所述焦点损失函数是基于所 述自监督学习和所述有监督学习这两者各自的损失函数和这两者各 自的性能指标而设计的。
[0018]根据本申请再一方面,提供了一种病历质检装置,所述装置包括: 病历获取模块,用于获取待检病历,所述待检病历包括病历内容和诊 断结果,所述诊断结果包括至少一种疾病的名称;特征提取模块,用 于针对所述病历内容提取特征,得到第一特征;相似性计算模块,用 于针对所述诊断结果中包括的每种疾病,获取所述疾病对应的典型病 历的特征,得到第二特征;并针对所述诊断结果中包括的每种疾病, 将所述疾病对应的典型病历的所述第二特征与所述第一特征进行相 似度计算,以确定所述疾病是否与所述病历内容相关,从而确定所述 诊断结果中是否包括与所述病历内容不相关的疾病名称。
[0019]根据本申请又一方面,提供了一种病历质本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种病历质检方法,其特征在于,所述方法包括:获取待检病历,所述待检病历包括病历内容和诊断结果,所述诊断结果包括至少一种疾病的名称;针对所述病历内容提取特征,得到第一特征;针对所述诊断结果中包括的每种疾病,获取所述疾病对应的典型病历的特征,得到第二特征;针对所述诊断结果中包括的每种疾病,将所述疾病对应的典型病历的所述第二特征与所述第一特征进行相似度计算,以确定所述疾病是否与所述病历内容相关,从而确定所述诊断结果中是否包括与所述病历内容不相关的疾病名称。2.根据权利要求1所述的方法,其特征在于,所述获取所述疾病对应的典型病历的特征,得到第二特征,包括:获取所述疾病对应的多个典型病历各自的特征,得到多个第二特征;所述将所述疾病对应的典型病历的所述第二特征与所述第一特征进行相似度计算,以确定所述疾病是否与所述病历内容相关,包括:将所述第一特征与每个所述第二特征进行相似度计算,得到多个相似度得分;计算所述多个相似度得分的平均值和/或获取所述多个相似度得分中的最大值;当所述平均值大于第一阈值和/或所述最大值大于第二阈值时,确定所述疾病与所述病历内容相关。3.根据权利要求1所述的方法,其特征在于,所述方法是基于训练好的神经网络来执行的,所述神经网络为自监督学习和有监督学习联合训练的端到端框架,所述自监督学习包括典型病历的特征学习,所述有监督学习包括典型病历与非典型病历之间的特征相似度学习。4.根据权利要求3所述的方法,其特征在于,所述神经网络采用焦点损失函数来实现所述联合训练,其中所述焦点损失函数是基于所述自监督学习和所述有监督学习这两者各自的损失函数和这两者各自的性能指标而设计的。5.根据权利要求4所述的方法,其特征在于,所述自监督学习的训练集包括原始样本、正样本和负样本,其中:所述原始样本包括典型病历样本;所述正样本包括所述典型病历样本的复制样本;所述负样本包括与所述典型病历样本对应不同疾病的其他典型病历样本的随机采样样本。6.根据权利要求5所述的方法,其特征在于,所述原始样本与所述正样本构成正相关表证对,所述原始样本与所述负样本构成负相关表正对;所述自监督学习的损失函数是基于如下原则设计的:使得所述正相关表证对的表征距离越来越近,所述负相关表征对的表征距离越来越远;所述自监督学习的性能指标包括所述原始样本与所述正样本的相似度得分减去所述原始样本与所述负样本的相似度得分的结果。7.根据权利要求5所述的方法,其特征在于,所述神经网络为带随机丢弃机制的神经网络,所述典型病历样本和所述典型病历样本的复制样本分别输入到所述神经网络,基于所述随机丢弃机制,得到所述原始样本和所述正样本。8.根据权利要求4所述的方法,其特征在于,所述非典型病历对应多种疾病,作为多个标签,所述有监督学习将所述多种疾病中每种疾病对应的所述典型病历的原始样本与所述
非典型病历的样本进行特征相似性计算,得到所述非典型病历的样本对应的疾病类型的预测结果;所述有监督学习的损失函数是基于如下原则设计的:针对所述多个标签中的每个标签:当所述预测结果正确时,生成第一损失函数值;当所述预测结果错误时,生成第二损失函数值,所有损失函数值加权求和以用于更新所述神经网络的参数,...

【专利技术属性】
技术研发人员:尤心心刘喜恩
申请(专利权)人:北京惠及智医科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1