门诊主诊断错误病历筛选方法和系统技术方案

技术编号:32361635 阅读:24 留言:0更新日期:2022-02-20 03:29
本发明专利技术提供了一种门诊主诊断错误病历筛选方法和系统,包括:获取待筛选病历集合中每个病历中的所有实体;实体包括:症状、疾病和体征;基于每个病历的主诊断,计算每个病历下的每个实体的权重值;基于权重值,在待筛选病历集合中筛选出主诊断错误的第一病历集合;第一病历集合为每个实体的权重值均小于预设阈值的病历的集合。本发明专利技术缓解了现有技术中存在的对主诊断错误的病历的筛选准确度较低的技术问题。问题。问题。

【技术实现步骤摘要】
门诊主诊断错误病历筛选方法和系统


[0001]本专利技术涉及病历筛选
,尤其是涉及一种门诊主诊断错误病历筛选方法和系统。

技术介绍

[0002]随着电子病历系统在医疗机构的迅速普及,大量医疗相关的重要信息以电子形式存储于医疗信息系统中。经过不断积累,各种形式的电子化医疗系统产生了体量庞大的医疗大数据。这些数据记录了临床医疗中的重要信息。例如,病人的主诉,现病史,检查检验和诊断等。近些年随着人工智能的发展,我们能够从电子病历中挖掘有效信息实现智能医疗的相关应用。其中最常见的应用包括根据病历内容推荐诊断和治疗方案,或者推荐出患者的主诊断和可挂号科室等。
[0003]然而医院内每天门诊的就诊数量较大,医生书写电子病历的工作量也很大。早期由于缺少病历内涵质控等原因,很多门诊病历诊断书写错误或不规范,且门诊诊断与住院病历的首页诊断不同,并没有经过病案课的编目,所以这些错误并没有被及时地更正。后期使用大数据治理门诊历史病历时只能根据医生当时填写的诊断顺序来标记诊断的序号,书写在第一位的即为本次就诊的主诊断。这样就会导致很多错误主诊断与门诊病历描述信息不符合的病历。目前基于患者的诊断与治疗方案推荐应用中,很多应用都是推荐的主诊断与主诊断的治疗方案。因此如果将这些主诊断错误的病历做为学习集将会影响到推荐的精准度。
[0004]现有技术中有基于聚类方法的错误标签筛选方法,然而因为历史电子病历数量庞大且患者的病情信息较为复杂,相似的患者主诊断很可能也会不一样,因此,聚类的精准度也会较低,进而导致了对主诊断错误的病历的筛选准确度也较低的技术问题。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种门诊主诊断错误病历筛选方法和系统,以缓解现有技术中存在的对主诊断错误的病历的筛选准确度较低的技术问题。
[0006]第一方面,本专利技术实施例提供了一种门诊主诊断错误病历筛选方法,包括:获取待筛选病历集合中每个病历中的所有实体;所述实体包括:症状、疾病和体征;基于所述每个病历的主诊断,计算所述每个病历下的每个实体的权重值;基于所述权重值,在所述待筛选病历集合中筛选出主诊断错误的第一病历集合;所述第一病历集合为每个实体的权重值均小于预设阈值的病历的集合。
[0007]进一步地,获取待筛选病历集合中每个病历中的所有实体,包括:基于自然语言处理方法,从所述待筛选病历集合中每个病历的主诉信息和现病史信息中获取所述实体。
[0008]进一步地,基于所述每个病历的主诊断,计算所述每个病历下的每个实体的权重值,包括:通过如下算式计算所述权重值:IMPT
NB
=log(p(x
i
=1|y
j
=1))

log(p(x
i
=1|y
j
=0));IMPT
NB
为所述权重值,log(p(x
i
=1|y
j
=1))为出现主诊断y
j
条件下具有实体x
i
的对数
概率值,log(p(x
i
=1|y
j
=0))为不出现主诊断y
j
条件下具有实体x
i
的对数概率值。
[0009]进一步地,在所述待筛选病历集合中筛选出主诊断错误的第一病历集合之后,所述方法还包括:基于预设相似度算法,从预设病历库中确定与目标病历的相似度超过预设相似度阈值的病历的集合,得到第二病历集合;所述目标病历为所述第一病历集合中的病历;判断所述目标病历的主诊断与所述第二病历集合中出现次数最多的主诊断是否一致;如果是,则确定所述目标病历为正常病历;如果否,则确定所述目标病历为门诊主诊断错误病历。
[0010]第二方面,本专利技术实施例还提供了一种门诊主诊断错误病历筛选系统,包括:获取模块,计算模块和筛选模块;其中,所述获取模块,用于获取待筛选病历集合中每个病历中的所有实体;所述实体包括:症状、疾病和体征;所述计算模块,用于基于所述每个病历的主诊断,计算所述每个病历下的每个实体的权重值;所述筛选模块,用于基于所述权重值,在所述待筛选病历集合中筛选出主诊断错误的第一病历集合;所述第一病历集合为每个实体的权重值均小于预设阈值的病历的集合。
[0011]进一步地,所述获取模块,还用于:基于自然语言处理方法,从所述待筛选病历集合中每个病历的主诉信息和现病史信息中获取所述实体。
[0012]进一步地,所述计算模块,还用于:通过如下算式计算所述权重值:IMPT
NB
=log(p(x
i
=1|y
j
=1))

log(p(x
i
=1|y
j
=0));IMPT
NB
为所述权重值,log(p(x
i
=1|y
j
=1))为出现主诊断y
j
条件下具有实体x
i
的对数概率值,log(p(x
i
=1|y
j
=0))为不出现主诊断y
j
条件下具有实体x
i
的对数概率值。
[0013]进一步地,所述系统还包括确定模块,用于:基于预设相似度算法,从预设病历库中确定与目标病历的相似度超过预设相似度阈值的病历的集合,得到第二病历集合;所述目标病历为所述第一病历集合中的病历;判断所述目标病历的主诊断与所述第二病历集合中出现次数最多的主诊断是否一致;如果是,则确定所述目标病历为正常病历;如果否,则确定所述目标病历为门诊主诊断错误病历。
[0014]第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法的步骤。
[0015]第四方面,本专利技术实施例还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行上述第一方面所述方法。
[0016]本专利技术提供了一种门诊主诊断错误病历筛选方法和系统,首先获取待筛选病历集合中每个病历中的所有实体,然后基于每个病历的主诊断,计算每个病历下的每个实体的权重值,最后基于权重值,在待筛选病历集合中筛选出主诊断错误的第一病历集合;第一病历集合为每个实体的权重值均小于预设阈值的病历的集合。本专利技术通过利用主诊断下各个实体的权重值进行判断,使得错误病历的筛选更加精准,缓解了现有技术中存在的对主诊断错误的病历的筛选准确度较低的技术问题。
附图说明
[0017]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的
附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种门诊主诊断错误病历筛选方法,其特征在于,包括:获取待筛选病历集合中每个病历中的所有实体;所述实体包括:症状、疾病和体征;基于所述每个病历的主诊断,计算所述每个病历下的每个实体的权重值;基于所述权重值,在所述待筛选病历集合中筛选出主诊断错误的第一病历集合;所述第一病历集合为每个实体的权重值均小于预设阈值的病历的集合。2.根据权利要求1所述的方法,其特征在于,获取待筛选病历集合中每个病历中的所有实体,包括:基于自然语言处理方法,从所述待筛选病历集合中每个病历的主诉信息和现病史信息中获取所述实体。3.根据权利要求1所述的方法,其特征在于,基于所述每个病历的主诊断,计算所述每个病历下的每个实体的权重值,包括:通过如下算式计算所述权重值:IMPT
NB
=log(p(x
i
=1|y
j
=1))

log(p(x
i
=1|y
j
=0))IMPT
NB
为所述权重值,log(p(x
i
=1|y
j
=1))为出现主诊断y
j
条件下具有实体x
i
的对数概率值,log(p(x
i
=1|y
j
=0))为不出现主诊断y
j
条件下具有实体x
i
的对数概率值。4.根据权利要求1所述的方法,其特征在于,在所述待筛选病历集合中筛选出主诊断错误的第一病历集合之后,所述方法还包括:基于预设相似度算法,从预设病历库中确定与目标病历的相似度超过预设相似度阈值的病历的集合,得到第二病历集合;所述目标病历为所述第一病历集合中的病历;判断所述目标病历的主诊断与所述第二病历集合中出现次数最多的主诊断是否一致;如果是,则确定所述目标病历为正常病历;如果否,则确定所述目标病历为门诊主诊断错误病历。5.一种门诊主诊断错误病历筛选系统,其特征在于,包括:获取模块,计算模块和筛选模块;其中,所述获取模块,用于获取待筛选病历集合中每个病历中的所有实体;所述实体包括:症状、疾...

【专利技术属性】
技术研发人员:杨冰晴胡可云陈联忠
申请(专利权)人:北京嘉和海森健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1