一种主诊断识别方法、装置、计算设备和存储介质制造方法及图纸

技术编号:37086319 阅读:15 留言:0更新日期:2023-03-29 20:01
本发明专利技术公开了一种主诊断识别方法、装置、计算设备和存储介质,基于历史诊疗数据构建由主诊断和中心诊疗经过组成的终极关联对的基础上,依据BM25算法相似度、与中心诊疗经过相似度以及主诊断

【技术实现步骤摘要】
一种主诊断识别方法、装置、计算设备和存储介质


[0001]本专利技术属于病案质量管控
,具体涉及一种主诊断识别方法、装置、计算设备和存储介质。

技术介绍

[0002]在临床实践中,编码员根据患者本次住院的主要治疗目的、或对患者危害最大的疾病,兼顾考虑资源消耗最多的疾病作为主要诊断。这种方式比较依赖病案编码员的临床知识、对整份病历的理解和编码经验,当然这种方式具有一定的主观性。另外,由于临床医生由于工作压力大,电子病历的填写质量可能不高,如果病案编码员在编码时直接翻译医生写的诊断,可能会导致病案首页存在主诊断选择错误等问题。
[0003]主诊断的正确选择与编码对于DRG/DIP结算的医院影响特别大,如果能通过一种自动化的方式识别出主诊断,这将较大程度降低编码员的工作量,减少临床医生和病案编码员的失误等原因导致的主诊断选择错误,进而有效提升病案质量,减少医院在DRG/DIP结算中的损失。
[0004]专利文献CN114550885A公开的一种基于联邦式挖掘的主诊断与主手术匹配检测方法和系统和专利文献CN113823414A公开的一种主诊断与主手术匹配检测方法,均公开了主诊断的识别,但是该主诊断的识别过程不够准确。

技术实现思路

[0005]鉴于上述,本专利技术的目的是提供一种主诊断识别方法和装置,真够高效准确识别病案首页中的主诊断,以期在降低病案编码员工作量的同时提高病案首页质量。
[0006]为实现上述专利技术目的,实施例提供了一种主诊断识别方法,包括以下步骤:
[0007]从历史诊疗数据中提取主诊断、费用项和诊疗经过,并构建费用项与主诊断的关联表、主诊断与多个诊疗经过的初级关联对;
[0008]基于主诊断与多个诊疗经过的关联对,采用中心相似性最大原则确认每个关联对中主诊断对应的中心诊疗经过,构成终级关联对;
[0009]依据关联表确定获取的目标费用项关联的所有主诊断,采用BM25算法从所有主诊断中筛选一级候选主诊断;
[0010]计算输入诊疗经过与每个一级候选主诊断在所属终级关联对中对应的中心诊疗经过的相似性,依据相似性从所有一级候选主诊断中筛选二级候选主诊断;
[0011]计算每个二级候选主诊断关联的总费用金额;
[0012]依据主诊断

主手术关联关系对筛选二级候选主诊断进行滤除,从剩余二级候选主诊断中筛选总费用金额最高的二级候选主诊断作为主诊断。
[0013]优选地,所述费用项目与主诊断的关联表为倒排索引表,每个费用项目关联多个主诊断。
[0014]优选地,所述采用中心相似性最大原则确认每个关联对中主诊断对应的中心诊疗
经过,包括:
[0015]采用以下公式计算每个关联对中主诊断对应的中心诊疗经过X
center

[0016]X
center
=min∑
jn=1
sum(∑
in=1
|x
i

x
j
|)
[0017]其中,|x
i

x
j
|表示诊疗经过i的文本向量和诊疗经过j的文本向量之间的余弦距离,n表示关联一个主诊断的诊疗经过总量;
[0018]主诊断与中心诊疗经过构成终级关联对。
[0019]优选地,所述依据关联表确定目标费用项关联的所有主诊断,包括:
[0020]从费用项与主诊断的关联表中搜索到目标费用项,进而确定目标费用项关联的所有主诊断。
[0021]优选地,所述采用BM25算法从所有主诊断中筛选一级候选主诊断,包括:
[0022]首先,采用以下公式计算目标费用项与每个主诊断的相关性分数Score(Q,d):
[0023][0024]其中,Q表示目标费用项,q
i
表示目标费用项的分词,q
i
表示分词的索引,m表示分词总量,d表示主诊断,k1,b是调节因子,f
i
表示q
i
在d中出现的频率,dl为d的长度,avgdl为目标费用项目关联的所有主诊断的平均长度,IDF(qi)表示逆文档频率;
[0025]然后,依据第一阈值筛选高于第一阈值的相关性分数对应的主诊断作为一级候选主诊断。
[0026]优选地,计算输入诊疗经过与每个一级候选主诊断在所属终级关联对中对应的中心诊疗经过的余弦相似性。
[0027]然后依据第二阈值筛选高于第二阈值的一级候选主诊断作为二级候选主诊断。
[0028]优选地,所述依据主诊断

主手术关联关系对筛选二级候选主诊断进行滤除,包括:
[0029]从目标费用项目中提取主手术,若提取的主手术与二级候选主诊断组成的拟确认关系,与已知主诊断

主手术关联关系不匹配,则将二级候选主诊断滤除。
[0030]为实现上述专利技术目的,实施例还提供了一种主诊断识别装置,包括初级关联模块、终级关联模块、一级筛选模块、二级筛选模块、费用计算模块、终极筛选模块;
[0031]所述初级关联模块用于从历史诊疗数据中提取主诊断、费用项和诊疗经过,并构建费用项与主诊断的关联表、主诊断与多个诊疗经过的初级关联对;
[0032]所述终级关联模块用于基于主诊断与多个诊疗经过的关联对,采用中心相似性最大原则确认每个关联对中主诊断对应的中心诊疗经过,构成终级关联对;
[0033]所述一级筛选模块用于依据关联表确定获取的目标费用项关联的所有主诊断,采用BM25算法从所有主诊断中筛选一级候选主诊断;
[0034]所述二级筛选模块用于计算输入诊疗经过与每个一级候选主诊断在所属终级关联对中对应的中心诊疗经过的相似性,依据相似性从所有一级候选主诊断中筛选二级候选主诊断;
[0035]所述费用计算模块用于计算每个二级候选主诊断关联的总费用金额;
[0036]所述终极筛选模块用于依据主诊断

主手术关联关系对筛选二级候选主诊断进行滤除,从剩余二级候选主诊断中筛选总费用金额最高的二级候选主诊断作为主诊断。
[0037]为实现上述专利技术目的,实施例还提供了一种计算设备,存储器、处理器以及存储在所述存储器中并可在所述处理器上执行的计算机程序,所述处理器执行所述计算机程序时实现上述主诊断识别方法的步骤。
[0038]为实现上述专利技术目的,实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理执行时实现上述主诊断识别方法的步骤。
[0039]与现有技术相比,本专利技术具有的有益效果至少包括:
[0040]基于历史诊疗数据构建由主诊断和中心诊疗经过组成的终极关联对的基础上,依据BM25算法相似度、与中心诊疗经过相似度以及主诊断

主手术关联关系三次滤除筛选后,依据总费用金额确认主诊断,这样能够以量化的方式自动识别主诊断,极大减轻医疗工作人员工作量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种主诊断识别方法,其特征在于,包括以下步骤:从历史诊疗数据中提取主诊断、费用项和诊疗经过,并构建费用项与主诊断的关联表、主诊断与多个诊疗经过的初级关联对;基于主诊断与多个诊疗经过的关联对,采用中心相似性最大原则确认每个关联对中主诊断对应的中心诊疗经过,构成终级关联对;依据关联表确定获取的目标费用项关联的所有主诊断,采用BM25算法从所有主诊断中筛选一级候选主诊断;计算输入诊疗经过与每个一级候选主诊断在所属终级关联对中对应的中心诊疗经过的相似性,依据相似性从所有一级候选主诊断中筛选二级候选主诊断;计算每个二级候选主诊断关联的总费用金额;依据主诊断

主手术关联关系对筛选二级候选主诊断进行滤除,从剩余二级候选主诊断中筛选总费用金额最高的二级候选主诊断作为主诊断。2.根据权利要求1所述的主诊断识别方法,其特征在于,所述费用项目与主诊断的关联表为倒排索引表,每个费用项目关联多个主诊断。3.根据权利要求1所述的主诊断识别方法,其特征在于,所述采用中心相似性最大原则确认每个关联对中主诊断对应的中心诊疗经过,包括:采用以下公式计算每个关联对中主诊断对应的中心诊疗经过X
center
:X
center
=min∑
jn=1
sum(∑
in=1
|x
i

x
j
|)其中,|x
i

x
j
|表示诊疗经过i的文本向量和诊疗经过j的文本向量之间的余弦距离,n表示关联一个主诊断的诊疗经过总量;主诊断与中心诊疗经过构成终级关联对。4.根据权利要求1所述的主诊断识别方法,其特征在于,所述依据关联表确定目标费用项关联的所有主诊断,包括:从费用项与主诊断的关联表中搜索到目标费用项,进而确定目标费用项关联的所有主诊断。5.根据权利要求1所述的主诊断识别方法,其特征在于,所述采用BM25算法从所有主诊断中筛选一级候选主诊断,包括:首先,采用以下公式计算目标费用项与每个主诊断的相关性分数Score(Q,d):其中,Q表示目标费用项,q
i
表示目标费用项的分词,q
i
表示分词的索引,m表示分词总量,d表示主诊断,k1,b是调节因子,f
i

【专利技术属性】
技术研发人员:尹伟东李易平
申请(专利权)人:杭州火树科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1