一种病程链条识别方法和装置制造方法及图纸

技术编号:37194562 阅读:21 留言:0更新日期:2023-04-20 22:54
本发明专利技术公开了一种病程链条识别方法和装置,包括从获取的患者病案首页数据中筛选至少二次住院的诊疗数据;对诊疗数据进行CHS

【技术实现步骤摘要】
一种病程链条识别方法和装置


[0001]本专利技术属于智能医疗
,具体涉及一种病程链条识别方法和装置。

技术介绍

[0002]在医保疾病诊断相关分组(Diagnosis Related Groups,DRG)支付模式下,医保赔付主要是基于患者单次住院费用进行结算。然而,有些疾病在治疗过程中可能需要多次住院。
[0003]在社会医疗保险机构的医保支付场景中,如何判断一个病程费用的合理性成为一个问题,这里面的不合理既有可能单次费用过高,也有可能因为分解住院导致住院次数过多造成。
[0004]在某些商保理赔场景,保险公司需要将患者同一病程的多次住院一起报销,例如在车险人伤场景中,需要将多次住院和门诊记录一并报销,同时需要刨除不相关的就诊记录,对于如何判断一次住院是否与其保险责任内该次理赔的疾病相关,传统商保理赔模式下主要靠人工审核。但是人工审核费时费力,因此,智能病程链条的识别具有重要意义,智能识别病程链条效率高、成本低,且在识别得到病程链条的基础上,社会医疗保险机构可以基于病程进行控费,保险公司可以基于病程链条剔除被保险人责任疾病赔付以外的住院及费用,将被保险人责任相关的多次住院进行统一赔付。
[0005]国家医保DRG分组(CHS

DRG)技术可将患者住院疾病分入相关的DRG病组。DRG编码的前三位即为病例分入核心疾病诊断相关分组(ADRG)编码。由于DRG病组除了核心诊断也包含了并发症和合并症信息,而ADRG仅包含了定义疾病的核心诊断信息,因此关联规则的生成是在ADRG层面实现的。
[0006]经典的关联规则算法如Apriori可根据相关序列生成关联规则,但这些关联规则对中的元素是不可重复、无序的。同一患者多次住院是有顺序的,且多次住院中可能是因为相同的ADRG住院。也就是说,在ADRG层面生成的关联规则中的元素必须是有序、可重复的。这就需要对经典关联算法进行改进,使其符合应用场景。

技术实现思路

[0007]鉴于上述,本专利技术的目的是提供一种病程链条识别方法和装置,在生成住院诊断相关分组的关联规则基础上,基于关联规则识别病程链条。
[0008]为实现上述专利技术目的,实施例提供的一种病程链条识别方法,包括以下步骤:
[0009]从获取的患者病案首页数据中筛选至少二次住院的诊疗数据;
[0010]对诊疗数据进行CHS

DRG分组并提取每次住院对应的ADRG;
[0011]对所有ADRG进行搜索得到原始一项频繁集和原始二项频繁集,将原始一项频繁集中每个ADRG重复形成由两个相同ADRG组成的频繁二项以构建新二项频繁集,将原始二项频繁集中每个频繁二项的两个不同ADRG调换顺序构建新二项频繁集,将所有新二项频繁集和原始二项频繁集作为最终二项频繁集;
[0012]基于最终二项频繁集提取关联规则并经过医学专家审核确定最终关联规则;
[0013]计算住院间隔时间的置信区间;
[0014]依据最终关联规则和置信区间从患者诊疗数据中识别病程链条和剔除不相关就诊。
[0015]优选地,采用FP

growth算法对所有ADRG进行搜索得到原始一项频繁集和原始二项频繁集。
[0016]优选地,采用改进的Apriori算法对最终二项频繁集进行加速存储,包括:
[0017]首先,将集合类型存储的最终二项频繁集转换成字符型列表存储的最终二项频繁集;
[0018]然后,通过解析函数将字符型列表存储的最终二项频繁集转化成以元组存储的最终二项频繁集。
[0019]优选地,所述基于最终二项频繁集提取关联规则,包括:将最终二项频繁集中每个频繁二项作为关联规则。
[0020]优选地,所述计算住院间隔时间的置信区间,包括:
[0021]首先,从所有关联规则中筛选包含前后两项不同ADRG的关联规则;
[0022]然后,计算筛选的所有同一关联规则的时间跨度的平均值与标准差,其中时间跨度为后项ADRG的入院时间与前项ADRG的入院时间之差;
[0023]最后,将每个关联规则对应的住院间隔时间的置信区间设置为[0,平均值+2*标准差]。
[0024]优选地,依据最终关联规则和置信区间从患者诊疗数据中识别病程链条,包括:
[0025](a

1)针对患者的所有ADRG,从患者第一次住院的ADRG开始,依次找到与第一次住院的ADRG存在关联规则关系的其他住院ADRG,得到第一条病程链条,包括:
[0026](a
‑1‑
1)当存在与第一次住院的ADRG具有关联规则关系的其他住院ADRG时,以第一次住院的ADRG为链首P1,并执行步骤(a
‑1‑
2);
[0027](a
‑1‑
2)当标记为Pother的某个其他住院ADRG满足:与P1存在关联规则关系,与P1的间隔时间最远,与P1属于相同ADRG或与P1属于不同ADRG但与P1的时跨度在相应置信区间,则将P1

Pother作为一条链条病程,该链条病程包含从P1到Pother时间段内的所有ADRG,且所有ADRG按照时间顺序排列,将Pother作为新链首,重复步骤(a
‑1‑
2),直到链条病程不能扩充为止;
[0028](a
‑1‑
3)当不存在与第k次住院的ADRG具有关联规则关系的其他住院ADRG时,则将第k+1次住院的ADRG为链首P1,重复步骤(a
‑1‑
2),其中,k的取值为大于等于1的自然数;
[0029](a

2)在得到第一条病程链条后,从第一条病程链条内的第n个ADRG开始识别,按步骤(a
‑1‑
2)和(a
‑1‑
3)的过程识别多条病程链条,其中,n取值为大于等于2的自然数,这样能够保证每条病程链条的链首与链尾的ADRG属于同一病程。
[0030]优选地,依据最终关联规则和置信区间从病程链条中剔除不相关就诊,包括:
[0031](b

1)针对病程链条中的第二个ADRG,将二个ADRG标记为Pcurrent,执行步骤(b
‑1‑
1):
[0032](b
‑1‑
1)当Pcurrent与标记为P1的第一个ADRGP1存在关联规则关系时,若P1与Pcurrent为相同的ADRG,则将Pcurrent保留在病程链条中;若P1与Pcurrent为不相同的
ADRG,且P1

Pcurrent的时间跨度在相应置信区间内,则将Pcurrent保留在病程链条中;若P1与Pcurrent为不相同的ADRG,且P1

Pcurrent的时间跨度不在相应置信区间内,则将Pcurrent从病程链条中删除;当Pcurrent与P1不存在关联规则关系时,则将Pcurrent从病程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种病程链条识别方法,其特征在于,包括以下步骤:从获取的患者病案首页数据中筛选至少二次住院的诊疗数据;对诊疗数据进行CHS

DRG分组并提取每次住院对应的ADRG;对所有ADRG进行搜索得到原始一项频繁集和原始二项频繁集,将原始一项频繁集中每个ADRG重复形成由两个相同ADRG组成的频繁二项以构建新二项频繁集,将原始二项频繁集中每个频繁二项的两个不同ADRG调换顺序构建新二项频繁集,将所有新二项频繁集和原始二项频繁集作为最终二项频繁集;基于最终二项频繁集提取关联规则并经过医学专家审核确定最终关联规则;计算住院间隔时间的置信区间;依据最终关联规则和置信区间从患者诊疗数据中识别病程链条和剔除不相关就诊。2.根据权利要求1所述的病程链条识别方法,其特征在于,采用FP

growth算法对所有ADRG进行搜索得到原始一项频繁集和原始二项频繁集。3.根据权利要求1所述的病程链条识别方法,其特征在于,采用改进的Apriori算法对最终二项频繁集进行加速存储,包括:首先,将集合类型存储的最终二项频繁集转换成字符型列表存储的最终二项频繁集;然后,通过解析函数将字符型列表存储的最终二项频繁集转化成以元组存储的最终二项频繁集。4.根据权利要求1所述的病程链条识别方法,其特征在于,所述基于最终二项频繁集提取关联规则,包括:将最终二项频繁集中每个频繁二项作为关联规则。5.根据权利要求1所述的病程链条识别方法,其特征在于,所述计算住院间隔时间的置信区间,包括:首先,从所有关联规则中筛选包含前后两项不同ADRG的关联规则;然后,计算筛选的所有同一关联规则的时间跨度的平均值与标准差,其中时间跨度为后项ADRG的入院时间与前项ADRG的入院时间之差;最后,将每个关联规则对应的住院间隔时间的置信区间设置为[0,平均值+2*标准差]。6.根据权利要求1所述的病程链条识别方法,其特征在于,依据最终关联规则和置信区间从患者诊疗数据中识别病程链条,包括:(a

1)针对患者的所有ADRG,从患者第一次住院的ADRG开始,依次找到与第一次住院的ADRG存在关联规则关系的其他住院ADRG,得到第一条病程链条,包括:(a
‑1‑
1)当存在与第一次住院的ADRG具有关联规则关系的其他住院ADRG时,以第一次住院的ADRG为链首P1,并执行步骤(a
‑1‑
2);(a
‑1‑
2)当标记为Pother的某个其他住院ADRG满足:与P1存在关联规则关系,与P1的间隔时间最远,与P1属于相同ADRG或与P1属于不同ADRG但与P1的时跨度在相应置信区间,则将P1

Pother作为一条链条病程,该链条病程包含从P1到Pother时间段内的所有ADRG,且所有ADRG按照时间顺序排列,将Pother作为新链首,重复步骤(a
‑1‑
2),直到链条病程不能扩充为止;(a
‑1‑
3)当不存在与第k次住院的ADRG具有关联规则关系的其他住院ADRG时,则将第k+1次住院的ADRG为链首P1,重复步骤(a
‑1‑
2),其中,k的取值为大于等于1的自然数;(a

2)在得到第一条病程链条后,从第一条病程链条内的第n个ADRG开始识别,按步骤
(a
‑1‑
2)和(a
‑1‑
3)的过程识别多条病程链条,其中,n取值为大于等于2的自然数,这样能够保证每条病程链条的链首与链尾的ADRG属于同一病程。7.根据权利要求1所述的病程链条识别方法,其特征在于,依据最终关联规则和置信区间从病程链条中剔除不相关就诊,包括:(b

1)针对病程链条中的第二个ADRG,将二个ADRG标记为Pcurrent,执行步骤(b
‑1‑
1):(b

【专利技术属性】
技术研发人员:李易平付长祯奉仰尚
申请(专利权)人:杭州火树科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1