一种基于电子病历分析的隐含规则挖掘方法及系统技术方案

技术编号:33207716 阅读:30 留言:0更新日期:2022-04-24 00:57
本发明专利技术涉及一种基于电子病历分析的隐含规则挖掘方法及系统。该方法包括:将从电子病历数据集中提取的特征分为左项集和右项集;根据左项集中的所有非空子集,遍历电子病历数据集,确定每个非空左项子集的支持度;并将支持度大于等于支持度阈值的非空左项子集进行保存,确定第一集合;将右项集的所有非空子集进行保存,确定第二集合;对第一集合和第二集合做直积,得到左项子集和右项子集的所有组合,确定第三集合;遍历电子病历数据集,确定第三集合每个组合的支持度;并将支持度大于等于支持度阈值的组合确定为频繁项集;确定每个频繁项集的置信度;并根据置信度大于等于置信度阈值的频繁项集确定强关联规则。本发明专利技术能够提高关联规则的有效率。关联规则的有效率。关联规则的有效率。

【技术实现步骤摘要】
一种基于电子病历分析的隐含规则挖掘方法及系统


[0001]本专利技术涉及统计分析领域,特别是涉及一种基于电子病历分析的隐含规则挖掘方法及系统。

技术介绍

[0002]随着医疗电子病历的广泛普及和信息技术的迅速发展,医疗领域迈入了全新的信息化时代,使得医疗数据日益递增。面对海量的医疗数据,利用数据挖掘技术对其进行分析与挖掘,能够为医疗人员的临床诊断和预后分析提供全新的思路与方法。
[0003]在众多的数据挖掘方法中,关联规则挖掘方法是目前医疗领域中应用最广泛的方法之一,利用关联规则能够挖掘出医疗数据中蕴含的潜在规则,从而获取到有价值的信息。然而,传统的Apriori关联规则算法如果直接应用在维度规模较大的医疗数据上会产生大量无意义的规则,导致数据冗余严重。
[0004]因此,亟需一种分析方法以提高关联规则的有效率。

技术实现思路

[0005]本专利技术的目的是提供一种基于电子病历分析的隐含规则挖掘方法及系统,能够提高关联规则的有效率。
[0006]为实现上述目的,本专利技术提供了如下方案:一种基于电子病历分本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于电子病历分析的隐含规则挖掘方法,其特征在于,包括:将从电子病历数据集中提取的特征分为左项集和右项集;所述左项集为手术前的特征;所述右项集为手术后的特征;根据左项集中的所有非空子集,遍历电子病历数据集,确定每个非空左项子集的支持度;并将支持度大于或等于支持度阈值的非空左项子集进行保存,确定第一集合;将所述右项集的所有非空子集进行保存,确定第二集合;对所述第一集合和所述第二集合做直积,得到左项子集和右项子集的所有组合,确定第三集合;遍历电子病历数据集,确定所述第三集合每个组合的支持度;并将支持度大于或等于支持度阈值的组合确定为频繁项集;确定每个频繁项集的置信度;并根据置信度大于或等于置信度阈值的频繁项集确定强关联规则;所述确定每个频繁项集的置信度;并根据置信度大于或等于置信度阈值的频繁项集确定强关联规则,之后还包括:根据强关联规则确定提升度;判断所述提升度是否小于1;若所述提升度小于1,则所述强关联规则无效;若所述提升度大于或等于1,则所述强关联规则有效。2.根据权利要求1所述的一种基于电子病历分析的隐含规则挖掘方法,其特征在于,所述将从电子病历数据集中提取的特征分为左项集和右项集,之前还包括:获取电子病历数据集;对所述电子病历数据集进行预处理;所述预处理包括:数据提取、归一化处理、特征取值以及缺失值处理。3.一种基于电子病历分析的隐含规则挖掘系统,其特征在于,包括:特征...

【专利技术属性】
技术研发人员:肖格磊伍诗萌王宇昌李芳芳
申请(专利权)人:中南大学湘雅医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1