The invention discloses a method for mining disease complications FP based on Growth algorithm, the physical examination data of the large hospital for many years on the basis of the data of diagnosis were extracted, and the use of FP Growth algorithm to get frequent itemsets, from the structure of not less than the credibility threshold rules, namely the disease complications. When doctors give diagnostic advice, they can not only make recommendations based on the patient's physical examination data, but also make scientific and reliable recommendations and preventive measures based on disease complications. The present invention by association rule mining in the disease association comprehensive, true and reliable; FP Growth algorithm adopted, than the general association rules algorithm is more rapid and efficient; the invention is given in addition to complications of the disease presents the possibility, and sorted according to the level of the possibility of complications, diagnosis result for disease with the more accurate diagnosis and advice, improve patient satisfaction in physical examination.
【技术实现步骤摘要】
一种基于FP-Growth算法的疾病并发症挖掘方法
本专利技术属于医疗数据挖掘
,具体涉及一种基于FP-Growth算法的疾病并发症挖掘方法。
技术介绍
数据挖掘是近年来随着人工智能和数据库技术的交叉融合而兴起的边缘学科,它致力于发现隐含在资料中的关于事物本质和事物发展趋势的知识或规律,并为专家的决策提供支持。随着信息技术在医疗行业的大规模应用,大量的医疗数据被采集起来,数据挖掘技术在医疗领域具有良好的应用前景和数据支持。从体检诊断数据库中挖掘疾病并发症以丰富专家经验和医学理论,并发症往往具有很高的复杂性和不确定性,利用海量数据研究疾病之间的并发关系进行并发症预警对疾病的治疗有重要意义。研究并发症实际上研究的是疾病之间的并发共线关系,这些疾病并发关系有些是已知的,也有些是未知的;有些是属于同一科室的,有些是跨科室的。因为其巨大的数据量,这些隐含的疾病并发关系很难为人工所发现,而数据挖掘技术正是解决这个问题的最好办法。目前的疾病并发症研究往往都只针对一种或一类疾病进行研究,例如常见的糖尿病并发症研究和某些癌症的并发症研究。
技术实现思路
鉴于上述,本专利技术提供了一种基于FP-Growth算法的疾病并发症挖掘方法,针对所有常见疾病的并发症挖掘,旨在为医生诊断时,为患者提供更全面的体检建议以及提醒患者对一些疾病进行及早的防患。一种基于FP-Growth算法的疾病并发症挖掘方法,包括如下步骤:(1)对医院体检数据库中的所有体检报告进行预处理以及分析,得到每份体检报告所诊断出的疾病列表;(2)基于所有体检报告所对应的疾病列表,通过统计识别输出疾病频繁项列表,该列 ...
【技术保护点】
一种基于FP‑Growth算法的疾病并发症挖掘方法,包括如下步骤:(1)对医院体检数据库中的所有体检报告进行预处理以及分析,得到每份体检报告所诊断出的疾病列表;(2)基于所有体检报告所对应的疾病列表,通过统计识别输出疾病频繁项列表,该列表中的频繁项为一种疾病或两种疾病的组合,且对于任一频繁项i,其满足以下条件要求:
【技术特征摘要】
1.一种基于FP-Growth算法的疾病并发症挖掘方法,包括如下步骤:(1)对医院体检数据库中的所有体检报告进行预处理以及分析,得到每份体检报告所诊断出的疾病列表;(2)基于所有体检报告所对应的疾病列表,通过统计识别输出疾病频繁项列表,该列表中的频繁项为一种疾病或两种疾病的组合,且对于任一频繁项i,其满足以下条件要求:其中:N为体检报告的总数量,support(i)为频繁项i的支持度,ρ为设定的比例阈值;(3)基于疾病频繁项列表通过计算发现关联规则,挖掘出属于频繁项的疾病所对应的并发症。2.根据权利要求1所述的疾病并发症挖掘方法,其特征在于:所述步骤(1)中对体检报告进行预处理以及分析,具体包括对缺失值进行删除,对异常值进行处理,并统计疾病诊断的种类和分布以及生成热门疾病图,从而得到每份体检报告所诊断出的疾病列表。3.根据权利要求1所述的疾病并发症挖掘方法,其特征在于:所述步骤(2)中采用FP-Growth算法统计识别出所有频繁项,从而输出疾病频繁项列表。...
【专利技术属性】
技术研发人员:吴健,顾盼,周立水,邱奇波,邓水光,李莹,尹建伟,吴朝晖,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。