【技术实现步骤摘要】
一种基于医疗场景的模糊高效用模式挖掘方法
[0001]本专利技术是属于数据挖掘方向,具体是一种基于医疗场景的模糊高效用模式挖掘方法。
技术介绍
[0002]随着第一台计算机的问世,数据也随之产生。超大规模数据库的出现,如商业数据仓库和计算机自动收集数据记录手段的普及使得人类数据量成指数增长。统计方法在数据处理领域应用的不断深入,为人们挖掘数据库提供了方法。先进的计算机技术,如更快和更大的计算能力和并行体系结构使得人们有能力在超大规模数据库中挖掘知识。在这样的背景下,数据挖掘技术也就随之产生.数据挖掘技术有着广泛的应用,例如,关联规则挖掘、序列模式挖掘、文本分类、Web日志分析和协同过滤。随着这些年的发展,高效用模式挖掘技术也飞速发展,但高效用模式挖掘主要还是应用于挖掘具有利润信息的数据库,只考虑这些项的数值信息,可解释性较差。
[0003]数据挖掘是指人们通过仔细研究分析数据来发现蕴藏在其中的有意义的关系,趋势以及模式的过程。Agrawal等于1994年提出的Apriori算法以及Han等于2000年提出的FP />‑
gr本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于医疗场景的模糊高效用模式挖掘方法,其特征在于,包括以下步骤:S1、收集医疗场景下患者的各项体检数据并对其进行预处理,所述预处理是:参考医学标准的人类各项指标区间以及标准值,将超出区间范围的值,用边界值进行填补后得到原始数据库数据;S2、该步骤S1得到的原始数据库数据通过模糊函数后,得到区间的隶属度值,将其作为内部效用值,人为指定外部效用表,从而获得可被高效用模式挖掘算法所挖掘的模糊数据库;S3、将步骤S2得到的模糊数据库,使用两阶段挖掘算法进行挖掘,周期性调用切换模块,判断是否满足切换条件,若满足则切换使用一阶段挖掘算法处理,挖掘模糊高效用模式。2.根据权利要求1所述的基于医疗场景的模糊高效用模式挖掘方法,其特征在于,步骤S1中数据的预处理采用医学上人体属性标准值进行填充,之后进行归一化处理,使得数据全部落在由模糊函数所确定的区间内。3.根据权利要求1所述的基于医疗场景的模糊高效用模式挖掘方法,其特征在于,所述步骤S2中,选择I型模糊函数或II型模糊函数,数据经过模糊模块后,分别计算出低、中、高区间的隶属度值;经过第一遍扫描后,得到主区间,继而得到主区间的隶属度值,该值用于高效用模式挖掘算法中的内部效用值,之后将体检数据中各种属性的外部效用值设定为相同值。4.根据权利要求1所述的基于医疗场景的模糊高效用模式挖掘方法,其特征在于,步骤S3具体包括以下子步骤:S...
【专利技术属性】
技术研发人员:李鹏,周宁,郑会,陈静,徐鹤,王汝传,张玉杰,李友涛,张结魁,陈莉莉,
申请(专利权)人:安徽晶奇网络科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。