当前位置: 首页 > 专利查询>青海大学专利>正文

改进的Apriori算法及其在藏医关联挖掘中的应用制造技术

技术编号:21304132 阅读:50 留言:0更新日期:2019-06-12 09:12
本发明专利技术公开了一种改进的Apriori算法及其在藏医关联挖掘中的应用,只需对事务数据库扫描一次,就可将事务数据库转换成布尔矩阵,对事务数据库的扫描即可转换为向量运算。矩阵中行代表事务,列代表数据项,某项若在事务中出现则用1表示,没有出现则用0表示。布尔矩阵相对于事务数据库更加简洁,不需要重复扫描数据集,且通过向量运算计算支持度。本发明专利技术改进后的基于向量的Apriori算法明显优于原有Apriori算法。将其应用于藏医诊疗领域,辅助医疗决策分析,能够帮助藏医药工作者及时准确的获取有用信息,有效避免医疗失误,并提高藏医学的现代化水平,为运用先进科学技术辅助藏医诊疗提供一个有力的手段。

Improved Apriori algorithm and its application in Tibetan Medicine Association Mining

The invention discloses an improved Apriori algorithm and its application in Tibetan Medicine Association mining. The transaction database can be transformed into a Boolean matrix only by scanning the transaction database once, and the scan of the transaction database can be transformed into a vector operation. Rows in a matrix represent transactions, columns represent data items, and an item is represented by 1 if it appears in a transaction, and zero if it does not. Boolean matrices are more concise than transaction databases, do not need to scan data sets repeatedly, and calculate support through vector operations. The improved vector-based Apriori algorithm of the invention is obviously superior to the original Apriori algorithm. Its application in the field of Tibetan medicine diagnosis and treatment, assisting medical decision analysis, can help Tibetan medicine workers timely and accurately obtain useful information, effectively avoid medical errors, and improve the level of modernization of Tibetan medicine, and provide a powerful means for the use of advanced science and technology to assist Tibetan medicine diagnosis and treatment.

【技术实现步骤摘要】
改进的Apriori算法及其在藏医关联挖掘中的应用
本专利技术涉及一种改进的Apriori算法及其应用,具体地说,设计一种能够加速发现频繁项集的改进的Apriori算法及其在藏医关联挖掘中的应用。
技术介绍
Apriori算法运用在候选项集中发现频繁项集的方式,取得了较好的性能,但仍存在效率不高的问题,运行时间主要消耗在三个方面:产生每一级频繁模式,都需要重复地扫描数据库,I/O负载沉重;当数据集较大时,产生的候选项集数目成指数级增长,计算量巨大;大量的候选项集与事务进行模式匹配时花费大量时间,得不到广泛应用,尤其是在藏医症候分型过程中的应用。藏医药学是我国传统民族医药学宝库中一颗璀璨的明珠,在藏族人民漫长的生产、生活实践中,其系统的理论和独特的临床疗效及用药特色,为藏族人民繁衍生息、保障生命健康做出了重要贡献,也越来越受到世人的关注。对藏医药文化进行现代技术的研究是时代发展和藏医药发展的内在要求,只有将现代的信息化技术融入到藏医药的研发过程中,并运用到藏医院的实际运行中来,才能够为藏医药的可持续发展奠定良好的技术基础和环境基础。从目前现有的针对藏医现代化方面的研究来看,主要有运用信本文档来自技高网...

【技术保护点】
1.一种改进的Apriori算法,其特征在于,包括以下步骤:首先将事务数据库初始化为布尔矩阵;在数据集D中,设I={i1,i2,i3…in}是项的集合,其中每个事务T是项的集合,使得

【技术特征摘要】
1.一种改进的Apriori算法,其特征在于,包括以下步骤:首先将事务数据库初始化为布尔矩阵;在数据集D中,设I={i1,i2,i3…in}是项的集合,其中每个事务T是项的集合,使得对于一个给定的数据集D,都存在着f(D)=M,M定义为:其次对于每一项支持度的计算,对每一个项Ij,都对应一个列向量Dj,定义为:Ij的支持度计数为:对每一项计算支持度即布尔矩阵每一列的列向量之和,并删除支持度小于最小阈值的项,即获得频繁1-项集;通过自连接产生候选2-项集,此时{Ii,Ij}的支持...

【专利技术属性】
技术研发人员:王璐张磊祝小兰王世颍王雪茜刘超逸张拂晓
申请(专利权)人:青海大学
类型:发明
国别省市:青海,63

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1