当前位置: 首页 > 专利查询>东南大学专利>正文

改进的FP‑GROWTH方法技术

技术编号:16472622 阅读:110 留言:0更新日期:2017-10-29 00:17
本发明专利技术公开了一种改进的FP‑GROWTH方法,包括:对数据库遍历,获取支持度list,根据list对数据库中的事务排序;根据list将数据库中的事务插入到FP‑TREE中;运用Bloomfilter判断当前节点的子节点是否存在当前项,并插入节点;挖掘数据库中各项之间的关联关系。本发明专利技术通过判断插入步骤与查询步骤中位数组的异同,简化FP‑TREE的插入时间,降低建立FP‑TREE的时间;在Bloomfilter判断后,当数据不存在时直接插入一个新的节点,减少遍历的判断过程,提高算法运行效率。与传统方法相比,在测试数据量比较大的时候本发明专利技术方法运行效率有明显的提高,能够显著优化航空数据的运算效率。

FP improved GROWTH method

The invention discloses an improved FP GROWTH method, including the database traversal, obtaining support of list, according to List Ranking in the database transaction; according to the list database in TREE transaction into FP; using Bloomfilter to determine the current node is present, and insert the node; association between items in a database. The present invention by judging the insertion step and query step bit array similarities and differences, the insertion time of simplified FP TREE TREE FP, reduce the establishment time; at Bloomfilter after judgment, a new node is inserted directly when the data do not exist, reduce the judgment process of ergodic, improve the efficiency of the algorithm operation. Compared with the traditional method, when the test data is large, the efficiency of the method is improved obviously, and the operation efficiency of the aviation data can be obviously optimized.

【技术实现步骤摘要】
改进的FP-GROWTH方法
本专利技术属于数据挖掘分析
,涉及数据关联分析方法,更为具体的说,是涉及一种改进的FP-GROWTH方法。
技术介绍
关联分析又称关联挖掘,是指在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。在实际应用中,关联分析能够用于发现交易数据库中不同商品(项)之间的联系,例如常见的购物篮分析。关联分析适用性广泛,为了挖掘数据库中数据的关联关系,常用的方法有Apriori方法。Apriori方法主要是根据数据库中具有最小支持度的数据集生成关联规则。但其缺陷也很明显,计算机系统的开销会随着数据库的记录的增加呈现出几何级数的增加,这就造成了计算效率的低下。而FP-GROWTH方法能够很好地解决这个问题。FP-GROWTH方法通过扫描2次数据库形成频繁模式树,由此得到压缩的数据库映射,再根据得到的频繁模式树进行关联分析。GROWTH算法相比于Apriori算法有更强的适用性和更高的计算效率,但在某些数据的应用中尚有缺陷。例如航空数据数据量大重复率低,传统FP-GROWTH算法建立FP-TREE效率低下,速度本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201710450160.html" title="改进的FP‑GROWTH方法原文来自X技术">改进的FP‑GROWTH方法</a>

【技术保护点】
改进的FP‑GROWTH方法,其特征在于,包括如下步骤:步骤1,对数据库遍历,获取每个项的支持度,按顺序排列支持度得到list,根据list对数据库中的事务排序;步骤2,根据得到的list,将数据库中的事务插入到一个FP‑TREE中;步骤3,运用Bloomfilter判断当前节点的子节点是否存在当前项,如果当前项存在于当前节点的子节点中,则寻找到该节点进行插入;如果当前项不存在于当前节点的子节点中,则产生一个新的节点进行插入;步骤4,挖掘数据库中各项之间的关联关系。

【技术特征摘要】
1.改进的FP-GROWTH方法,其特征在于,包括如下步骤:步骤1,对数据库遍历,获取每个项的支持度,按顺序排列支持度得到list,根据list对数据库中的事务排序;步骤2,根据得到的list,将数据库中的事务插入到一个FP-TREE中;步骤3,运用Bloomfilter判断当前节点的子节点是否存在当前项,如果当前项存在于当前节点的子节点中,则寻找到该节点进行插入;如果当前项不存在于当前节点的子节点中,则产生一个新的节点进行插入;步骤4,挖掘数据库中各项之间的关联关系。2.根据权利要求1所述的改进的FP-GROWTH方法,其特征在于,所述步骤2具体包括:步骤21,将当前事务的当前项插入当前节点的子节点中,对于第一次插入则当前节点为NULL节点;如果当前节点的子节点存在当前项,则将该子节点的支持度加1,如果不存在,则创建一个新的节点,新节点支持...

【专利技术属性】
技术研发人员:黄杰卫锦朱仟曹山山闵溪青万弃寒张云龙
申请(专利权)人:东南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1