当前位置: 首页 > 专利查询>广州大学专利>正文

一种基于Apriori算法挖掘二维数据间关联规则的方法技术

技术编号:24574179 阅读:58 留言:0更新日期:2020-06-21 00:08
本发明专利技术公开了一种基于Apriori算法挖掘二维数据间关联规则的方法,通过获取关系型数据库中的二维连续型数据表,对二维连续型数据表进行离散化处理,得到二维离散化数据表,然后通过Apriori算法挖掘出二维离散化数据表中各数据之间的频繁项集,并生成频繁项集的关联规则,同时计算每一条规则的置信度,最后根据亲密度计算公式、每一条规则的置信度以及频繁项集的关联规则,计算得到二层级数据的关联规则,可以挖掘二维数据表属性之间的关联规则,从而确定属性间的亲密关系。

A method of mining association rules between two-dimensional data based on Apriori algorithm

【技术实现步骤摘要】
一种基于Apriori算法挖掘二维数据间关联规则的方法
本专利技术涉及计算机科学
,尤其涉及一种基于Apriori算法挖掘二维数据间关联规则的方法。
技术介绍
Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于做出决策。比如在常见的超市购物数据集,或者电商的网购数据集中,如果找到了频繁出现的数据集,那么对于超市,就可以优化产品的位置摆放,对于电商,就可以优化商品所在的仓库位置,达到节约成本,增加经济效益的目的。然而现有技术只考虑了商品之间的关联,并没有往上一层去考虑商品类别(货架)之间的关系,从而将有关联的商品直接放在一起,这就会造成商品摆放的混乱。在应用的过程中发现,经典的Apriori算法并不适用于发现二维数据表中属性与属性(列)之间的关系,只能用来挖掘数据值之间的关系。
技术实现思路
本专利技术实施例的目的是提供一种基于Apriori算法挖掘二维数据间关联规则的方法,可以挖掘二维数据表属性之间的关联规则,从而确定属性间的亲密关系,应用在商本文档来自技高网...

【技术保护点】
1.一种基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,包括以下步骤:/n获取关系型数据库中的二维连续型数据表,对所述二维连续型数据表进行离散化处理,得到二维离散化数据表;/n通过Apriori算法挖掘出所述二维离散化数据表中各数据之间的频繁项集,并生成所述频繁项集的关联规则,同时计算每一条规则的置信度;/n根据亲密度计算公式、每一条规则的置信度以及所述频繁项集的关联规则,计算得到二层级数据的关联规则。/n

【技术特征摘要】
1.一种基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,包括以下步骤:
获取关系型数据库中的二维连续型数据表,对所述二维连续型数据表进行离散化处理,得到二维离散化数据表;
通过Apriori算法挖掘出所述二维离散化数据表中各数据之间的频繁项集,并生成所述频繁项集的关联规则,同时计算每一条规则的置信度;
根据亲密度计算公式、每一条规则的置信度以及所述频繁项集的关联规则,计算得到二层级数据的关联规则。


2.如权利要求1所述的基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,所述亲密度计算公式为:
其中,A、B为二维数据表中的属性,t为可能存在的关联规则总数,pi是关联规则i的置信度,为实际挖掘出的带权重的关联规则数。


3.如权利要求1所述的基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,所述频繁项集通过以下方式获...

【专利技术属性】
技术研发人员:仇晶方拓迁方滨兴田志宏殷丽华顾钊铨韩伟红李树栋李默涵唐可可
申请(专利权)人:广州大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1