【技术实现步骤摘要】
一种基于Apriori算法挖掘二维数据间关联规则的方法
本专利技术涉及计算机科学
,尤其涉及一种基于Apriori算法挖掘二维数据间关联规则的方法。
技术介绍
Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于做出决策。比如在常见的超市购物数据集,或者电商的网购数据集中,如果找到了频繁出现的数据集,那么对于超市,就可以优化产品的位置摆放,对于电商,就可以优化商品所在的仓库位置,达到节约成本,增加经济效益的目的。然而现有技术只考虑了商品之间的关联,并没有往上一层去考虑商品类别(货架)之间的关系,从而将有关联的商品直接放在一起,这就会造成商品摆放的混乱。在应用的过程中发现,经典的Apriori算法并不适用于发现二维数据表中属性与属性(列)之间的关系,只能用来挖掘数据值之间的关系。
技术实现思路
本专利技术实施例的目的是提供一种基于Apriori算法挖掘二维数据间关联规则的方法,可以挖掘二维数据表属性之间的关联规则,从而确定属性间 ...
【技术保护点】
1.一种基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,包括以下步骤:/n获取关系型数据库中的二维连续型数据表,对所述二维连续型数据表进行离散化处理,得到二维离散化数据表;/n通过Apriori算法挖掘出所述二维离散化数据表中各数据之间的频繁项集,并生成所述频繁项集的关联规则,同时计算每一条规则的置信度;/n根据亲密度计算公式、每一条规则的置信度以及所述频繁项集的关联规则,计算得到二层级数据的关联规则。/n
【技术特征摘要】
1.一种基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,包括以下步骤:
获取关系型数据库中的二维连续型数据表,对所述二维连续型数据表进行离散化处理,得到二维离散化数据表;
通过Apriori算法挖掘出所述二维离散化数据表中各数据之间的频繁项集,并生成所述频繁项集的关联规则,同时计算每一条规则的置信度;
根据亲密度计算公式、每一条规则的置信度以及所述频繁项集的关联规则,计算得到二层级数据的关联规则。
2.如权利要求1所述的基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,所述亲密度计算公式为:
其中,A、B为二维数据表中的属性,t为可能存在的关联规则总数,pi是关联规则i的置信度,为实际挖掘出的带权重的关联规则数。
3.如权利要求1所述的基于Apriori算法挖掘二维数据间关联规则的方法,其特征在于,所述频繁项集通过以下方式获...
【专利技术属性】
技术研发人员:仇晶,方拓迁,方滨兴,田志宏,殷丽华,顾钊铨,韩伟红,李树栋,李默涵,唐可可,
申请(专利权)人:广州大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。