一种基于事务项约束扩展的多层关联规则挖掘方法技术

技术编号:13428230 阅读:43 留言:0更新日期:2016-07-29 18:15
本发明专利技术公开了一种基于事务项约束扩展的多层关联规则挖掘方法,通过将原始项目表转换为概念层次树,再通过概念层次树进行基于事务项约束扩展的多层关联规则挖掘,这样能够根据具体数据挖掘应用场景或用户所需要的具体关联信息需求,在具体层次间进行关联信息挖掘,同时挖掘过程中极大减少频繁项集和冗余规则的生成,从而提高整个数据的关联规则挖掘效率,具有很好的扩展性。

【技术实现步骤摘要】

本专利技术属于数据挖掘
,更为具体地讲,涉及一种基于事务项约束扩展的多层关联规则挖掘方法
技术介绍
关联规则挖掘研究是数据挖掘研究的一项重要内容,旨在发现大规模数据集中项集之间有趣的关联关系或模式。关联规则可按多种标准进行分类,主要划分成单层与多层两类。近几年,关联规则的研究重点已经从对单层关联规则挖掘转向对多层及更高层关联规则的挖掘。人们希望通过数据挖掘对更高层次的数据进行分析,以便可以更好的利用这些数据。一方面,对较高概念层挖掘的关联规则能提供普遍意义的知识,另一方面,对于不同领域特别是在电子商务的应用中,在低层或原始层的数据项之间很难找到强关联规则。多层关联规则挖掘是对传统单层关联规则挖掘技术的拓展,与传统单层关联规则挖掘一样,多层关联规则挖掘也会产生海量关联规则信息,同样需要解决两个基本问题:如何提高效率,快速无损地找到所有的频繁项集;如何最大限度地去除冗余,产生感兴趣的关联规则。在现有技术中,文献[HEB.Distributedalgorithmform本文档来自技高网...

【技术保护点】
一种基于事务项约束扩展的多层关联规则挖掘方法,其特征在于,包括以下步骤:(1)、对概念层次树进行编码预处理(1.1)、建立概念层次树CT:根据原始项目表中的项目建立概念层次树CT,CTij表示概念层次树CT的第i(i=1,2…,n)层的第j(j=1,2,…,m)个节点,其中,n为CT的层数,m为CT第i层的节点数;(1.2)、对概念层次树CT编码:先从概念层次树CT的左端开始,分别对CT每层中的节点按序编号,再对CT中的每个节点按照父节点编号加本节点编号的组合方式得到每个节点的编码号;(1.3)、建立编码事务表:根据编码后的概念层次树CT,用编码号取代原始项目表中对应的事务项,生成编码事务表;...

【技术特征摘要】
1.一种基于事务项约束扩展的多层关联规则挖掘方法,其特征在于,包括以下步骤:
(1)、对概念层次树进行编码预处理
(1.1)、建立概念层次树CT:根据原始项目表中的项目建立概念层次树CT,CTij表示概念
层次树CT的第i(i=1,2…,n)层的第j(j=1,2,…,m)个节点,其中,n为CT的层数,m为CT第i
层的节点数;
(1.2)、对概念层次树CT编码:先从概念层次树CT的左端开...

【专利技术属性】
技术研发人员:马强张琦邢玲袁冬菊何燕玲
申请(专利权)人:西南科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1