【技术实现步骤摘要】
本专利技术属于数据挖掘
,更为具体地讲,涉及一种基于事务项约束扩展的多层关联规则挖掘方法。
技术介绍
关联规则挖掘研究是数据挖掘研究的一项重要内容,旨在发现大规模数据集中项集之间有趣的关联关系或模式。关联规则可按多种标准进行分类,主要划分成单层与多层两类。近几年,关联规则的研究重点已经从对单层关联规则挖掘转向对多层及更高层关联规则的挖掘。人们希望通过数据挖掘对更高层次的数据进行分析,以便可以更好的利用这些数据。一方面,对较高概念层挖掘的关联规则能提供普遍意义的知识,另一方面,对于不同领域特别是在电子商务的应用中,在低层或原始层的数据项之间很难找到强关联规则。多层关联规则挖掘是对传统单层关联规则挖掘技术的拓展,与传统单层关联规则挖掘一样,多层关联规则挖掘也会产生海量关联规则信息,同样需要解决两个基本问题:如何提高效率,快速无损地找到所有的频繁项集;如何最大限度地去除冗余,产生感兴趣的关联规则。在现有技术中,文献[HEB.Distributedalg ...
【技术保护点】
一种基于事务项约束扩展的多层关联规则挖掘方法,其特征在于,包括以下步骤:(1)、对概念层次树进行编码预处理(1.1)、建立概念层次树CT:根据原始项目表中的项目建立概念层次树CT,CTij表示概念层次树CT的第i(i=1,2…,n)层的第j(j=1,2,…,m)个节点,其中,n为CT的层数,m为CT第i层的节点数;(1.2)、对概念层次树CT编码:先从概念层次树CT的左端开始,分别对CT每层中的节点按序编号,再对CT中的每个节点按照父节点编号加本节点编号的组合方式得到每个节点的编码号;(1.3)、建立编码事务表:根据编码后的概念层次树CT,用编码号取代原始项目表中对应的事务 ...
【技术特征摘要】
1.一种基于事务项约束扩展的多层关联规则挖掘方法,其特征在于,包括以下步骤:
(1)、对概念层次树进行编码预处理
(1.1)、建立概念层次树CT:根据原始项目表中的项目建立概念层次树CT,CTij表示概念
层次树CT的第i(i=1,2…,n)层的第j(j=1,2,…,m)个节点,其中,n为CT的层数,m为CT第i
层的节点数;
(1.2)、对概念层次树CT编码:先从概念层次树CT的左端开...
【专利技术属性】
技术研发人员:马强,张琦,邢玲,袁冬菊,何燕玲,
申请(专利权)人:西南科技大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。