一种低消耗的Apriori方法技术

技术编号：12653666 阅读：62 留言：0更新日期：2016-01-06 11:37

本发明专利技术涉及一种低消耗的Apriori方法，用于对智能移动终端的移动轨迹的关联移动规则进行挖掘，包括将移动节点移动轨迹的时间属性与空间属性一同作为挖掘对象数据，充分考虑移动轨迹的时间和空间双重属性，并且在由候选频繁项集生成频繁项集的过程中，缩小移动轨迹数据集扫描范围，减少获取候选项集的时间，从而达到低消耗的目的。相较于传统Apriori方法，本发明专利技术提供的Apriori方法适用于挖掘智能移动终端的移动轨迹关联规则。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及。
技术介绍
如何在海量的数据中，挖掘其中隐藏的、人们感兴趣的知识，已经成为了一个研究的热点。Agrawal等在1994年提出使用Apriori方法对顾客交易的数据库项之间的关联规则进行挖掘，运种方法分成W下两部分来完成：首先，找出数据库中所有出现频率比最小支持度大或者相等的频繁项集；然后，根据所得到的频繁项集来制定强关联规则，同时运些强关联规则必须要满足最小可信度W及最小支持度运两个基本的条件。从上面方法实现的两个部分可W看出，Apriori方法的实现分成W下两个步骤： 1、首先使用迭代方法对数据集中的所有项集进行扫描，并且设定一个支持度阔值，筛选出数据集中的所有频繁项集，即将支持度低于阔值的项集全部淘汰掉，而将支持度高于运个阔值的项集认为是频繁项集；2、得到所有的频繁项集之后，就可W利用它挖掘出强关联规贝1J，对于每个频繁项集1产生强关联规则的基本步骤可W总结为W下两步：a、生成1所有的非空真子集；b、对于1的每个非空真子集1,，如果1的支持度除W1,的支持度大于或等于 min_corif，则输出强关联规则1,一（1-1,)。传统Apriori方法其挖掘对象的事务数据库中，内部的事务条目只具有空间属性，不适用于挖掘移动节点移动轨迹关联规则。阳0化]另外，如果将传统的Apriori方法直接移植到硬件资源有限的移动终端中应用，效率会变得非常低，首先在于执行过程中需要消耗较高的存储空间来保存大量的候选项集，其次需要消耗较长时间的CPU资源对整个移动轨迹数据集进行多次重复的扫描来获得全部候选项集。因此，...

【技术保护点】
一种低消耗的Apriori方法，用于对智能移动终端的移动轨迹的关联移动规则进行挖掘，其特征在于：包括如下步骤：步骤一、使用迭代方法挖掘智能移动终端的移动轨迹数据集中所有频繁项集，并记录每个频繁项集的日期，计算每个频繁项集的支持度；步骤二、利用步骤一得出的频繁项集，生成移动节点所有可能的关联移动规则，并计算每条移动规则的置信度，记录移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子；同时，根据记录的日期和计算的日期远近变动因子，计算每条关联移动规则的日期加权值TWeight(R)，从而得到强关联性移动规则；其中，每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下：m=|MaxDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek,n=|MinDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek;]]>每条关联移动规则的日期加权值TWeight(R)计算公式如下：TWeight(R)=RuleDate-MinDatenMaxDatem·MinDate...

【技术特征摘要】

【专利技术属性】
技术研发人员：郑紫微，金涛，
申请(专利权)人：宁波大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人