【技术实现步骤摘要】
基于片段聚类的序列数据关联规则挖掘方法
本专利技术属于计算机学科下的数据挖掘领域,具体涉及一种针对序列数据中具有相同变化趋势的序列片段间的关联规则挖掘方法。
技术介绍
关联规则分析能从大量的事务集中挖掘其中的相关关系、揭示事务集中的潜在关联关系。关联规则挖掘能够关联规则挖掘发现大量数据中项集之间有趣的关联或者相互联系,但一般来说是对于事务自身数据的频繁项集进行挖掘。而时间序列预测一般采用回归预测的方法分析时间数列,从中寻找序列中随时间变化而变化的规律,但对于子序列间的相关和关联关系挖掘较少。序列数据中的变化趋势指的是序列或者某些子序列中的数据升降变化的规律,如先升后降、升多降少等,具体来说序列的趋势就是对这些序列的进一步抽象,是一种更高层次的聚合,相同内容的多个事务,在不同的上下文中会表现出不同的趋势;同理,不同的多个事务序列,也可能表达相近的趋势。在时间序列中,不同的变化趋势表达为不同的数据曲线形状,但经常会有多个序列具有非常相似的形状,但是这些形状在x轴上并不是对齐的,也就是说,相似的两段时间序列的长度可 ...
【技术保护点】
1.基于片段聚类的序列数据关联规则挖掘方法,其特征在于,包括以下步骤:/n步骤一、设定滑动窗口大小w,聚类个数clusterNum、迭代次数num_iter、阈值mDtw;/n步骤二、根据w,使用滑动窗口算法,将原始序列数据S划分为子序列集合subS;/n步骤三、将每一个子序列进行归一化,归一化的方法如公式(1)所示,/n
【技术特征摘要】
1.基于片段聚类的序列数据关联规则挖掘方法,其特征在于,包括以下步骤:
步骤一、设定滑动窗口大小w,聚类个数clusterNum、迭代次数num_iter、阈值mDtw;
步骤二、根据w,使用滑动窗口算法,将原始序列数据S划分为子序列集合subS;
步骤三、将每一个子序列进行归一化,归一化的方法如公式(1)所示,
其中,针对每一子序列,vMax和vMin为该子序列的最大值和最小值,v为子序列中的值;
步骤四、使用k-means算法对子序列进行聚类,聚类方法如下:
步骤4.1、随机选择clusterNum个中心点,命名第i个类的中心点为Oi;
步骤4.2、令迭代次数k=0;
步骤4.3、针对每个子序列,使用DTW算法计算该子序列与每一个中心点Oi的DTW距离;
步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。