一种时间序列的模式聚类方法技术

技术编号:16780100 阅读:107 留言:0更新日期:2017-12-13 00:12
一种时间序列的模式聚类方法,设定频谱解析度参数整数数值2N;将输入的时域序列进行快速傅立叶变换,并计算出频谱,取前半段的谱系数作主成分,长度为N;累计m个时间序列的谱,即m个N维度矢量,计算这m个矢量之间的DTW距离,组成m*m的距离方阵;所述距离方阵逐行遍历。本发明专利技术采用信号的频域低频段部分作DTW距离比对,并在未知类别数目下,能够进行自动聚类,待聚类终止,自动定出数据的类别数目。

A pattern clustering method for time series

A method of clustering time series model, set the spectrum resolution parameter integer value 2N; time domain sequence input fast Fu Liye transform, and calculate the spectrum, spectrum coefficients of principal components from the first half of the total length of N, m; time series spectrum, namely m N dimension vector calculation the M vector DTW distance, m*m distance matrix; the distance matrix traversing. The invention uses the low frequency part of the signal in the frequency domain to make the DTW distance comparison, and can automatically cluster under the unknown number of categories, and automatically terminate the number of data when clustering is terminated.

【技术实现步骤摘要】
一种时间序列的模式聚类方法
本专利技术涉及时间序列聚类领域,尤其是一种时间序列的模式聚类方法。
技术介绍
在时间序列模式聚类中,无论是有监督聚类、还是无监督聚类一般总是要预先设定类别的数目。例如k均值聚类的k值就是k个类别,模糊c均值聚类就是c个类别,而层次聚类可使用类别数目作合并操作循环的终止阈值,相当于仍是预定了类别数。至于有监督聚类时,用于训练学习的标注数据集可以看成已经定义了的类别数目以及对应的各类样本。在类别数目未知下,如何进行无监督聚类学习仍是一个开放的课题。在时间序列相似(异)性评判时往往使用时域序列的距离来评价,如果考虑将信号转成频域,利用频域的低频段作主成分来进行距离评测,可以忽略时域对比时的高频细节的干扰。此外,通常的距离比对仍有不少缺陷,比如对信号在时间轴上的平移、伸缩乃至对于振幅的压扩都比较敏感。
技术实现思路
为了克服已有在时间序列模式聚类方式的无法在未知类别数目情况下进行自动聚类的不足,本专利技术提供一种在未知类别数目情况下实现自动聚类的时间序列的模式聚类方法。本专利技术解决其技术问题所采用的技术方案是:一种时间序列的模式聚类方法,所述模式聚类方法包括以下步骤本文档来自技高网...
一种时间序列的模式聚类方法

【技术保护点】
一种时间序列的模式聚类方法,其特征在于:所述模式聚类方法包括以下步骤:1)设定频谱解析度参数整数数值2N,任何时域长度低于2N的时间序列模式都可以作为输入,当输入长度不满2N时,多余的位置可以使用0填充;2)将输入的时域序列进行快速傅立叶变换,并计算出频谱,取前半段的谱系数作主成分,长度为N;3)累计m个时间序列的谱,即m个N维度矢量,计算这m个矢量之间的DTW距离,组成m*m的距离方阵;4)所述距离方阵逐行遍历,过程为:设置一个类别序号增加变量,并预先设定2个m维度的标志矢量,矢量一为聚类过程的中间记录参数,记录每一个序列谱的是否已经被访问的情况;矢量二为聚类输出,记录m个谱的分属于各自类的...

【技术特征摘要】
1.一种时间序列的模式聚类方法,其特征在于:所述模式聚类方法包括以下步骤:1)设定频谱解析度参数整数数值2N,任何时域长度低于2N的时间序列模式都可以作为输入,当输入长度不满2N时,多余的位置可以使用0填充;2)将输入的时域序列进行快速傅立叶变换,并计算出频谱,取前半段的谱系数作主成分,长度为N;3)累计m个时间序列的谱,即m个N维度矢量,计算这m个矢量之间的DTW距离,组成m*m的距离方阵;4)所述距离方阵逐行遍历,过程为:设置一个类别序号增加变量,并预先设定2个m维度的标志矢量,矢量一为聚类过程的中间记录参数,记录每一个序列谱的是否已经被访问的情况;矢量二为聚类输出,记录m个谱的分属于各自类的序号;按行遍历该方阵;5)当前行是否已经被访问?如是,跳到下一行,继续行遍历该矩阵;如否,将当前行标志为已经访问,且将当前行标注类别序号,即取作类别序号增加变量的当前数值;6)计算当前行除了主对角元外,数值低于第一固定阈值...

【专利技术属性】
技术研发人员:陆成刚
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1