【技术实现步骤摘要】
一种基于变量相关性的多元时间序列相似性搜索方法
[0001]本专利技术属于信息
,特别涉及一种基于变量相关性的多元时间序列相似性搜索方法。
技术介绍
[0002]时间序列是按照时间顺序排列的一系列观测值的集合,广泛存在于现实世界的各个领域,包括金融、气象、医疗、工程等。随着科学技术的不断发展,时间序列数据越来越丰富,且时间序列相似搜索对时间序列预测、分类、聚类、知识发现等有着重要的意义,因此,时间序列相似搜索越来越受到研究者们的重视。
[0003]目前,针对一元时间序列相似度量的研究比较多,研究成果也较为丰富,但是针对多元时间序列相似度量的研究还不是很多,主要原因在于,很多适用于一元时间序列相似度量的方法无法直接用于多元时间序列的研究(如最长公共子序列、编辑距离等),而适用于多元时间序列的相似度量方法(如动态时间弯曲、欧氏距离等)往往无法平衡计算效率与查询准确率之间的矛盾,因此针对多元时间序列相似度量方法还需要进一步的研究。
[0004]由于多元时间序列比一元时间序列有更多的变量,因此计算相似度时也会有 ...
【技术保护点】
【技术特征摘要】
1.一种基于变量相关性的多元时间序列相似性搜索方法,其特征在于,包括以下步骤:(1)对预先获取的多元时间序列进行归一化处理;(2)计算归一化后查询序列变量间的皮尔逊相关系数,将变量间的两两相关性记录在矩阵中;(3)以变量间的Pearson相关性为基础,使用OPTICS聚类,将相关系数高,且相关性为正的变量序列聚成一类;(4)提取聚类后每个类的中心序列作为原始多元时间序列的变量维特征序列,使用中心序列代表该类,中心序列通过计算该类所有序列同一时间点的平均值得到;(5)对所有中心序列使用PAA进行时间维度的特征提取,获得多元时间序列的时间维度特征表示序列;(6)计算对变量维和时间维特征提取后多元时间序列特征序列间的DTW距离,找出相似序列。2.根据权利要求1所述的基于变量相关性的多元时间序列相似性搜索方法,其特征在于,所述步骤(1)实现过程如下:通过归一化公式将原始数据映射至[0
‑
1]之间,对于多元时间序列:X
m
×
l
={x
1i
,x
2i
,
…
,x
mi
},i=1,2,
…
,l归一化公式如下:其中,x
′
ij
为转换后的值,x
ij
为原始值,表示第i个变量的第j个时间点的数据,x
i
(min)为第i行的最小值,即第i个变量的最小值,x
i
(max)为第i行的最大值,即第i个变量的最大值。3.根据权利要1所述的基于变量相关性的多元时间序列相似性搜索方法,其特征在于,所述步骤(2)实现过程如下:采用皮尔逊相关系数,计算所有变量间的两两相关性,根据变量间的相关性判断两变量是否可以归为一类,皮尔逊相关系数计算公式如下:其中,x
i
和x
j
分别表示多元时间序列的两个不同的变量序列,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。