用于时间序列的距离测量的方法、系统和可读介质技术方案

技术编号:32903314 阅读:24 留言:0更新日期:2022-04-07 11:53
时间序列距离估计系统可以接收两个时间序列并估计两个时间序列之间的距离或相异度。系统可以计算两个时间序列的时间规整函数,并在多级框架中交替执行趋势滤波,以进一步加快计算速度。计算速度。计算速度。

【技术实现步骤摘要】
用于时间序列的距离测量的方法、系统和可读介质
[0001]相关申请的交叉引用
[0002]本公开要求2020年11月18日提交的美国申请No.16/952,005的优先权权益,上述申请的全部内容通过引用合并于此。


[0003]本公开总体上涉及数据处理技术,尤其涉及用于时间序列的距离测量的方法、系统和可读介质。

技术介绍

[0004]两个时间序列(time series)之间的不同或差异的计算已经广泛应用于涉及时间序列之间距离(distance)的计算的许多应用中,例如,时间序列相似性搜索、异常点检测、聚类和分类等。两个时间序列之间的不同或差异的这种计算还可以用于许多不同的
,例如,其可以包括但不限于:语音识别、说话者识别、机器学习、信号处理、机器人学、经济和金融学、生物信息学。
[0005]然而,现实世界的时间序列数据通常包含噪声和异常值。这些噪声和异常值可能会使不同时间序列之间的距离产生偏差,并可能导致一个时间序列中的单个点(point)映射到另一个时间序列中的分段(即多个点)的奇点问题。此外,映射两个时间序列对应点(或确定两个时间序列之间的不同或差异)的现有方法具有至少是时间序列的长度的二次方的时间复杂性和空间复杂性,因而难以应用于长时间序列的分析。而且,一些现有方法不能处理与另一个时间序列相比较时一个时间序列中的一些数据或点是缺失的情况,因此,这些方法不能相对于另一个时间序列找到一个时间序列中的匹配部分或不能相对于另一个时间序列填充一个时间序列中的缺失部分。如果不解决这些问题,映射两个时间序列(或确定两个时间序列之间的不同或差异)的现有方法将不可避免地导致高的计算和存储工作量,从而限制其在
中的应用,例如,如上文所述的语音识别、机器学习、信号处理、机器人学等。

技术实现思路

[0006]本公开的一个目的是提供用于时间序列的距离测量的方法、系统和可读介质。
[0007]根据本公开实施例的第一方面,提供一种用于时间序列的距离测量的方法,所述方法包括:
[0008]去趋势化第一时间序列和第二时间序列;
[0009]迭代地下采样所述第一去趋势化时间序列和所述第二去趋势化时间序列,以分别获得多个级别的所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示;
[0010]在所述多个级别中从最高级别到最低级别的每一级别上连续地对所述第一去趋势化时间序列的相应表示和所述第二去趋势化时间序列的相应表示迭代地执行多个操作;以及
[0011]在返回所述第一时间序列和所述第二时间序列之间的估计距离时,至少部分地基于所述第一去趋势化时间序列的最低级别表示和所述第二去趋势化时间序列的最低级别表示。
[0012]在一些实施例中,还包括:
[0013]在去趋势化所述第一时间序列和所述第二时间序列之前,对所述第一时间序列和所述第二时间序列执行归一化。
[0014]在一些实施例中,当前级别是最高级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:
[0015]在当前级别上对所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示执行动态时间规整,以获得所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示之间的规整路径。
[0016]在一些实施例中,当前级别是低于最高级别的级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:
[0017]在高于当前级别的先前级别上对所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示之间的规整路径进行上采样,以获得当前级别的新的规整路径,以及生成针对当前级别的搜索约束;以及
[0018]针对先前级别的趋势估计进行上采样作为当前级别的趋势估计。
[0019]在一些实施例中,所述多个操作还包括时间规整对准操作,在所述多个级别中从最高级别到最低级别的每个级别执行所述时间规整对准操作包括:
[0020]通过在当前级别执行具有搜索约束的动态时间规整来改进新的规整路径。
[0021]在一些实施例中,所述多个操作还包括时间图去趋势化操作,在所述多个级别中从最高级别到最低级别的每个级别上执行所述时间图去趋势化操作包括:
[0022]使用上采样的所述趋势估计和改进的所述规整路径生成图;
[0023]至少部分地基于生成的所述图更新当前级别的所述趋势估计;以及
[0024]在当前级别上计算所述第一去趋势化时间序列的表示与所述第二去趋势化时间序列的表示之间的距离。
[0025]在一些实施例中,还包括:
[0026]去除所述第一时间序列的缺失数据段和所述第二时间序列的对准的对应数据段。
[0027]在一些实施例中,所述第一时间序列和所述第二时间序列包括两个信号,所述两个信号是在应用的不同时间段内获得的,并被比较以确定所述两个信号是否被认为是相同的或来自相同的源。
[0028]在一些实施例中,所述应用包括:语音识别、说话者识别、机器学习、信号处理、机器人学和生物信息学中的至少一个。
[0029]根据本公开实施例的第二方面,提供一种用于时间序列的距离测量的计算机可读介质,所述计算机可读介质存储可执行指令,所述可执行指令在由一个或多个处理器执行时使得所述一个或多个处理器执行行为,所述行为包括:
[0030]去趋势化第一时间序列和第二时间序列;
[0031]迭代地下采样所述第一去趋势化时间序列和所述第二去趋势化时间序列,以分别获得多个级别的所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示;
[0032]在所述多个级别中从最高级别到最低级别的每一级别上连续地对所述第一去趋势化时间序列的相应表示和所述第二去趋势化时间序列的相应表示迭代地执行多个操作;以及
[0033]在返回所述第一时间序列和所述第二时间序列之间的估计距离时,至少部分地基于所述第一去趋势化时间序列的最低级别表示和所述第二去趋势化时间序列的最低级别表示。
[0034]在一些实施例中,所述行为还包括:
[0035]在去趋势化所述第一时间序列和所述第二时间序列之前,对所述第一时间序列和所述第二时间序列执行归一化。
[0036]在一些实施例中,当前级别是最高级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:
[0037]在当前级别上对所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示执行动态时间规整,以获得所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示之间的规整路径。
[0038]在一些实施例中,当前级别是低于最高级别的级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于时间序列的距离测量的方法,所述方法包括:去趋势化第一时间序列和第二时间序列;迭代地下采样所述第一去趋势化时间序列和所述第二去趋势化时间序列,以分别获得多个级别的所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示;在所述多个级别中从最高级别到最低级别的每一级别上连续地对所述第一去趋势化时间序列的相应表示和所述第二去趋势化时间序列的相应表示迭代地执行多个操作;以及在返回所述第一时间序列和所述第二时间序列之间的估计距离时,至少部分地基于所述第一去趋势化时间序列的最低级别表示和所述第二去趋势化时间序列的最低级别表示。2.根据权利要求1所述的方法,还包括:在去趋势化所述第一时间序列和所述第二时间序列之前,对所述第一时间序列和所述第二时间序列执行归一化。3.根据权利要求1所述的方法,其中,当前级别是最高级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:在当前级别上对所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示执行动态时间规整,以获得所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示之间的规整路径。4.根据权利要求1所述的方法,其中,当前级别是低于最高级别的级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:在高于当前级别的先前级别上对所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示之间的规整路径进行上采样,以获得当前级别的新的规整路径,以及生成针对当前级别的搜索约束;以及针对先前级别的趋势估计进行上采样作为当前级别的趋势估计。5.根据权利要求4所述的方法,其中,所述多个操作还包括时间规整对准操作,在所述多个级别中从最高级别到最低级别的每个级别执行所述时间规整对准操作包括:通过在当前级别执行具有搜索约束的动态时间规整来改进新的规整路径。6.根据权利要求5所述的方法,其中,所述多个操作还包括时间图去趋势化操作,在所述多个级别中从最高级别到最低级别的每个级别上执行所述时间图去趋势化操作包括:使用上采样的所述趋势估计和改进的所述规整路径生成图;至少部分地基于生成的所述图更新当前级别的所述趋势估计;以及在当前级别上计算所述第一去趋势化时间序列的表示与所述第二去趋势化时间序列的表示之间的距离。7.根据权利要求1所述的方法,还包括:去除所述第一时间序列的缺失数据段和所述第二时间序列的对准的对应数据段。8.根据权利要求1所述的方法,其中,所...

【专利技术属性】
技术研发人员:宋晓旻文青松李岩孙亮
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1