【技术实现步骤摘要】
用于时间序列的距离测量的方法、系统和可读介质
[0001]相关申请的交叉引用
[0002]本公开要求2020年11月18日提交的美国申请No.16/952,005的优先权权益,上述申请的全部内容通过引用合并于此。
[0003]本公开总体上涉及数据处理技术,尤其涉及用于时间序列的距离测量的方法、系统和可读介质。
技术介绍
[0004]两个时间序列(time series)之间的不同或差异的计算已经广泛应用于涉及时间序列之间距离(distance)的计算的许多应用中,例如,时间序列相似性搜索、异常点检测、聚类和分类等。两个时间序列之间的不同或差异的这种计算还可以用于许多不同的
,例如,其可以包括但不限于:语音识别、说话者识别、机器学习、信号处理、机器人学、经济和金融学、生物信息学。
[0005]然而,现实世界的时间序列数据通常包含噪声和异常值。这些噪声和异常值可能会使不同时间序列之间的距离产生偏差,并可能导致一个时间序列中的单个点(point)映射到另一个时间序列中的分段(即多个点)的奇点问题。此外,映射两个时间序列对应点(或确定两个时间序列之间的不同或差异)的现有方法具有至少是时间序列的长度的二次方的时间复杂性和空间复杂性,因而难以应用于长时间序列的分析。而且,一些现有方法不能处理与另一个时间序列相比较时一个时间序列中的一些数据或点是缺失的情况,因此,这些方法不能相对于另一个时间序列找到一个时间序列中的匹配部分或不能相对于另一个时间序列填充一个时间序列中的缺失部分。如果不解决这些问题,映射 ...
【技术保护点】
【技术特征摘要】
1.一种用于时间序列的距离测量的方法,所述方法包括:去趋势化第一时间序列和第二时间序列;迭代地下采样所述第一去趋势化时间序列和所述第二去趋势化时间序列,以分别获得多个级别的所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示;在所述多个级别中从最高级别到最低级别的每一级别上连续地对所述第一去趋势化时间序列的相应表示和所述第二去趋势化时间序列的相应表示迭代地执行多个操作;以及在返回所述第一时间序列和所述第二时间序列之间的估计距离时,至少部分地基于所述第一去趋势化时间序列的最低级别表示和所述第二去趋势化时间序列的最低级别表示。2.根据权利要求1所述的方法,还包括:在去趋势化所述第一时间序列和所述第二时间序列之前,对所述第一时间序列和所述第二时间序列执行归一化。3.根据权利要求1所述的方法,其中,当前级别是最高级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:在当前级别上对所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示执行动态时间规整,以获得所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示之间的规整路径。4.根据权利要求1所述的方法,其中,当前级别是低于最高级别的级别,所述多个操作包括预测和上采样操作,并且在所述多个级别中从最高级别到最低级别的每个级别上执行所述预测和上采样操作包括:在高于当前级别的先前级别上对所述第一去趋势化时间序列的表示和所述第二去趋势化时间序列的表示之间的规整路径进行上采样,以获得当前级别的新的规整路径,以及生成针对当前级别的搜索约束;以及针对先前级别的趋势估计进行上采样作为当前级别的趋势估计。5.根据权利要求4所述的方法,其中,所述多个操作还包括时间规整对准操作,在所述多个级别中从最高级别到最低级别的每个级别执行所述时间规整对准操作包括:通过在当前级别执行具有搜索约束的动态时间规整来改进新的规整路径。6.根据权利要求5所述的方法,其中,所述多个操作还包括时间图去趋势化操作,在所述多个级别中从最高级别到最低级别的每个级别上执行所述时间图去趋势化操作包括:使用上采样的所述趋势估计和改进的所述规整路径生成图;至少部分地基于生成的所述图更新当前级别的所述趋势估计;以及在当前级别上计算所述第一去趋势化时间序列的表示与所述第二去趋势化时间序列的表示之间的距离。7.根据权利要求1所述的方法,还包括:去除所述第一时间序列的缺失数据段和所述第二时间序列的对准的对应数据段。8.根据权利要求1所述的方法,其中,所...
【专利技术属性】
技术研发人员:宋晓旻,文青松,李岩,孙亮,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。