时间序列数据相似性确定方法、装置、设备及存储介质制造方法及图纸

技术编号:31680711 阅读:10 留言:0更新日期:2022-01-01 10:26
本申请公开了一种时间序列数据相似性确定方法,包括:利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,获得第一时间序列数据的第一抽象特征;利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,获得第二时间序列数据的第二抽象特征;基于第一抽象特征和第二抽象特征,确定第一时间序列数据和第二时间序列数据的相似性;其中,第一抽象特征空间和第二抽象特征空间的维度相同。应用本申请所提供的技术方案,基于维度相同的第一抽象特征和第二抽象特征,可以准确、有效地确定第一时间序列数据和第二时间序列数据的相似性。本申请还公开了一种时间序列数据相似性确定装置、设备及存储介质,具有相应技术效果。相应技术效果。相应技术效果。

【技术实现步骤摘要】
时间序列数据相似性确定方法、装置、设备及存储介质


[0001]本申请涉及计算机应用
,特别是涉及一种时间序列数据相似性确定方法、装置、设备及存储介质。

技术介绍

[0002]时间序列,或称动态数列是指将同一统计指标的数值按其发生时间的先后顺序排列而成的数列。时间序列数据是一类较为常见的数据,如商品日均价构成的时间序列数据,或者,在基站各小区采集到的终端信号构成的时间序列数据。根据观察时间的不同,时间序列数据中的时间可以是年份、季度、月份或其他任何时间形式。
[0003]在很多情况下,如在评价两个商品价格走势是否一致时,可以对相应的时间序列数据进行形态比较,确定相似性。
[0004]目前,多是基于欧几里得距离的相似度计算,确定两个时间序列数据的相似性。这种方式存在一定的局限性,其要求两个时间序列数据的长度必须相同,如果两个时间序列数据的长度不同,则将无法进行相似性的确定。所以,如何对时间序列数据的相似性进行准确、有效地确定,是目前本领域技术人员急需解决的技术问题。

技术实现思路

[0005]本申请的目的是提供一种时间序列数据相似性确定方法、装置、设备及存储介质,准确、有效地确定时间序列数据的相似性。
[0006]为解决上述技术问题,本申请提供如下技术方案:
[0007]一种时间序列数据相似性确定方法,包括:
[0008]获得第一时间序列数据和第二时间序列数据;
[0009]利用第一自编码器模型将所述第一时间序列数据映射到第一抽象特征空间,获得所述第一时间序列数据的第一抽象特征;
[0010]利用第二自编码器模型将所述第二时间序列数据映射到第二抽象特征空间,获得所述第二时间序列数据的第二抽象特征;
[0011]基于所述第一抽象特征和所述第二抽象特征,确定所述第一时间序列数据和所述第二时间序列数据的相似性;
[0012]其中,所述第一抽象特征空间和所述第二抽象特征空间的维度相同。
[0013]在本申请的一种具体实施方式中,通过以下步骤训练获得第一自编码器模型:
[0014]确定所述第一抽象特征空间的维度;
[0015]确定第一编码过程和第一解码过程中第一隐藏层的层数及输入输出维度,并构建第一编码函数和第一解码函数;所述第一编码过程的最后一个第一隐藏层的输出维度、所述解码过程的第一个第一隐藏层的输入维度和所述抽象特征空间的维度相同;
[0016]利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练,并在训练过程中,对所述第一隐藏层的层数及输入输出维
度进行调整。
[0017]在本申请的一种具体实施方式中,所述利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练,包括:
[0018]通过最小化损失函数,利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练。
[0019]在本申请的一种具体实施方式中,通过以下步骤训练获得第二自编码器模型:
[0020]确定所述第二抽象特征空间的维度;
[0021]确定第二编码过程和第二解码过程中第二隐藏层的层数及输入输出维度,并构建第二编码函数和第二解码函数;所述第二编码过程的最后一个第二隐藏层的输出维度、所述解码过程的第一个第二隐藏层的输入维度和所述抽象特征空间的维度相同;
[0022]利用所述第二时间序列数据对应的第二训练数据集对所述第二编码函数和所述第二解码函数的参数进行训练,并在训练过程中,对所述第二隐藏层的层数及输入输出维度进行调整。
[0023]在本申请的一种具体实施方式中,所述利用所述第二时间序列数据对应的第二训练数据集对所述第二编码函数和所述第二解码函数的参数进行训练,包括:
[0024]通过最小化损失函数,利用所述第二时间序列数据对应的第二训练数据集对所述第二编码函数和所述第二解码函数的参数进行训练。
[0025]在本申请的一种具体实施方式中,所述基于所述第一抽象特征和所述第二抽象特征,确定所述第一时间序列数据和所述第二时间序列数据的相似性,包括:
[0026]计算所述第一抽象特征和所述第二抽象特征的欧氏距离;
[0027]根据所述欧氏距离,确定所述第一时间序列数据和所述第二时间序列数据的相似性。
[0028]在本申请的一种具体实施方式中,所述根据所述欧氏距离,确定所述第一时间序列数据和所述第二时间序列数据的相似性,包括:
[0029]如果所述欧氏距离小于预设距离阈值,则确定所述第一时间序列数据和所述第二时间序列数据相似;
[0030]如果所述欧氏距离大于或等于所述距离阈值,则确定所述第一时间序列数据和所述第二时间序列数据不相似。
[0031]一种时间序列数据相似性确定装置,包括:
[0032]数据获得模块,用于获得第一时间序列数据和第二时间序列数据;
[0033]第一抽象特征获得模块,用于利用第一自编码器模型将所述第一时间序列数据映射到第一抽象特征空间,获得所述第一时间序列数据的第一抽象特征;利用第二自编码器模型将所述第二时间序列数据映射到第二抽象特征空间,获得所述第二时间序列数据的第二抽象特征;
[0034]相似性确定模块,用于基于所述第一抽象特征和所述第二抽象特征,确定所述第一时间序列数据和所述第二时间序列数据的相似性;
[0035]其中,所述第一抽象特征空间和所述第二抽象特征空间的维度相同。
[0036]一种时间序列数据相似性确定设备,包括:
[0037]存储器,用于存储计算机程序;
[0038]处理器,用于执行所述计算机程序时实现上述任一项所述的时间序列数据相似性确定方法的步骤。
[0039]一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的时间序列数据相似性确定方法的步骤。
[0040]应用本申请实施例所提供的技术方案,利用第一自编码器模型将第一时间序列数据映射到第一抽象特征空间,得到第一时间序列数据的第一抽象特征,利用第二自编码器模型将第二时间序列数据映射到第二抽象特征空间,得到第二时间序列数据的第二抽象特征。因为第一抽象特征空间和第二抽象特征空间的维度相同,所以获得的第一抽象特征和第二抽象特征的维度也相同。基于维度相同的第一抽象特征和第二抽象特征,可以准确、有效地确定第一时间序列数据和第二时间序列数据的相似性。
附图说明
[0041]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042]图1为本申请实施例中一种时间序列数据相似性确定方法的实施流程图;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种时间序列数据相似性确定方法,其特征在于,包括:获得第一时间序列数据和第二时间序列数据;利用第一自编码器模型将所述第一时间序列数据映射到第一抽象特征空间,获得所述第一时间序列数据的第一抽象特征;利用第二自编码器模型将所述第二时间序列数据映射到第二抽象特征空间,获得所述第二时间序列数据的第二抽象特征;基于所述第一抽象特征和所述第二抽象特征,确定所述第一时间序列数据和所述第二时间序列数据的相似性;其中,所述第一抽象特征空间和所述第二抽象特征空间的维度相同。2.根据权利要求1所述的方法,其特征在于,通过以下步骤训练获得第一自编码器模型:确定所述第一抽象特征空间的维度;确定第一编码过程和第一解码过程中第一隐藏层的层数及输入输出维度,并构建第一编码函数和第一解码函数;所述第一编码过程的最后一个第一隐藏层的输出维度、所述解码过程的第一个第一隐藏层的输入维度和所述抽象特征空间的维度相同;利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练,并在训练过程中,对所述第一隐藏层的层数及输入输出维度进行调整。3.根据权利要求2所述的方法,其特征在于,所述利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练,包括:通过最小化损失函数,利用所述第一时间序列数据对应的第一训练数据集对所述第一编码函数和所述第一解码函数的参数进行训练。4.根据权利要求1所述的方法,其特征在于,通过以下步骤训练获得第二自编码器模型:确定所述第二抽象特征空间的维度;确定第二编码过程和第二解码过程中第二隐藏层的层数及输入输出维度,并构建第二编码函数和第二解码函数;所述第二编码过程的最后一个第二隐藏层的输出维度、所述解码过程的第一个第二隐藏层的输入维度和所述抽象特征空间的维度相同;利用所述第二时间序列数据对应的第二训练数据集对所述第二编码函数和所述第二解码函数的参数进行训练,并在训练过程中,对所述第二隐藏层的层数及输入输出维度进行调整。5.根据权利要求4所述的方法,其特征...

【专利技术属性】
技术研发人员:陈静静吴睿振黄萍王凛
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1