一种时间序列聚类方法、系统、设备以及介质技术方案

技术编号:32120101 阅读:30 留言:0更新日期:2022-01-29 19:06
本发明专利技术公开了一种时间序列聚类方法,包括以下步骤:获取多个时间序列并提取每一个时间序列对应的特征向量;获取多个特征向量的聚类K值;利用预设聚类算法和所述聚类K值对多个所述特征向量进行聚类;根据聚类结果对所述多个时间序列进行聚类。本发明专利技术还公开了一种系统、计算机设备以及可读存储介质。本发明专利技术提出的方案通过提取时间序列的特征向量,实现了对时间序列的降维,针对降维后的数据,利用聚类算法对其进行聚类,最终实现了时间序列的聚类分析。这样,保证所有时间序列的特征空间的维度一致,同时对时间序列的采样步长没有要求,且在提取特征向量时也考虑到了时间信息。在提取特征向量时也考虑到了时间信息。在提取特征向量时也考虑到了时间信息。

【技术实现步骤摘要】
一种时间序列聚类方法、系统、设备以及介质


[0001]本专利技术涉及聚类领域,具体涉及一种时间序列聚类方法、系统、设备以及存储介质。

技术介绍

[0002]时间序列是一类最常见的数据,目前时间序列分析重点研究的多是时间序列的预测。但针对有些问题,时间序列的形态比较也是一类重要的问题。例如:各种商品每日均价(或者股票的每日收盘价格)构成了时间序列,如何评价商品价格走势的一致性,就可以归结为时间序列形态聚类问题。
[0003]为了保证系统、服务的可靠性和稳定性,监控系统日渐成为每个公司、企业的一个必不可少的系统。随着服务、机器等数量越来越多,如何分析海量时间序列KPI成为我们在智能运维领域首先需要解决的问题。在众多的时间序列中,有一些序列存在强相关性,如果我们能将时序数据进行快速准确地聚类,只对不同类别的数据进行分析,这样就能大大降低后续数据分析与挖掘工作的开销。
[0004]由于时间序列的维度(采样的时间点)一般比较高,有的甚至高达上千维上万维;其次,时间序列是随着时间变化的,所以包含了时间信息在里面,如果只是简单的进行相似度的计本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种时间序列聚类方法,其特征在于,包括以下步骤:获取多个时间序列并提取每一个时间序列对应的特征向量;获取多个特征向量的聚类K值;利用预设聚类算法和所述聚类K值对多个所述特征向量进行聚类;根据聚类结果对所述多个时间序列进行聚类。2.如权利要求1所述的方法,其特征在于,提取每一个时间序列对应的特征向量,进一步包括:构建编码函数和解码函数;对所述编码函数和所述解码函数进行训练;利用训练后的编码函数提取每一个时间序列的特征向量。3.如权利要求2所述的方法,其特征在于,对所述编码函数和所述解码函数进行训练,进一步包括:将时间序列输入到所述编码函数得到抽象特征向量;将所述抽象特征向量输入到解码函数中以得到输出向量;利用所述输出向量和输入到所述编码函数中的时间序列计算损失值;根据所述损失值调整所述编码函数中隐藏层的数量和每一个隐藏层的输入输出维度以及调整所述解码函数中隐藏层的数量和每一个隐藏层的输入输出维度,直到所述损失值满足预设要求。4.如权利要求1所述的方法,其特征在于,利用预设聚类算法和所述聚类K值对多个所述特征向量进行聚类,进一步包括:从所述多个特征向量中随机选择K个特征向量作为初始质心;将K个初始质心作为聚类质心;计算每一个特征向量分别与每一个聚类质心的距离并将特性向量划分到距离最小的聚类质心的集合;计算当前每一个集合的质心并计算每一个集合的质心与对应的聚类质心之间的距离;响应于集合的质心与对应的聚类质心之间的距离大于阈值,利用集合质心作为聚类质心,返回计算每一个特征向量分别与每一个聚类质心的距离并将特性向量划分到距离最小的聚类质心的集合的步骤。5.一种时间序列聚类系统,其特征在于,包括:提取模块,配置为获取多个时间序列并提取每一个时间序列对应的特征向量;获取模块,配置为获取多个特征向量的聚类K值;第一聚类模块,配置为利用预设聚类算...

【专利技术属性】
技术研发人员:陈静静吴睿振王凛黄萍
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1