一种基于DTW和周期提取的时间序列聚类方法技术

技术编号：21433525 阅读：62 留言：0更新日期：2019-06-22 12:19

本发明专利技术涉及一种时间序列聚类方法，尤其涉及一种基于DTW和周期提取的时间序列聚类方法，包括以下步骤：步骤一，提取商户最近六个月营业额时间序列；步骤二，对时间序列进行0位均值1为方差的标准化；步骤三，销售额时间序列分解为周期、趋势和残差，并提取周期；步骤四，用DTW距离替换聚类的欧式距离；步骤五，聚类得出常规商户的营业规律；本发明专利技术所提供的技术方案能够有效克服现有技术所存在的用常规的欧式距离度量周期性会受其他因素影响，且不具有周期提取功能，结果不准确的缺陷。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于DTW和周期提取的时间序列聚类方法
本专利技术涉及一种时间序列聚类方法，尤其涉及一种基于DTW和周期提取的时间序列聚类方法。
技术介绍
DynamicTimeWarping(DTW)诞生有一定的历史了，它出现的目的也比较单纯，是一种衡量两个长度不同的时间序列的相似度的方法，应用也比较广，主要是在模板匹配中，比如说用在孤立词语音识别、手势识别、数据挖掘和信息检索等中，在大部分的学科中，时间序列是数据的一种常见表示形式，对于时间序列处理来说，一个普遍的任务就是比较两个序列的相似性，在时间序列中，需要比较相似性的两段时间序列的长度可能并不相等，在语音识别领域表现为不同人的语速不同，运用在商户运营中时，根据商户最近三月的营业情况聚类商户的营业规律，而传统的时间序列聚类不能采用常用的欧式距离度量，周期性可能会受其他因素影响，因此，研发一种基于DTW和周期提取的时间序列聚类方法是解决上述问题的关键所在。在申请公布号为CN106777980A，申请公布日为2017.05.31的专利技术专利中公开了一种基于DTW的时间序列相似性预测方法，属于时间序列数据挖掘
该方法将目前已知的对DTW进行加速的方法，如LB_Kim、LB_Keogh、逆LB_Keogh和传统的DTW方法等进行级联，在不同阶段利用不同方法对查询集进行过滤。同时，为了提高查询准确性，在计算DTW距离之前对查询序列进行标准化，在读取数据的过程中，同步进行标准化，进一步提高算法效率。然后，将改进的DTW方法应用到时间序列的类比合成预测方法中，从而提高预测的速度与精度。本方法充分利用不同方法的优点，...

【技术保护点】
1.一种基于DTW和周期提取的时间序列聚类方法，其特征在于：包括以下步骤：步骤一，提取商户最近六个月营业额时间序列；步骤二，对时间序列进行0位均值1为方差的标准化；步骤三，销售额时间序列分解为周期、趋势和残差，并提取周期；步骤四，用DTW距离替换聚类的欧式距离；步骤五，聚类得出常规商户的营业规律。

【技术特征摘要】
1.一种基于DTW和周期提取的时间序列聚类方法，其特征在于：包括以下步骤：步骤一，提取商户最近六个月营业额时间序列；步骤二，对时间序列进行0位均值1为方差的标准化；步骤三，销售额时间序列分解为周期、趋势和残差，并提取周期；步骤四，用DTW距离替换聚类的欧式距离；步骤五，聚类得出常规商户的营业规律。2.根据权利要求1所述的基于DTW和周期提取的时间序列聚类方法，其特征在于：所述步骤一包括数据选取范围确定、缺失值处理、异常值处理。3.根据权利要求2所述的基于DTW和周期提取的时间序列聚类方法，其特征在于：所述缺失值处理缺失值用0补充表示该天未营业，所述异常值处理对每...

【专利技术属性】
技术研发人员：雷德军，
申请(专利权)人：客如云科技成都有限责任公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人