【技术实现步骤摘要】
基于子序列全连接和最大团的时间序列模体发现方法
本专利技术涉及一种基于子序列全连接和最大团的时间序列模体发现方法,涉及信息处理
技术介绍
时间序列是按时间顺序排列的、具有相等时间间隔的一系列数据的集合。时间序列无处不在,使其在各个行业获得普遍的应用。例如金融领域的证券交易数据、气象领域的气温气压数据、工业领域的用电数据、医学领域的脑电波和心电图数据等等。在时间序列数据挖掘的诸多问题中,时间序列的模式发现是一个基础性问题。时间序列中的频繁模式、异常模式、周期模式对时间序列的关联规则发现,异常检测,预测等有重要作用。时间序列的模式发现包括查找事先指定模式和预先未知的模式。查找事先指定模式的问题(即按内容查询)已有诸多解决方法。然而,查找预先未知,重复出现的模式即时间序列模体发现(也称为时间序列的序列主题发现)问题则面临更多挑战。模体发现问题对于时间序列挖掘具有重要意义,可以用于解决数据划分,海量时间序列数据库的可视化与归类,包括聚类、分类、关联规则发现等问题。现有的模体发现算法存在计算复杂,并且无法发现多条模体的缺点,提高模体发现的效率,发现更多的模体是一个 ...
【技术保护点】
1.一种基于子序列全连接和最大团的时间序列模体发现方法,其特征在于,包括以下步骤:(1)子序列全连接使用长度为m的滑动窗口应用嵌套循环计算时间序列T中所有子序列之间的距离;(2)构建子序列相似图定义相似性阈值,小于相似性阈值的距离值用1表示,其他距离值用0表示,将距离矩阵转换为邻接矩阵;根据邻接矩阵得到图,此图称为子序列相似图;(3)寻找最大团使用最大团算法解决子序列相似图的最大团问题;所得最大团的顶点对应时间序列模体的实例。
【技术特征摘要】
1.一种基于子序列全连接和最大团的时间序列模体发现方法,其特征在于,包括以下步骤:(1)子序列全连接使用长度为m的滑动窗口应用嵌套循环计算时间序列T中所有子序列之间的距离;(2)构建子序列相似图定义相似性阈值,小于相似性阈值的距离值用1表示,其他距离值用0表示,将距离矩阵转换为邻接矩阵;根据邻接矩阵得到图,此图称为子序列相似图;(3)寻找最大团使用最大团算法解决子序列相似图的最大团问题;所得最大团的顶点对应时间序列模体的实例。2.根据权利要求1所述的基于子序列全连接和最大团的时间序列模体发现方法,其特征在于,所述步骤(1)中使用“超快速”的MASS算法得到距离矩阵;该算法的“超快速”在于其先对数据进行了快速傅里叶变换,然后执行点积操作,将点积操作结果再进行逆傅里叶变换,最后将逆傅里叶变换后的结果用于计算基于z-归一化的欧式距离,得到距离矩阵DistanceMatrix。3.根据权利要求2所述的基于子序列全连接和最大团的时间序列模体发现方法,其特征在于,所述步骤(1)中欧氏距离Dist[i]公式如下:其中...
【专利技术属性】
技术研发人员:王继民,朱跃龙,朱晓晓,张鹏程,
申请(专利权)人:河海大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。