一种基于极值点和转折点的时间序列降维方法技术

技术编号:11831478 阅读:145 留言:0更新日期:2015-08-05 16:41
本发明专利技术开了一种基于极值点和转折点的时间序列降维方法,包括如下步骤:步骤1、定义原始时间序列;给定极值点保持时间段阀值K0和序列转折夹角阀值θ0;步骤2、选取原始时间序列的重要局部极值点,存入关键点序列XKP中;步骤3、选取原始时间序列的重要转折点,存入关键点序列XKP中;步骤4、按照时间先后顺序连接关键点序列XKP中的点,得出的序列作为原始时间序列X的降维序列。综上所述,本发明专利技术提出的基于重要极值点和转折点时间序列降维方法,该方法具有以下两方面的优点:一方面,解决了传统降维方法不能很好地处理短时间内波动频繁的时间序列的问题。另一方面,不仅操作简单,计算复杂度低,大大的减少存储和计算成本,为时间序列后续的挖掘分析带来帮助。

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域,具体涉及到时间序列的降维、时间序列的关键点识别 和提取方法。
技术介绍
时间序列作为一种重要的按照时间先后顺序排列的数据对象,广泛存在于经济、 交通、工程、社会等众多领域。数据挖掘技术是上个世纪九十年代中后期兴起的一门跨学科 的综合研宄领域,旨在从海量数据中提取出潜在的、有价值的知识甚至规律;而作为一种常 见而重要的数据类型,时间序列的数据挖掘和分析是目前数据挖掘中最具有研宄意义的问 题之一。如何分析和处理这些海量的时间序列数据,并从中发现一些事先未知的、有价值的 信息,正受到越来越多研宄者的关注和重视。 由于时间序列具有多维、短期波动频繁、大量噪声干扰以及非稳态等特点,直接在 原始时间序列上进行相似性查询、分类和聚类、模式发现等数据挖掘工作,不但存储和计算 效率低下,而且降低了算法的准确性和可靠性,难以获得满意结果。所以,为了提高数据挖 掘过程的效率和结果的质量,在对序列数据进行分析之前,必须对原始数据序列进行预处 理,压缩原始序列以换取更小的存储和计算代价,同时最大限度的保留原始序列的特征信 息,去除细节的干扰,为下一步的数据挖掘分析打下良好的基础。 国内外在时间序列降维预处理方面已经提出了多种方法,其中基于关键点提取的 方法是一种有效且常用的时间序列降维方法,该方法将时间序列中重要的、具有代表意义 的点都保留下来,在保证数据分析精度的情况下,尽可能的进行时间序列数据的压缩。关键 点提取的方法也不尽相同: 一种方法是通过提取序列中的极值点来实现序列的降维,这种降维算法尽管操作 简单,但不能有效地去除噪音,过多地保留了细节变化,降低了压缩率; -种方法是选取保持极值时间段(即该点与前后极值点的时间段)大于某个自 定义阈值的极值点来实现序列的降维。该方法虽然可以较好地过滤变化短暂的噪音数据, 然而由于限定了极值点保持时间段,对于变化时长小于要求的极值保持时间段阀值的极值 点,则被认为是噪音数据而被忽略; -种方法是结合极值点法和转折角度法,选取保持极值的时间段大于某个阈值的 极值点以及与前后数据的均值之差大于某个阀值的非极值点来实现序列的降维。这种方 法虽然考虑到了转折程度大的非极值点,然而该方法在进行极值点筛选时,无法识别两个 连续的值相等的特殊局部极值点,导致重要极值点被遗漏;且该算法在进行重要点的筛选 时,认为包含点Xi的最短序列(x Xi, xi+1)中,点Xi与线段x HXi+1的中点【主权项】1. ,其特征在于,包括如下步骤: 步骤1、定义原始时间序列;给定极值点保持时间段阀值Ktl和序列转折夹角阀值0M 步骤2、选取原始时间序列的重要局部极值点,存入关键点序列Xkp中; 步骤3、选取原始时间序列的重要转折点,存入关键点序列Xkp中; 步骤4、按照时间先后顺序连接关键点序列Xkp中的点,得出的序列作为原始时间序列X 的降维序列。2. 根据权利要求1所述的基于极值点和转折点的时间序列降维方法,其特征在于:所 述原始时间序列的定义公式为公式(1): X = < (t1; X1), (t2, x2). . . , (ti; Xi),. . . (tn, xn) > (0<i<n) (I) 元素Xi= (t u X1)表示时间序列在h时刻所记录的值为xi,同时tptg。3. 据权利要求1所述的基于极值点和转折点的时间序列降维方法,其特征在于,所述 步骤2选取原始时间序列的重要局部极值点,存入序列关键点序列X kp*包括如下步骤: 步骤21、定义关键点关键点序列Xkp,序列游标i,以及时间段长度整数m和n; 步骤22、将原始序列的起点X1W入关键点序列X KP*,并令Xi为第一个局部极值点X front * 步骤23、对于连续的3点序列(Xp1, Xi, xi+1),若点Xi满足以下条件之一,即可判定该点 为序列的极值点: 条件 1 : X H且 X ZxiJ ; 条件 2 : (Xi)XH且 X # X i+1}; 条件 3:{x# xH且 x PxiJ; 条件 4:{x^Xh且 X > X i+1}; 当l〈i〈n时,判断包含点Xi的最短序列(x Xi, xi+1)是否满足上面四种情况之一,若 Xi满足其中之一,则判断该点为局部极值点,同时用m记录X i与前一极值点X ep fMnt间的时 间段长度,执行步骤24;否则,执行步骤3。 步骤24、继续扫描序列获取下一个局部极值点X6pj36hind,同时用n记录X i与后一极值点 X^bdlind间的时间段长度;计算极值点X占相邻的前一个极值点X ^p bdlind以及相邻的下一个 极值点Xep bAind2间的时间段长度之和K (K = n+m),若满足K彡K。,则判断该点为重要极值 点,加入关键点序列Xkp*,将的、值赋值给Xep front,且i = i+1,意为i加上1指向下一个 点,返回执行步骤23;否则执行步骤3。4. 据权利要求1所述的基于极值点和转折点的时间序列降维方法,其特征在于,所述 步骤3选取原始时间序列的重要转折点,存入关键点序列Xkp*,包括如下步骤: 步骤31、当l〈i〈n时,对于不满足步骤3中筛选条件的点xi,计算序列点之间的差值公 式为公式(2): Ai-I,i= |x H-X丄 Ai;i+1= Ix-X i+1|,AH,i+1= Ixh-XwI (2); 步骤32、计算包含该点X1的最短序列(Xi+Xi, xi+1)组成的夹角0余弦值的公式为公 式⑶:步骤33、判断cos 0是否满足cos 0彡cos 0^,若满足,则先将点X1加入到重要转折点 序列Ktp中,再执行i = i+1,意为i加上1指向下一个点,并返回到步骤2中,进行下一个 点的极值判断;否则,直接执行i = i+1,意为i加上1指向下一个点,并返回到步骤2中, 进行下一个点的极值判断;若i = n,将序列的终点xn加入到关键点序列Xkp中。【专利摘要】本专利技术开了,包括如下步骤:步骤1、定义原始时间序列;给定极值点保持时间段阀值K0和序列转折夹角阀值θ0;步骤2、选取原始时间序列的重要局部极值点,存入关键点序列XKP中;步骤3、选取原始时间序列的重要转折点,存入关键点序列XKP中;步骤4、按照时间先后顺序连接关键点序列XKP中的点,得出的序列作为原始时间序列X的降维序列。综上所述,本专利技术提出的基于重要极值点和转折点时间序列降维方法,该方法具有以下两方面的优点:一方面,解决了传统降维方法不能很好地处理短时间内波动频繁的时间序列的问题。另一方面,不仅操作简单,计算复杂度低,大大的减少存储和计算成本,为时间序列后续的挖掘分析带来帮助。【IPC分类】G06F19-00【公开号】CN104820779【申请号】CN201510208571【专利技术人】冷甦鹏, 黄晓琴, 张可, 刘浩 【申请人】电子科技大学【公开日】2015年8月5日【申请日】2015年4月28日本文档来自技高网...

【技术保护点】
一种基于极值点和转折点的时间序列降维方法,其特征在于,包括如下步骤:步骤1、定义原始时间序列;给定极值点保持时间段阀值K0和序列转折夹角阀值θ0;步骤2、选取原始时间序列的重要局部极值点,存入关键点序列XKP中;步骤3、选取原始时间序列的重要转折点,存入关键点序列XKP中;步骤4、按照时间先后顺序连接关键点序列XKP中的点,得出的序列作为原始时间序列X的降维序列。

【技术特征摘要】

【专利技术属性】
技术研发人员:冷甦鹏黄晓琴张可刘浩
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1