一种基于时间序列特殊点的卫星遥测数据聚类方法技术

技术编号:15437958 阅读:121 留言:0更新日期:2017-05-26 03:57
本发明专利技术提供了一种基于时间序列特殊点的卫星遥测数据聚类方法。步骤1:对原始时间序列序列集合X=[X

A method of satellite telemetry data clustering based on special points of time series

The invention provides a satellite telemetry data clustering method based on the special points of time series. Step 1: assemble the original time series sequence X = [X

【技术实现步骤摘要】
一种基于时间序列特殊点的卫星遥测数据聚类方法
本专利技术涉及一种基于时间序列特殊点的卫星遥测数据聚类方法,属于时间序列聚类方法

技术介绍
卫星遥测数据是卫星在轨工作期间运营管理人员能够获取的有关卫星工作状态与健康状态的唯一根据。采用数据挖掘和机器学习等方法对卫星遥测数据进行自动化、智能化的分析,对于卫星在轨运营维护和健康管理具有重要的价值,是当前国内外航天领域研究的热点和挑战问题。然而,现有卫星遥测数据的分析大多建立在人工标记的基础上,缺乏自动的智能标记手段难以完成对大量数据的标记。
技术实现思路
本专利技术的目的是为了解决上述现有技术存在的问题,进而提供一种基于时间序列特殊点的卫星遥测数据聚类方法。亦即在卫星遥测数据聚类分析中,减少参与聚类的时间序列数据量;同时提升对卫星遥测数据聚类分析的质量,为后续实际卫星遥测数据分析提供良好的方法基础。本专利技术的目的是通过以下技术方案实现的:一种基于时间序列特殊点的卫星遥测数据聚类方法,步骤如下:步骤1:对原始时间序列序列集合X=[X1,X2,…,Xl],使用Zscore算法预处理;步骤2:使用SPSegmentation分割表示方法,提取每条原始时间序列Xi的所有特殊点,形成特殊点序列SPSi=[xi(tp1),xi(tp2),…,xi(tpk)],来替代原始序列作为聚类输入;步骤3:对任意两条特殊点序列SPSi和SPSj进行对应时间位置补齐处理,且使两SPS中各元素对应次序的特殊点,在原始时间轴上时间位置对齐;步骤4:对已经成对对齐的特殊点序列,进行相似性系数计算。由于已经进行序列对齐,可适用于大多数相似性度量计算,最终得到PSPS_Dist相似性矩阵;步骤5:采用凝聚层次聚类算法,实现时间序列聚类。本专利技术在使用基于特殊点的数据时间序列的表示方法对卫星遥测数据进行特殊点提取的基础上,针对基于卫星遥测数据特殊点序列的聚类问题进行研究,提出一种基于时间序列特殊点的卫星遥测数据聚类方法,通过对特殊点序列进行成对补齐处理,将每一对特殊点序列进行并集处理,并且合并时间轴坐标,进行对应时间坐标的元素补齐。处理为成对等长特殊点序列,解决了不等长序列相似性度度量的局限性。成对补齐后的特殊点序列可以使用多种类型的相似性度量函数进行度量,得到相似性系数矩阵,最后使用层次聚类实现类别划分。本专利技术的方法有效减少了参与聚类的时间序列数据量,提升了聚类质量。附图说明图1为基于时间序列特殊点的卫星遥测数据聚类方法原理图。图2为两SPS序列在时间轴对齐的曲线图。具体实施方式下面将对本专利技术做进一步的详细说明:本实施例在以本专利技术技术方案为前提下进行实施,给出了详细的实施方式,但本专利技术的保护范围不限于下述实施例。本实施例所涉及的一种基于时间序列特殊点的卫星遥测数据聚类方法,如图1所示,可以看出基于时间序列特殊点的卫星遥测数据聚类方法主要通过5个步骤完成:步骤1:对原始时间序列序列集合X=[X1,X2,…,Xl],使用Zscore算法预处理;步骤2:使用SPSegmentation(SpecialPointsSegmentation)分割表示方法,提取每条原始时间序列Xi的所有特殊点,形成特殊点序列SPSi=[xi(tp1),xi(tp2),…,xi(tpk)],来替代原始序列作为聚类输入;步骤3:对任意两条特殊点序列SPSi和SPSj进行对应时间位置补齐处理,且使两SPS中各元素对应次序的特殊点,在原始时间轴上时间位置对齐;步骤4:对已经成对对齐的特殊点序列,进行相似性系数计算。由于已经进行序列对齐,可适用于大多数相似性度量计算,最终得到PSPS_Dist相似性矩阵;步骤5:采用凝聚层次聚类算法,实现时间序列聚类。基于时间序列特殊点的卫星遥测数据聚类方法主要解决的三个关键问题是:成对特殊点序列对齐方法,对齐后的成对特殊点序列(PSPS,PairwiseSpecialPointsSeries)之间的相似性度量以及最后使用层次聚类算法对类别簇的划分。1特殊点序列提取对于给定时间序列X={x(t1),x(t2),…,x(tn)},序列中的特殊点(SpecialPoint,SP)提取算法的伪代码如下。输入:原始序列X,局部极值保持时间a,三点转折阈值c。输出:特殊点序列SPS={x(ts1),x(ts2),…,x(tsv)}SPS提取的控制参数决定了,序列中SP的数量与表示质量。参数选择一般需要先对数据进步初步分析和预判参数选取。本实施例提供一种自适应获取SPS提取参数c的方法。其基本过程如下:(1)计算全序列除去序列起点和序列终点外的其他所有点对应的转折参考系数(2)计算序列z的上下四分位数Q1和Q3,以及四分位距IQR。其中IQR=Q1-Q3(3)根据上四分位数和四分卫极差计算异常截断点作为三角转折点的阈值,即SPS的提取参数c,如式(1)c=Q3+1.5IQR(1)此种方法能够自适应选择转折点控制参数,即SPS的提取控制参数之一c。此参数确定后,用户可以仅通过控制极值点保持参数a控制SPS提取的压缩率和质量。2成对特殊点序列对齐与相似性计算对于对给定原始时间序列集F共包含l条时间序列,且每条时间序列的长度均为n,记为F=[X1,X2,…,Xl],Xi=[xi(t1),xi(t2),…,xi(tn)]。首先对F中的所有待聚类序列X进行特殊点提取,得到各自的特殊点序列。任意两条不同的时间序列Xi和Xj序列,通过特征序列提取,分别得到两序列的SPS,记为式(2)与式(3):SPSi=[xi(tp1),xi(tp2),…,xi(tpk)](2)SPSj=[xj(tq1),xj(tq2),…,xj(tqm)](3)其中,m<n,k<n,tp1=tq1=t1,tpk=tqm=tn,且m与k不一定相等,tpv与tqv不一定相等。两SPS的如图2所示:由图中不难看出,两条不同原始时间序列提取出的SPS不仅存在SP数量不相同,两SPS中各自对元素对应时间轴的位置也可能不相同,此种情况下若直接对SPS序列集合进行聚类,只能选用能处理等长序列的相似性度量函数。并且,由于度量两个SPS序列时其相同次序对应元素在时间轴未对齐,会对相似性度量结果产生坏的影响。因此本文对SPS序列进行成对等长处理,采用对应时间位置补齐的方式,使两SPS时间轴对齐,而后再度量SPSi与SPSj之间相似性。具体实现方法为将两SPS时间下标{p1,p2,…,pk}与{q1,q2,…,qm}取并集,并按照从小到大的顺序重新排序,得到新的合并下标{v1,v2,…,vh},其中max(m,k)≤h≤m+k-2。根据新产生的下标对应原始序列取出新的成对等长特殊点序列(PairwiseSpecialPointsSeries,PSPS),如式(4)、(5)。PSPSij=[xi(tv1),xi(tv2),…,xi(tvh)](4)PSPSji=[xj(tv1),xj(tv2),…,xj(tvh)](5)成对等长处理后,对相似性度量函数约束较少,可使用欧式、相关系数距离、DTW等各种距离度量公式计算两PSPS之间的相似性距离,简写为PSPS_Dist(PairwiseSpecialPointsSeriesDistance)其计算公式如式(6):PSPS本文档来自技高网...
一种基于时间序列特殊点的卫星遥测数据聚类方法

【技术保护点】
一种基于时间序列特殊点的卫星遥测数据聚类方法,其特征在于,步骤1:对原始时间序列序列集合X=[X

【技术特征摘要】
1.一种基于时间序列特殊点的卫星遥测数据聚类方法,其特征在于,步骤1:对原始时间序列序列集合X=[X1,X2,…,Xl],使用Zscore算法预处理;步骤2:使用SPSegmentation分割表示方法,提取每条原始时间序列Xi的所有特殊点,形成特殊点序列SPSi=[xi(tp1),xi(tp2),…,xi(tpk)],来替代原始序列作为聚类输入;步骤3:对任意两条特殊点序列SPSi和SPSj进行对应时间位置补齐处理,且使两SPS中各元素对应次序的特殊点,在原始时间轴上时间位置对齐;步骤4:对已经成对对齐的特殊点序列,进行相似性系数计算,由于已经进行序列对齐,可适用于大多数相似性度量计算,最终得到PSPS_Dist相似性矩阵;步骤5:采用凝聚层次聚类算法,实现时间序列聚类。2.根据权利要求1所述的基于时间序列特殊点的卫星遥测数据聚类方法,其特征在于,特殊点序列提取:对于给定时间序列X={x(t1),x(t2),…,x(tn)},序列中的特殊点提取算法的伪代码如下,输入:原始序列X,局部极值保持时间a,三点转折阈值c输出:特殊点序列SPS={x(ts1),x(ts2),…,x(tsv)}3.根据权利要求2所述的基于时间序列特殊点的卫星遥测数据聚类方法,其特征在于,获取SPS提取参数c的方法,其基本过程如下:(1)计算全序列除去序列起点和序列终点外的其他所有点对应的转折参考系数(2)计算序列z的上下四分位数Q1和Q3,以及四分位距IQR,其中IQR=Q1-Q3(3)根据上四分位数和四分卫极差计算异常截断点作为三角转折点的阈值,即SPS的提取参数c,如式(1)c=Q3+1.5IQR(1)。4.根据权利要求3所述的基于时间序列特殊点的卫星遥测数据聚类方法,其特征在于,成对特殊点序列对齐与相似性计算,对于对给定原始时间序列集F共包含l条时间序列,且每条时间序列的长度均为n,记为F=[X1,X2,…,Xl],Xi=[xi(t1),xi(t2),…,xi(tn)],首先对F中的所有待聚类序列X进行特殊点提取,得到各自的特殊点序列,任意两条不同的时间序列Xi和Xj序列,通过特征序列提取...

【专利技术属性】
技术研发人员:刘大同张玉杰彭宇宋歌彭喜元
申请(专利权)人:哈尔滨工业大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1