一种基于聚类的卫星遥测数据序列异常检测方法技术

技术编号:36043128 阅读:10 留言:0更新日期:2022-12-21 10:50
本发明专利技术公开了一种基于聚类的卫星遥测数据序列异常检测方法,涉及卫星遥测数据分析、人工智能领域。本发明专利技术中,首先,选择没有异常的历史遥测数据作为训练样本,然后,将遥测数据进行分段处理,每一段遥测数据是一个样本。利用基于距离的聚类方法对分段数据样本进行聚类。在此基础上,利用训练数据的训练误差,拟合一元高斯分布。最后,计算被检测遥测数据的到其最近类的距离,利用拟合的高斯分布判断其是否为异常数据。本发明专利技术中,通过对卫星时间序列遥测数据进行基于距离的聚类分析,自动学习正常遥测数据中常见的卫星操作模式。通过对异常操作模式进行检测,发现卫星遥测数据中存在的序列异常。本方法用于在轨卫星序列异常的实时检测。检测。检测。

【技术实现步骤摘要】
一种基于聚类的卫星遥测数据序列异常检测方法


[0001]本专利技术涉及卫星遥测数据分析、人工智能
,尤其涉及一种基于聚类的卫星遥测数据序列异常检测方法。

技术介绍

[0002]卫星系统或其每个子系统具有多种不同的工作模式,并且会随着时间从一种模式变为另一种模式,如光照季模式和地影季模式的相互切换。然而,当异常发生时,卫星系统将在未知的故障模式下工作。异常从数据模式上可划分为点异常和序列异常。相对于单个数据点的异常,序列异常通常是指某个数据序列出现异常,而单取出其中任何一个点无法判定异常。卫星遥测数据中存在典型的序列异常。本专利技术利用基于欧几里得距离的聚类对卫星时间序列遥测数据进行序列异常检测,该方法是一种无监督学习方法。该方法可对按时间窗口划分好的正常序列数据进行聚类学习,然后对新的数据通过距离计算实现序列异常检测。

技术实现思路

[0003]本专利技术的目的在于:为了解决上述问题,而提出的一种基于聚类的卫星遥测数据序列异常检测方法,该方法可有效检测卫星遥测数据中的序列异常。
[0004]为了实现上述目的,本专利技术采用了如下技术方案:
[0005]一种基于聚类的卫星遥测数据序列异常检测方法,包括以下步骤:
[0006]S1:将正常的卫星遥测数据制成包含M个遥测变量的数据表,数据按时间序列排排列;
[0007]S2:对数据进行预处理,包括野值剔除和缺失值补全;
[0008]S3:将M维遥测数据生成N(N=M

T)个重叠的数据序列,T为每个数据序列的长度,即每个数据序列包含T个时刻的遥测数据,形成
Ⅳ×
T
×
M的训练数据{x1,x2…
,x
N
};
[0009]S4:利用基于欧几里得距离的聚类方法,对数据进行聚类学习,输出K个类;
[0010]S5:利用训练数据的训练误差,拟合一元高斯分布N(μ

,σ

),基于聚类预测和高斯分布判断任意序列遥测数据x
t
是否为异常。
[0011]优选地,所述基于欧几里得距离的聚类方法包括:
[0012]随机初始化K个类中心向量γ={γ1,γ2…
,γ
k
};
[0013]对每个训练数据,i=1,

,N,基于欧几里得距离计算其距离每个聚类中心的距离d
i
=||x
i

γ
k
||2,选择其距离最短的聚类中心c(i)作为其所属类c(i)=min
k
||x
i

γ
k
||2;
[0014]重新计算每个类中心向量γ

,等于所有属于该类样本的均值,等于所有属于该类样本的均值
[0015]重复上述计算,直到类中心向量不再更新。
[0016]优选地,所述一元高斯分布包括:
[0017]当完成聚类学习后,计算对每个训练数据x
i
到其所属聚类中心的距离,即训练误
差d
i
=||x
i

γ
k
||2,利用训练误差基于最大似然估计法来估计一元高斯分布N(μ

,σ

);
[0018]对于任意序列遥测数据x
t
,基于欧几里得距离计算其距离每个聚类中心的距离d
t
=||x
t

γ
k
||2,选择其距离最短的聚类中心c(t)作为其所属类,其异常得分为当a(x
t
)>2时,判定序列遥测数据x
t
为异常数据,当a(x
t
)≤2时,判定序列遥测数据x
t
为正常。
[0019]综上所述,由于采用了上述技术方案,本专利技术的有益效果是:
[0020]1、本申请利用一种机器学习方法,对卫星时间序列遥测数据进行基于距离的聚类分析,自动学习正常遥测数据中常见的卫星操作模式。通过对异常操作模式进行检测,发现卫星遥测数据中存在的序列异常。该方法避免了传统卫星故障诊断方法需要对所有要检测参数进行阈值设定的限制。
[0021]2、本申请可有效检测未知故障模式,解决了传统阈值方法无法检测不超限异常的问题,解决了传统故障诊断方法只能检测已知故障模式的问题。
附图说明
[0022]图1示出了根据本专利技术实施例提供的一种基于聚类的卫星遥测数据序列异常检测方法流程图。
具体实施方式
[0023]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0024]请参阅图1,本专利技术提供一种技术方案:
[0025]一种基于聚类的卫星遥测数据序列异常检测方法,包括以下步骤:
[0026]S1:将正常的卫星遥测数据制成包含M个遥测变量的数据表,数据按时间序列排排列;
[0027]S2:对数据进行预处理,包括野值剔除和缺失值补全;
[0028]S3:将M维遥测数据生成N(N=M

T)个重叠的数据序列,T为每个数据序列的长度,即每个数据序列包含T个时刻的遥测数据,形成
Ⅳ×
T
×
M的训练数据{x1,x2…
,x
N
};
[0029]S4:利用基于欧几里得距离的聚类方法,对数据进行聚类学习,输出K个类;
[0030]S5:利用训练数据的训练误差,拟合一元高斯分布N(μ

,σ

),基于聚类预测和高斯分布判断任意序列遥测数据x
t
是否为异常。
[0031]具体的,如图1所示,基于欧几里得距离的聚类方法包括:
[0032]随机初始化K个类中心向量γ={γ1,γ2…
,γ
k
};
[0033]对每个训练数据,i=1,

,N,基于欧几里得距离计算其距离每个聚类中心的距离d
i
=||x
i

γ
k
||2,选择其距离最短的聚类中心c(i)作为其所属类c(i)=min
k
||x
i

γ
k
||2;
[0034]重新计算每个类中心向量γ

,等于所有属于该类样本的均值,等于所有属于该类样本的均值
[0035]重复上述计算,直到类中心向量不再更新。
[0036]具体的,如图1所示,一元高斯分布包括:...

【技术保护点】

【技术特征摘要】
1.一种基于聚类的卫星遥测数据序列异常检测方法,其特征在于,包括以下步骤:S1:将正常的卫星遥测数据制成包含M个遥测变量的数据表,数据按时间序列排列;S2:对数据进行预处理,包括野值剔除和缺失值补全;S3:将M维遥测数据生成N(N=M

T)个重叠的数据序列,T为每个数据序列的长度,即每个数据序列包含T个时刻的遥测数据,形成N
×
T
×
M的训练数据{x1,x2…
,x
N
};S4:利用基于欧几里得距离的聚类方法,对数据进行聚类学习,输出K个类;S5:利用训练数据的训练误差,拟合一元高斯分布N(μ



),基于聚类预测和高斯分布判断任意序列遥测数据x
t
是否为异常。2.根据权利要求1所述的一种基于聚类的卫星遥测数据序列异常检测方法,其特征在于,所述基于欧几里得距离的聚类方法包括:随机初始化K个类中心向量γ={γ1,γ2…

k
};对每个训练数据,i=1,

,N,基于欧几里得距离计算其距离每个聚类中心的距离d
i
=||x
i

γ
k
||2,选择其距离最短的聚类中心c(i)作为其所...

【专利技术属性】
技术研发人员:王亚坤韩笑冬徐楠王超邢川王睿武长青
申请(专利权)人:中国空间技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1