System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于改进随机森林的空间有效载荷异常检测方法技术_技高网

一种基于改进随机森林的空间有效载荷异常检测方法技术

技术编号:40665096 阅读:4 留言:0更新日期:2024-03-18 18:59
本发明专利技术公开了一种基于改进随机森林的空间有效载荷异常检测方法,包括样本异常检测和设备异常检测,首先样本异常检测通过改进加权投票随机森林算法,给精度更高的决策树分配更大权重,减少分类效果不好的决策树对结果的影响,开展样本级异常检测;其次,设备异常检测,通过滑窗法将样本层故障预警结果映射到设备级故障预警,同时考虑漏判和误判的费用惩罚函数,对滑窗步长和失效阈值进行优化,缓解检出率和虚警率权衡难题。本发明专利技术通过建立轻量化异常检测模型,有助于空间有效载荷在缺乏地球地面测控资源支持下,自主地对在轨监测数据进行分析,快速识别异常、定位故障,采取故障处理与恢复措施,辅助规划决策,保障航天器安全可靠稳定地运行。

【技术实现步骤摘要】

本专利技术涉及空间有效载荷异常检测,尤其涉及一种基于改进随机森林的空间有效载荷异常检测方法


技术介绍

1、航天器飞行任务复杂度高、运行环境恶劣,对系统可靠性和安全性都有极高的要求。在轨运行期间除了开展领域广泛和系列化的空间科学与应用任务,同时将产生海量监测数据。数据异常与否与有效载荷健康程度和应用任务执行状态密切相关,对监测数据进行科学、有效地在线处理和分析,能够快速定位数据异常,及时反映有效载荷或空间任务的异常事件。复杂化、任务多样化、在轨运行长期化的发展趋势对空间有效载荷在轨自主健康管理的能力提出迫切需求。

2、作为故障预测与健康管理(prognostics and health management,phm)的关键技术,异常检测指的是通过航天设备监测数据的挖掘和分析发现数据中潜在的异常模式,表征航天设备的是否出现异常行为。目前,常见的异常检测方法主要包括模型驱动和数据驱动等两类方法。模型驱动的方法主要通过构造数学模型与实际系统输出之间的残差信号,再与设定的阈值相比较,从而判断是否发生故障。然而,由于产品结构和功能复杂,很难建立精确的数学模型。相较于模型驱动异常检测方法,数据驱动方法特别是基于机器学习、深度学习等人工智能算法,例如支持向量机、决策树、神经网络、迁移学习、随机森林等分类、回归、排序、降维、聚类方法,利用已有的历史数据,通过对正常和故障情况下的监测数据进行训练分析,无需建立定量的数学模型,即可完成异常检测任务,并且克服了依赖专家经验判断偏差较大且已有故障知识库规则缺乏等缺点,是当前研究热点。但是,cnn/lstm/dbn等神经网络模型且计算量大,可解释性差,特别是需要大量的数据作为训练样本,对数据质量要求较高,而航天产品历史数据,特别是故障数据有限,深度学习方法的准确性将受到较大影响,因此本文采用了机器学习方法对接收机故障进行检测。

3、由于遥测数据只含有非常少量的正类(异常)样本和大量的负类(正常)样本,并且可能存在许多不同种类的已知或未知的异常。传统分类算法向多数类倾斜,导致少数类样本检出率不高。此外,为提高少数类样本的检出率,除了常用的重采样和特征处理的数据预处理手段,还可采取集成方法和代价敏感方法的算法改进思路。随机森林(random forest)算法采用集成学习策略,通过组合多个弱分类器分类结果,使得整体模型的结果具有较高的精确度和泛化性能,同时也有很好的稳定性,广泛应用在各种业务场景中。代价敏感方法指为少数类中错分样本给予更高的误分代价,以此减小分类器对多数类的倾斜,但是精准确定代价因子是一个难点。另一方面,传统基于单判据的故障预警会导致高虚警率,过高的虚警率不仅会导致地面运控人员对健康管理系统丧失信息,还可能造成设备的错误隔离重构。因此为了有效的抑制高虚警率,分层递进推理被引入。

4、因此,如何解决空间有效载荷遥测数据中正负样本极不平衡,造成分类检出率不高、虚警率高的问题成为本领域技术人员亟需解决的问题,


技术实现思路

1、本专利技术的目的在于提供一种基于改进随机森林的空间有效载荷异常检测方法,从而解决现有技术中存在的前述问题。

2、为了实现上述目的,本专利技术采用的技术方案如下:

3、一种基于改进随机森林的空间有效载荷异常检测方法,包括以下步骤:

4、样本异常检测:通过改进加权投票随机森林算法,给精度更高的决策树分配更大权重,减少分类效果不好的所述决策树对结果的影响,开展样本级异常检测;

5、设备异常检测:通过滑窗法将样本层故障预警结果映射到设备级故障预警,同时考虑漏判和误判的费用惩罚函数,对滑窗步长和失效阈值进行优化,以能够缓解检出率和虚警率权衡的难题。

6、优选的,所述随机森林算法包括:决策树构造和集成投票;

7、所述决策树构造包括:决策结点、分支和叶节点;

8、其中:

9、所述决策结点表示对待分类样本进行类别判断的特征;

10、所述分支表示所述决策结点的不同取值;

11、所述叶节点则代表最后诊断的类别。

12、优选的,所述样本异常检测时按下式进行:

13、

14、其中,ht(x)为第t颗决策树的输出,i(*)是一个指示函数,函数中参数为真时,函数值等于1,否则等于0,ηt第t棵决策树权重系数。

15、优选的,根据logit模型为所述决策树分配更大的权重,具体按下式进行:

16、

17、其中,pt为准确度,ηt第t棵决策树权重系数。

18、优选的,引入了matthews相关系数(matthews correlation coefficient,mcc)评价指标用于更好地描述分类准确度;具体按下式进行:

19、

20、其中,tp表示真实故障分类为故障的样本数,tn表示真实故障分类为健康的样本数;fp表示表示真实健康分类为故障,fn表示真实健康分类为健康的样本数;

21、将mcc替代pt,同时考虑对mcc取值范围(-1,1)调整,建立权重计算模型为:

22、

23、优选的,所述设备异常检测的具体方法为:

24、对检测异常的样本通过滑窗法将样本时间序列数据划分成多个子序列,对子序列的数据特征进行分析,检测设备是否异常;

25、包括:

26、步骤1、通过基于改进所述随机森林的样本异常检测方法,获得各设备样本二元状态时序数据xi,i=1,2,…,t;当xi=1表示该时刻样本异常,xi=0则样本正常;

27、步骤2、采用步长为sw的滑窗策略逐段进行异常检测,xt-t为从第t-t~t次观测的序列;窗口内异常样本数yt为:

28、

29、其中,在健康设备中,xi可视为伯努利试验序列,那么窗口序列中出现异常样本的概率为:

30、p(xi=1)=pi,i=t-sw+1,...,t,

31、t时刻的脉冲优势比(pulse odds-ratio)可表示为:

32、

33、用于假设健康的对数形式的广义似然比可转换为:

34、

35、将上式对求编导,即可解出:

36、

37、给定设备的训练和/或测试数据集,设备最终健康状态ωi∈{0,1} i=1,…,i作为先验知识,因此训练/测试集可表示为{(g1,ω1),...(gl,ωl)},其中设备i包含m个广义似然比gi={gi1,...,gim};当给定失效阈值ft时,设备i的广义似然比的标签为

38、

39、经上述计算可知,一旦gij超过tf,识别出异常状态,执行故障报警措施,并且确定故障时间。随着滑窗移动,设备健康状态可估计为:

40、

41、优选的,所述设备异常检测还包括:根据代价敏感函数对成本函数参数进行优化;

42、成本函数表示为:...

【技术保护点】

1.一种基于改进随机森林的空间有效载荷异常检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

3.根据权利要求2所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

4.根据权利要求3所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

5.根据权利要求4所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

6.根据权利要求5所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

7.根据权利要求6所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

【技术特征摘要】

1.一种基于改进随机森林的空间有效载荷异常检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

3.根据权利要求2所述的基于改进随机森林的空间有效载荷异常检测方法,其特征在于,

4.根据权利要求3所述的基于改进随机森林的...

【专利技术属性】
技术研发人员:李鹏施建明秦泰春王建星王哲
申请(专利权)人:中国科学院空间应用工程与技术中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1