异常数据的均衡化处理方法、装置、设备及存储介质制造方法及图纸

技术编号:26343099 阅读:50 留言:0更新日期:2020-11-13 20:41
本申请公开了一种异常数据的均衡化处理方法、装置、设备及存储介质,重复对组成实际环境数据的正常数据和异常数据分别进行随机抽样,将获取的多组随机抽样数据与实际环境数据混合;基于聚类分析构建随机异常数据,将所述随机异常数据及正常数据与实际环境数据混合;基于环境效应生成虚拟数据,将所述虚拟数据与实际环境数据混合。实施时可以将上述三个步骤随机组合开展,极大提高了异常数据的均衡性,能够尽量减少关联性模型的过拟合问题,得出更为准确的分析结果,满足在轨航天器异常数据分析及与空间环境关联性模型构建。

Equalization processing method, device, equipment and storage medium of abnormal data

【技术实现步骤摘要】
异常数据的均衡化处理方法、装置、设备及存储介质
本专利技术一般涉及航天器空间环境效应在轨分析及数据处理
,尤其涉及一种异常数据的均衡化处理方法、装置、设备及存储介质。
技术介绍
航天器在轨会受到空间环境的影响,空间辐射环境会导致航天器产生静电放电、单粒子、总剂量等效应,影响航天器的在轨工作运行。为了对在轨航天器异常的影响进行识别及预警,就需要利用已有的航天器在轨异常数据结合航天器所处的空间环境开展数据分析,目前主要的数据分析手段主要包括:1、通过时标直接对应航天器异常数据前后的空间环境,判别其是否发生异常,此方法较为常用但效果不理想;2、忽略时标的作用,仅对航天器异常的二元化表征和空间环境数据构建关联性,此方法相对具有普适性;3、对个别显著异常事件发生前后的空间环境波动进行详细分析,此方法具有一定的局限性;对于上述分析方法,其分析结果多少都有着一定的局限性和假阳性率,不能很好的揭示实际空间中环境变化与航天器异常之间的潜在联系。究其原因,一方面是由于航天器在轨处于无法就位检查的状态,其异常的判别,来自于数量有限的遥测数据,通常无法准确的定位故障,只能通过故障树梳理逐一排查影响,使得异常判别的准确性无法确保;另一方面是由于航天器在设计阶段也开展了大量环境效应防护设计工作,因此其在轨实际发生异常的数量非常少,与正常工作的数据相比,异常数据属于极不均衡数据集,因此为异常与空间环境的匹配带来了极大困难。
技术实现思路
鉴于现有技术中的上述缺陷或不足,期望提供一种异常数据的均衡化处理方法、装置、设备及存储介质,通过随机抽样聚类分析及环境效应分析提高异常数据的均衡性,减少关联性模型的过拟合问题,得出更为准确的分析结果。为实现上述目的,本专利技术采用了如下技术方案:第一方面,本专利技术提供一种异常数据的均衡化处理方法,其特殊之处在于,包括:重复对组成实际环境数据的正常数据和异常数据分别进行随机抽样,将获取的多组随机抽样数据与实际环境数据混合;基于聚类分析构建随机异常数据,将所述随机异常数据及正常数据与实际环境数据混合;基于环境效应分析生成虚拟数据,将所述虚拟数据与实际环境数据混合。在一个实施例中,对异常数据随机抽样包括有放回随机抽样,对正常数据随机抽样包括无放回随机抽样;其中,所述正常数据的抽取数量为所述异常数据的1.5~10倍,对异常数据抽取比例需达到其总量的80%以上。在一个实施例中,基于聚类分析构建随机异常数据包括:构建实际环境数据与空间环境的初步对应关系,选取n个已明确环境效应机理且具有关联性的空间环境因素;对实际环境数据基于n个已明确环境效应机理的空间环境因素开展聚类,随机生成n个符合正态分布的环境数据集;对任意相邻的两个异常数据并进行差值运算并随机选取以生成随机异常数据。在一个实施例中,基于环境效应生成虚拟数据包括:统计引起异常发生的对应空间环境因素出现的概率;在空间环境因素的指定条件范围内随机抽样得到环境参数;对所述环境参数进行仿真分析,通过预先获取的阈值及敏感度指标进行判别并生成虚拟的异常数据或正常数据。在一个实施例中,阈值及敏感度指标的获取包括:对已明确环境效应机理的空间环境因素仿真分析,获得异常数据的环境效应仿真结果;基于环境效应仿真结果对比异常状态与正常状态空间环境因素的条件范围,聚类获得引起异常发生的阈值及敏感度指标。第二方面,本专利技术提供一种异常数据的均衡化处理装置,其特殊之处在于,包括:随机抽样模块,用于重复对组成实际环境数据的正常数据和异常数据分别进行随机抽样,将获取的多组随机抽样数据与实际环境数据混合;异常数据构建模块,用于基于聚类分析构建随机异常数据,将所述随机异常数据及正常数据与实际环境数据混合;虚拟数据生成模块,用于基于环境效应分析生成虚拟数据,将所述虚拟数据与实际环境数据混合。在一个实施例中,异常数据构建模块包括:空间环境因素选取单元,用于构建实际环境数据与空间环境的初步对应关系,选取n个已明确环境效应机理且具有关联性的空间环境因素;环境数据集生成单元,用于对实际环境数据基于n个已明确环境效应机理的空间环境因素开展聚类,随机生成n个符合正态分布的环境数据集;异常数据获取单元,用于对任意相邻的两个异常数据并进行差值运算并随机选取以生成随机异常数据。在一个实施例中,虚拟数据生成模块包括:概率统计单元,用于统计引起异常发生的对应空间环境因素出现的概率;环境参数获取单元,用于在空间环境因素的指定条件范围内随机抽样得到环境参数;虚拟数据生成单元,用于虚拟数据生成单元,用于对所述环境参数进行仿真分析,通过预先获取的阈值及敏感度指标进行判别并生成虚拟的异常数据或正常数据。在一个实施例中,虚拟数据生成单元包括:仿真分析子单元,用于对已明确环境效应机理的空间环境因素仿真分析,获得异常数据的环境效应仿真结果;阈值及敏感度指标获取子单元,用于基于环境效应仿真结果对比异常状态与正常状态空间环境因素的条件范围,聚类获得引起异常发生的阈值及敏感度指标。第三方面,本专利技术提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特殊之处在于,所述处理器执行所述计算机程序时实现上面所述的方法。第四方面,本专利技术提供一种计算机可读存储介质,其上存储有计算机程序,其特殊之处在于,所述计算机程序被处理器执行时实现上面所述的方法。与现有技术相比,本专利技术的有益效果是:根据本申请实施例提供的技术方案,重复对组成实际环境数据的正常数据和异常数据分别进行随机抽样,将获取的多组随机抽样数据与实际环境数据混合;基于聚类分析构建随机异常数据,将所述随机异常数据及正常数据与实际环境数据混合;基于环境效应生成虚拟数据,将所述虚拟数据与实际环境数据混合。实施时可以将上述三个步骤随机组合开展。随机组合的方式可根据对实际异常数据的权重进行抽样,若实际异常数据权重高,则可对通过随机抽样获得的数据的抽取比例加大,异常数据生成、虚拟数据生成获得的数据抽取比例依次减小,反之,可增加通过虚拟数据生成获得数据的抽取比例,依次减小异常数据生成,随机抽样获得数据的抽取比例。上述过程极大提高了异常数据的均衡性,能够尽量减少关联性模型的过拟合问题,得出更为准确的分析结果,满足在轨航天器异常数据分析及与空间环境关联性模型构建。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本专利技术实施例异常数据的均衡化处理方法的流程示意图;图2为本专利技术实施例基于聚类分析构建随机异常数据的流程示意图;图3为本专利技术实施例基于环境效应生成虚拟数据的流程示意图;图4为本专利技术实施例随机抽样数据获取的示例图;图5为本专利技术实施例基于聚类分析构建随机异常数据的示例本文档来自技高网...

【技术保护点】
1.一种异常数据的均衡化处理方法,其特征在于,包括:/n重复对组成实际环境数据的正常数据和异常数据分别进行随机抽样,对将获取的多组随机抽样数据与实际环境数据混合获取的多组随机抽样数据进行分析并选择其中的共性数据;/n基于聚类分析构建随机异常数据,将所述随机异常数据及正常数据与实际环境数据混合;/n基于环境效应分析生成虚拟数据,将所述虚拟数据与实际环境数据混合。/n

【技术特征摘要】
1.一种异常数据的均衡化处理方法,其特征在于,包括:
重复对组成实际环境数据的正常数据和异常数据分别进行随机抽样,对将获取的多组随机抽样数据与实际环境数据混合获取的多组随机抽样数据进行分析并选择其中的共性数据;
基于聚类分析构建随机异常数据,将所述随机异常数据及正常数据与实际环境数据混合;
基于环境效应分析生成虚拟数据,将所述虚拟数据与实际环境数据混合。


2.根据权利要求1所述的异常数据的均衡化处理方法,其特征在于,对异常数据随机抽样包括有放回随机抽样,对正常数据随机抽样包括无放回随机抽样;
其中,所述正常数据的抽取数量为所述异常数据的1.5~10倍,对异常数据抽取比例需达到其总量的80%以上。


3.根据权利要求1所述的异常数据的均衡化处理方法,其特征在于,基于聚类分析构建随机异常数据包括:
构建实际环境数据与空间环境的初步对应关系,选取n个已明确环境效应机理且具有关联性的空间环境因素;
对实际环境数据基于n个已明确环境效应机理的空间环境因素开展聚类,随机生成n个符合正态分布的环境数据集;
对任意相邻的两个异常数据并进行差值运算并随机选取以生成随机异常数据。


4.根据权利要求1所述的异常数据的均衡化处理方法,其特征在于,基于环境效应生成虚拟数据包括:
统计引起异常发生的对应空间环境因素出现的概率;
在空间环境因素的指定条件范围内随机抽样得到环境参数;
对所述环境参数进行仿真分析,通过预先获取的阈值及敏感度指标进行判别并生成虚拟的异常数据或正常数据。


5.根据权利要求4所述的异常数据的均衡化处理方法,其特征在于,阈值及敏感度指标的获取包括:
对已明确环境效应机理的空间环境因素仿真分析,获得异常数据的环境效应仿真结果;
基于环境效应仿真结果对比异常状态与正常状态空间环境因素的条件范围,聚类获得引起异常发生的阈值及敏感度指标。


6.一种异常数据的均...

【专利技术属性】
技术研发人员:刘业楠聂欣王璐代巍王思展赵春晴王璐沈自才王志浩丁义刚田东波
申请(专利权)人:北京卫星环境工程研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1