System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种面向民机时间序列飞行数据标准化表征通用技术制造技术_技高网

一种面向民机时间序列飞行数据标准化表征通用技术制造技术

技术编号:41005772 阅读:5 留言:0更新日期:2024-04-18 21:42
本发明专利技术提供一种面向大数据分析的数据预处理方法,特别涉及一种面向民机时间序列飞行数据标准化表征通用技术,旨在优化飞行数据的表征,为后续的复杂大数据分析提供优质数据基础。针对飞行数据中连续和离散类型变量的不同数据特性,首先依据变量的数据特征进行变量类型的判断,区分离散和连续变量;对离散变量采取离散值编码以消除数据大小和范围的差异,对连续变量进行异常区间检测和处于异常区间之外的异常野值修正,实现变量本身特性和原始数据价值的充分利用。针对飞行数据中变量长度不等长的特点,以飞机高度作为参考变量,综合考虑局部信息与全局信息,采用改进的动态时间规整算法实现将不同长度的时间序列转换为相同长度,从而提高后续数据分析的效果和可靠性。

【技术实现步骤摘要】

本专利技术涉及大数据分析的一种数据预处理方法,特别涉及一种面向民机时间序列飞行数据标准化表征通用技术


技术介绍

1、在当前航空领域,尽管通信技术不断进步,但飞机的正常运行仍依赖于人工操控,尤其在异地操控飞行控制系统时。飞行员在整个飞行控制系统中扮演着关键角色,包括认知、分析、反应和沟通等多个环节。由于飞行员已经承担了繁重的手动操控任务,他们难以始终满足即时安全管理需求,特别是在需要对飞机采取实时措施时。因此,航空安全管理亟需安全预测管理系统,为空中交通管制提供决策支持,减轻飞行员负担,实现高度智能化和自动化的安全管理。在实现这些目标的过程中,依赖于自动智能分析大量航空数据的技术至关重要。数据预处理技术在其中扮演关键角色,为后续的数据分析建模提供了优质的数据基础支撑。

2、然而,飞行数据的分析并非易事。这些数据通常是高维度的,含有不同的采样率,且往往伴随着噪声和不确定性,这对数据处理和分析提出了更高的要求。更加困难的是,这些数据并不自带区分正常与异常的标签,这对基于数据驱动的航空安全分析是一个巨大的挑战。这些特点表明了飞行数据的复杂性和多样性,同时也突显了在分析和处理这些数据时需要综合考虑各种因素,以确保航空安全得到有效管理。

3、从数据特性来看,高维飞行数据可以分为连续变量与离散变量。连续变量表示在一定范围和时间内连续变化的参数,而离散变量则仅包含有限数量的数值元素。由于两类不同性质的变量,采用同样的预处理手段往往会影响本身变量特性,无法充分利用原始数据的价值。此外,高维飞行数据中的各个变量由于采样率不同等因素,各个变量的数据长度可能不相等,进一步增加了数据处理和分析的难度。

4、因此,针对飞行时间序列存在的高维、非等长以及存在连续离散变量的特点,本专利技术提出一种面向民机的时间序列飞行数据标准化表征通用技术,对连续变量和离散变量进行识别和分别处理,并通过改进的动态时间规整获得等长的时间序列,旨在为后续的数据分析提供优质数据基础。


技术实现思路

1、为了确保民机飞行的绝对安全与可靠运行,早期征兆的识别,及时发现处理高概率发生的异常事件具有重要的意义。然而,针对飞行数据高维、非等长以及存在连续离散变量的特点,展开飞行数据标准化表征,为后续数据挖掘提供优质数据,从而从数据角度下提升模型表现性能。

2、本专利技术中以民机时间序列飞行数据预处理为对象,提出一种飞行数据标准化表征的通用框架技术,旨在提供一种用于数据挖掘建模前飞行数据准备阶段的通用流程。该流程可为特定的异常事件(比如非稳定进近事件)预测提供标准化的输入输出:输入为低维等长时间序列,输出为非稳定进近事件标签。原始输入通过基于统计学的自动特征选择策略进行飞行参数的降维,保留异常事件相关的核心参数;同时,针对特定飞行阶段的不等长时间序列的问题,本专利技术提出改进均匀动态时间规整方法,生成最优的匹配对齐矩阵,实现不同长度的时间序列样本间可对比性。本专利技术以飞机高度作为参考变量,综合考虑局部信息与全局信息,采用改进的动态时间规整算法实现将不同长度的时间序列转换为相同长度,从而提高后续数据分析的效果和可靠性。

3、面向民机飞行数据标准化表征的通用框架技术实现的具体步骤如下,如图1所示:

4、s1:民机时间序列飞行数据特点分析;确定飞行数据存在高维、非等长以及存在连续离散变量等问题。

5、s2:连续变量与离散变量预处理;s2包含s201、s202、s203;s201:判断变量类型,s202:离散变量编码、s203:连续变量野值剔除与替换操作、s204:异常野值修正。

6、s3:基于均匀动态时间序列规整方法;综合考虑局部信息与全局信息,以b序列作为模板,采用改进的时间动态规整算法将a序列进行规整,以输出与b序列等长的规整序列a’。

本文档来自技高网...

【技术保护点】

1.一种面向民机时间序列飞行数据标准化表征通用技术,其特征在于,包含以下步骤:

2.根据权利要求1的民机时间序列飞行数据特点分析,其特征在于,对民机飞行数据中变量的时间序列数据进行整体分析,确定其高维度、不同采样率、含噪声与不确定性等特征,并提取影响后续数据处理和分析步骤的高维度、不等长、同时包含离散连续变量的关键特点,基于此选择数据标准化预处理技术。

3.根据权利要求1的连续变量与离散变量预处理方法,其特征在于,根据民机飞行数据中变量的数据特征进行变量类型判定,根据离散变量或连续变量类型进行不同的预处理操作,实现对数据特征的充分利用,具体包括:

4.根据权利要求1的基于改进的均匀动态时间序列规整方法,其特征在于,综合考量局部信息(时间动态序列规整算法)与全局信息(均匀缩放策略),选取飞行高度参数作为参考变量,对其他变量进行动态时间规整,转换为等长的时间序列,并将生成的序列间对齐矩阵拓展到其他变量,完成整个样本的所有参数对齐任务,具体包括:

【技术特征摘要】

1.一种面向民机时间序列飞行数据标准化表征通用技术,其特征在于,包含以下步骤:

2.根据权利要求1的民机时间序列飞行数据特点分析,其特征在于,对民机飞行数据中变量的时间序列数据进行整体分析,确定其高维度、不同采样率、含噪声与不确定性等特征,并提取影响后续数据处理和分析步骤的高维度、不等长、同时包含离散连续变量的关键特点,基于此选择数据标准化预处理技术。

3.根据权利要求1的连续变量与离散变量预处理方法,其特征在于,根...

【专利技术属性】
技术研发人员:于劲松杨洁刘宝鼎卢劲鹏梁思远阎进可唐荻音吕金虎
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1